Биохимия и молекулярная биология - Белясова Н.А. 2002
Молекулярные основы и механизмы наследственности
Организация генетического аппарата клетки
Генетический код
Первые представления о том, каким образом в генах закодирована наследственная информация, изложил Ф. Крик в своей «гипотезе последовательности», согласно которой последовательность аминокислот в полипептидной цепи определяется последовательностью элементов в гене. Экспериментальные подтверждения данная гипотеза получила уже после расшифровки генетического кода в экспериментах Ч. Яновского. Чарльз Яновский в 1964 г. показал совпадение относительного положения индуцированных мутаций в гене trpA E.coli и аминокислотных замен в кодируемом этим геном ферменте — триптофан-синтетазе. Таким образом, была доказана колинеарность структуры гена и кодируемого им полипептида.
Тем не менее молекулярные основы этой колинеарности были вовсе не очевидны, поскольку все разнообразие аминокислот в полипептидах описывается значением 20, а разнообразие нуклеотидов в ДНК — значением 4. Таким образом, один нуклеотид никак не может кодировать одну аминокислоту в пептиде.
Эксперименты Ф. Крика и его соавторов по исследованию мутаций у бактериофага Т4 кишечной палочки позволили прийти к заключению, что каждая аминокислота кодируется тремя нуклеотидами, т. е. генетический код триплетный. Этот вывод следовал из наблюдения, что мутации, сопровождающиеся вставками или выпадениями (делециями) одного либо двух нуклеотидов из генома Т4, приводили к образованию аномальных белков с нарушенной функцией. Наоборот, вставки или делеции трех нуклеотидов сопровождались часто незначительными изменениями в составе белков, в результате чего последние сохраняли активность. Крик и Бреннер заключили, что генетический код считывается дискретными единицами по 3 нуклеотида. В таком случае вставка (делеция) триплета нуклеотидов должна приводить к добавлению (изъятию) всего одной аминокислоты из состава соответствующего полипептида. В ситуации, когда вставка (делеция) нуклеотидов совершается в количестве, не кратном трем, должен происходить сдвиг «рамки считывания» и последовательность аминокислот в белке должна полностью меняться.
Таким образом, генетический код — триплетный, т. е. положение каждой аминокислоты в полипептиде задается последовательностью из трех нуклеотидов, которая носит название кодон. Поскольку число разных нуклеотидов в ДНК равно четырем, то количество возможных вариантов триплетов нуклеотидов будет описываться количеством: 4 ґ 4 ґ 4 = 64. 61 из 64 триплетов кодируют аминокислоты, причем каждый триплет — только одну аминокислоту, а три оставшихся кодона служат сигналами окончания (терминации) трансляции (рис. 1.7). Эти кодоны называют стоп (stop)-кодонами или нонсенс-кодонами, поскольку они не определяют никакой аминокислоты. Помимо этого, два кодирующих триплета (чаще ATG — для Met, иногда GTG — для Val) выполняют двойную функцию: кодируют аминокислоты метионин или валин и служат стартовыми кодонами, на которых начинается процесс трансляции (рис. 1.7).
Рис. 1.7. Структура генетического кода. Подчеркнуты кодоны, выполняющие функции стартовых при трансляции. Выделены стоп-кодоны, терминирующие процесс трансляции Особенностью генетического кода является то, что в нем отсутствуют запятые, т. е. нет знаков, отделяющих один кодон от другого. При этом генетический код не перекрывается в пределах одной рамки считывания, а рамка считывания задается первым «читаемым» нуклеотидом (рис. 1.8). Максимальное количество рамок считывания в гене — 3, столько же, сколько и «букв» в коде.
Для большинства клеточных организмов характерна реализация лишь одной рамки считывания, в то время как у некоторых вирусов их может быть две или даже три.
Направление чтения закодированной записи осуществляется от 5'-конца к 3'-концу мРНК, являющейся транскриптом «+»-цепи ДНК, считанным с нее в направлении 5' →3'. Первый с 5'-конца кодон отвечает N-концевой аминокислоте полипептидной цепи. Следовательно, белки синтезируются от N-конца к С-концу (рис. 1.8).
Еще одним свойством генетического кода является его вырожденность. Это означает, что одна аминокислота может кодироваться более чем одним триплетом нуклеотидов. С другой стороны, код не является двусмысленным: каждый кодон кодирует только одну аминокислоту. Такая закономерность выражается в том, что если известна последовательность нуклеотидов в ДНК, то с ее помощью легко узнать последовательность аминокислот в белке; наоборот, известную последовательность аминокислот нельзя однозначно перевести в нуклеотидную последовательность ДНК. Вырожденность генетического кода, как правило, приводит к тому, что у кодонов, определяющих одну и ту же аминокислоту, реально распознаются только первые два нуклеотида, а третий может не иметь значения.
Рис. 1.8. Рамки считывания генетического кода. Цифрой «1» обозначены первые нуклеотиды, задающие каждую из трех возможных рамок считывания. Полипептид строится от N-конца (свободная аминогруппа) к С-концу (свободная карбоксильная группа). Сдвиг рамки считывания приводит к изменению последовательности аминокислот в пептидной молекуле
Для объяснения этого феномена Крик предложил гипотезу «качания» (от англ. wobble), которая впоследствии подтвердилась, и в настоящее время называется правилом неоднозначного соответствия. Согласно этому правилу, соответствие третьего нуклеотида в кодоне мРНК первому нуклеотиду в антикодоне тРНК является нестрогим, поскольку часто первое положение в антикодоне тРНК занимает минорный нуклеотид, содержащий в качестве азотистого основания инозин. Инозин может образовывать водородные связи с урацилом, цитозином или аденином, находящимися в кодоне в третьем положении. Существование такого механизма позволяет клетке иметь меньше 61 разной тРНК, поскольку многие тРНК способны узнавать до трех кодонов.
Генетический код универсален. Это свойство кода состоит в том, что любая молекула мРНК при трансляции в клетке любого организма приведет к синтезу полипептида с одинаковой последовательностью аминокислот. Данное правило, однако, имеет исключения, которые касаются генетического кода ДНК митохондрий. Большей частью и здесь используется основной «генетический словарь», но, например, в митохондриях млекопитающих кодон UGA в мРНК «читается» как триптофан, и в пептид в соответствующее положение включается триптофан, в то время как в ядерной мРНК данный кодон служит стоп-кодоном (рис. 1.7) и на нем заканчивается процесс трансляции. Наоборот, в митохондриях млекопитающих триплеты нуклеотидов AGA и AGG прочитываются как сигналы терминации, а в ядре они кодируют аминокислоту аргинин. В митохондриях других организмов могут встречаться иные отклонения от универсального для ядерной ДНК генетического кода.
Структура триплетов нуклеотидов коррелирует с химическими свойствами кодируемых ими аминокислот. Так, все кодоны с уридилатом во втором положении кодируют аминокислоты с гидрофобной боковой цепью: фенилаланин, лейцин, изолейцин, валин, метионин. Если исключить терминирующие кодоны, то наличие аденилата во втором положении определяет полярную или заряженную боковую цепь (тирозин, гистидин, глютамин, аспарагин, лизин, глютаминовая и аспарагиновая кислоты/ К тому же кодоны для большинства гидрофобных аминокислот различаются только одним нуклеотидом (рис. 1.7). Аналогичная ситуация наблюдается и для кодонов серина и треонина (их боковые группы содержат гидроксил) или аланина и глицина (имеют наименее сложно устроенные боковые группы). Таким образом, генетический код устроен так, что при замене нуклеотидов даже в первой или второй позиции некоторых кодонов в полипептид включается структурно родственная аминокислота, сводя тем самым к минимуму нарушения во вторичной структуре белка.
Расшифровка генетического кода осуществлена Ниренбергом и Кораной в начале 60-х годов прошлого столетия. В ходе первых экспериментов в бесклеточную систему для синтеза белка, содержащую все необходимые компоненты, в качестве мРНК вносили искусственно синтезированные гомополинуклеотиды: полиуридилат, полицитидилат и др. Синтезированные в таких условиях полипептиды подвергали аминокислотному анализу и установили, что на мРНК, представляющей собой poly(U) (т. е. UUUUUU...), синтезируется полифенилаланин, на poly(C) — полипролин и т. д. Таким образом, можно было заключить, что триплет нуклеотидов UUU кодирует аминокислоту фенилаланин, а ССС — пролин. Окончательную расшифровку всех 64 кодонов удалось осуществить с использованием в бесклеточных системах трансляции синтетических полирибонуклеотидов с известными повторяющимися последовательностями. Эти регулярные сополимеры удалось получить благодаря комбинированию методов органического и ферментативного синтеза.