Введение в молекулярную биологию: От клеток к атомам - Энтони Рис, Майкл Стернберг 2002
Нуклеиновые кислоты и гены
Организация генов
Рис. 27.1. Организации генетического материала.
Структурный ген- это наименьший отрезок ДНК или РНК, кодирующий полную аминокислотную последовательность какого-либо белка. В клетке высших организмов может содержаться до 100000 генов (по последним данным их существенно меньше). Однако ДНК в ней столько, что ее хватило бы на образование в 10 раз большего числа генов. До сих пор не вполне ясно, зачем клетке «лишняя» ДНК, хотя результаты последних исследований структуры эукариотической ДНК позволяют сделать кое-какие предположения на этот счет (см. ниже). В вирусах может быть всего лишь 5—6 генов, а геном прокариот составляет примерно 0,1% от генома высших.
ХРОМОСОМА ПРОКАРИОТ содержит примерно 2000— 3000 неперекрывающихся генов, расположенных вдоль ДНК. Структурные гены подразделяются на три основных типа: независимые гены, транскрипционные единицы (транскриптоны) и опероны. Кроме того, в клетке могут находиться более мелкие, автономно реплицирующиеся единицы, называемые плазмидами.
Независимые гены называются так потому, что их транскрипция происходит без участия каких бы то ни было механизмов регуляции транскрипционной активности в отличие от двух других классов генов. При этом говорят, что у такого гена конститутивная форма экспрессии, т. е. экспрессия без регуляции на уровне транскрипции. Всякий структурный ген представляет собой непрерывную последовательность кодонов, следующих вплотную друг за другом, а мРНК, реплицированная с такого гена, всегда моноцистронная (под цистроном понимают нуклеотидную последовательность, кодирующую целиком одну белковую цепь).
Спейсерная ДНК располагается между генами и не всегда транскрибируется. Иногда участок такой ДНК между соседними генами (так называемый спейсер) содержит какую-то информацию, относящуюся к регуляции и инициации транскрипции, но он может представлять собой и просто короткие повторяющиеся последовательности избыточной ДНК, роль которой остается неясной.
Транскрипционные единицы (транскриптоны) представляют собой группу следующих друг за другом генов, транскрибируемых совместно. Обычно это гены белков или нуклеиновых кислот, связанных между собой в функциональном отношении. Например, в Е. coli обнаружены транскрипционные единицы, в которые входят гены различных рРНК (каждый ген — в единственном числе) и ряд генов разных тРНК. На рис. 27.1 изображена одна из таких единиц: в нее входят два гена тРНК и три гена, соответствующие трем разным рРНК. Транскрипционные единицы с тремя и даже четырьмя генами тРНК встречаются довольно часто, при этом в их расположении относительно генов рРНК не наблюдается никакой закономерности. Для этого класса генов молекула мРНК представляет собой транскрипт целой группы генов, поэтому такая мРНК называется полицистронной.
Опероны — это группы следующих подряд структурных генов, находящихся под контролем определенного участка ДНК, называемого оператором. Примером может служить lac-оперон (гл. 28), состоящий из трех структурных генов (Z, Y и А) и регуляторного участка ДНК, который в свою очередь состоит из двух последовательностей — промотора и оператора. Кроме того, еще один ген, ген-регулятор (I), кодирует белок, так называемый репрессор, с помощью которого происходит регуляция транскрипционной активности lac-оперона. Известно несколько метаболитов, необходимых для жизнедеятельности клетки, биосинтез или метаболизм которых контролируется ферментами, кодируемыми генами, которые организованы в оперон (гл. 28). В опероне обычно не бывает спейсеров.
Плазмиды представляют собой небольшие кольцевые молекулы ДНК разной длины. Крупные плазмиды могут содержать до 100 генов. Такие плазмиды часто (хотя и не всегда) несут генетическую информацию, которая позволяет им переходить из одной клетки в другую во время процесса, называемого конъюгацией. В мелких плазмидах число генов может составлять всего около 10, и они неспособны переходить из клетки в клетку при конъюгации. Число генов в плазмиде непостоянно. Обмен генетической информацией с геномом клетки или с другими плазмидами происходит путем переноса определенных участков плазмидной ДНК, способных к перемещению (транспозиции), с одной молекулы ДНК на другую и назышаемых поэтому транспозонами.
Транспозоны - участки ДНК, способные к перемещению с одной молекулы на другую, - часто содержат гены резистентности(нечувствительности) к антибиотикам. Гены, которые оказались в транспозоне, могут переходить от плазмид к хромосомной ДНК и обратно. Таким образом, вследствие переноса плазмид при конъюгации гены резистентности могут быстро распространяться в популяции бактерий.
ВИРУСЫ, ПОРАЖАЮЩИЕ ПРОКАРИОТ, используют в качестве генетического материала как ДНК, так и РНК. РНК в данном случае всегда бывает одно-цепочечной (гл.5). ДНК может быть и двухцепочечной (как в бактериофагах Т2, Т4, Т5 и Т6), и одноцепочечной (как в бактериофаге фХ 174). Одно из существенных различий в организации ДНК между некоторыми вирусами прокариот, с одной стороны, и прокариотическими клетками — с другой, состоит в том, что у этих вирусов в отличие от клеток есть перекрывающиеся гены.
Перекрывание генов наблюдается в том случае, когда одна и та же нуклеотидная последовательность кодирует два или три разных белка. Такие гены были впервые обнаружены в колифаге (т. е. бактериофаге, поражающем Е. coli) фХ174 Сэнгером с сотрудниками в 1977 г. Определив нуклеотидную последовательность фаговой ДНК, они обнаружили, что три гена (обозначаемые буквами К, С и А) занимают одно и то же положение в молекуле ДНК, но соответствующие этим генам последовательности нуклеотидов прочитываются каждая в своей системе отсчета (со своей рамкой считывания). Такое использование ДНК, хотя и дает значительную экономию генетического материала, сильно ограничивает возможность варьирования последовательности, особенно в области кодонов инициации и терминации различных белков. Так, для гена А последним основанием первого изображенного на рисунке кодона обязательно доложен бытьаденин, с которого начинается стартовый кодон гена С, кодирующий fMet. Аналогичным образом первым основанием в третьем кодоне гена С также должен быть аденин, поскольку им оканчивается терминирующий кодон гена А.
КЛЕТКИ ЭУКАРИОТ используют в качестве генетического материала лишь двухцепочечную ДНК. Структурные гены, функционирование которых тесно связано со специфическими последовательностями в молекуле ДНК, называемыми регуляторными участками, подразделяются на независимые гены, повторяющиеся гены и кластеры генов. В кодирующие последовательности этих генов могут вклиниваться некодирующие, называемые интронами. Кроме того, между генами могут находиться участки ДНК с большим числом повторов (сателлитной ДНК) и спейсерной ДНК, транскрибируемой или нетранскрибируемой.
Независимые гены — это гены, транскрипция которых, как и у прокариот, не связана с транскрипцией других генов в рамках транскрипционной единицы. Их активность может, однако, регулироваться экзогенными веществами, например гормонами.
Повторяющиеся гены присутствуют в хромосоме в виде повторов одного гена. Ген рибосомной 5S-PHK повторяется много сотен раз, причем повторы располагаются тандемом, т. е. следуют вплотную друг за другом, без промежутков. Близкие к нему в функциональном отношении гены 5,8S-, 18S- и 28S-pPHK также присутствуют в виде многочисленных повторов, но локализованы в ядрышковой ДНК.
Кластеры генов — это локализованные в определенных участках (локусах) хромосомы группы различных генов с родственными функциями. Кластеры тоже часто присутствуют в хромосоме в виде повторов. Например, кластер гистоновых генов повторяется в геноме человека 10—20 раз, образуя тандемную группу повторов.
Интроны - это участки ДНК, разбивающие экспрессируемую, т. е. кодирующую, часть гена на участки, называемые экзонами. Впервые феномен существования прерывистых генов был открыт при изучении аденовируса и подтвердился в 1977 г. при исследовании гена глобина мыши и рибосомных генов плодовой мушки Drosophila melanogaster. В одном гене может находиться довольно много интронов; например, ген яичного альбумина курицы содержит 8 интронов, общая длина которых превышает сумму всех кодирующих последовательностей в этом гене. В процессе транскрипции РНК-полимераза снимает копию со всего гена. Затем специальные сплайсинг-ферменты осуществляют «монтаж» (сплайсинг) транскрипта, т. е. вырезают интроны и «склеивают» экзоны друг с другом, в результате чего образуется зрелая, но еще немодифицированная мРНК. Чтобы подобный «монтаж» мог осуществиться, на границах интронов с экзонами в ДНК должны быть особые нуклеотидные последовательности. Такая последовательность изображена на рис. 27.2; она встречается в геноме довольно часто и после транскрипции может служить участком узнавания для сплайсинг-ферментов. Далее происходит нормальное созревание и трансляция мРНК (гл. 22).
Рис. 27.2.
Сателлитная ДНК состоит из обладающих характерными особенностями нуклеотидных последовательностей (их длина может составлять от 10 до 200 нуклеотидов), которые расположены тандемно и сотни раз повторяются. Функция этой ДНК пока не выяснена.
ВИРУСЫ. ПОРАЖАЮЩИЕ ЭУКАРИОТ, используют разные формы организации гена; известны и такие вирусы, в которых есть как перекрывающиеся, так и прерывистые гены.
Перекрывающиеся гены обнаружены, например, в вирусе млекопитающих SV40, в ДНК которого имеется участок (с 1488 по 1601 нуклеотидный остаток, считая от точки начала репликации), кодирующий два белка: VP1 и VP2. Таким образом, увеличение емкости генетического материала благодаря использованию нескольких систем отсчета (рамок считывания) при кодировании встречается у вирусов как прокариот, так и эукариот, но в геномах клеток ничего подобного пока не обнаружено. В вирусе SV40 есть также прерывистые гены. Один из генов поздней транскрипции, кодирующий антиген TL (называемый обычно «большим Т»: L = large = большой), расщеплен на два экзона. Длина первого экзона (Т1) составляет 246 пар оснований, второго (Т2) — 1879. Единственный разделяющий их интрон имеет в длину 345 пар оснований и вырезается из транскрипта гена TL при сплайсинге, после чего происходит «склеивание» двух кодирующих последовательностей.