Биохимия человека Том 2 - Марри Р. 1993
Структура, функция и репликация информационных макромолекул
Организация и репликация ДНК
Генетическая организация генома млекопитающих
Гаплоидный геном каждой клетки человека представлен 3,5∙109 парами оснований и состоит из 23 пар хромосом. Этого достаточно для кодирования около 1,5 миллионов пар генов. Однако данные по изучению генома человека и частоты возникновения мутаций свидетельствуют о том, что в организме Homo sapiens имеется не больше 100000 белков. Это означает, что большая часть геномной ДНК — некодирующая, т.е. заложенная в ней информация никогда не транслируется в аминокислотную последовательность белковых молекул. Некоторая часть нетранслируемых последовательностей ДНК регулирует экспрессию генов в ходе развития, дифференцировки и адаптации. Определенная часть избыточной ДНК входит в состав интронов — некодирующих участков, разделяющих кодирующие области генов. И все же большая часть избыточной ДНК, судя по всему, представлена многочисленными семействами повторяющихся последовательностей, значение которых до сих пор неизвестно.
Рис. 38.6. Две сестринские хроматиды 12-й хромосомы человека (х 27850). (Reproduced, with permission, from Du Praw E. J. DNA and Chromosomes. Holt, Rinehart and Winston, 1970.)
Рис. 38.7. Кариотип человека (мужчины с нормальным набором хромосом 46XY). Хромосомы окрашены по Гимза и расположены в соответствии с Парижской номенклатурой. (Courtesy of Н. Lawce and F. Conte.)
ДНК эукариотического генома можно разделить на два «класса последовательностей». Это уникальные, или неповторяющиеся, последовательности и повторяющиеся последовательности ДНК (повторы). К первому классу последовательностей ДНК относятся однокопийные гены, кодирующие белки. Класс повторяющихся последовательностей ДНК представлен повторами с копийностью от 2 до 107 на клетку.
Уникальные, или неповторяющиеся, последовательности ДНК
Более половины геномной ДНК эукариотических организмов принадлежит к классу уникальных, или неповторяющихся, последовательностей. Это утверждение (а также оценки, касающиеся распределения в геноме повторяющихся последовательностей ДНК) базируется на данных непрямых экспериментов с применением различных методик ДНК- РНК-гибридизации, позволяющих получить лишь приблизительную оценку. У дрожжей — низших эукариот — экспрессируется около 4000 генов. В типичной ткани млекопитающих (печень или почки) экспрессируется от 10000 до 15000 генов. При этом в каждой ткани происходит экспрессия специфического набора генов. Каким образом это достигается, по-прежнему остается одним из центральных вопросов современной биологии.
Нитроны
Кодирующие области ДНК, транскрипты которых попадают в цитоплазму в составе «зрелых» молекул мРНК, прерываются в геноме длинными последовательностями некодирующей ДНК. Соответственно первичные транскрипты ДНК (гяРНК) содержат некодирующие промежуточные последовательности РНК, которые должны быть удалены в процессе созревания, обеспечивающего также и правильную стыковку (сплайсинг) кодирующих сегментов в зрелых мРНК. Большинство последовательностей, транскрипты которых представлены в зрелой мРНК, разорваны в геноме от одного до пятидесяти раз некодирующими вставками (нитронами). Как правило, интроны значительно длиннее, чем кодирующие участки (экзоны). Процессинг первичного транскрипта, включающий удаление интронов и сплайсинг соответствующих экзонов, описан в гл. 39.
Функция интронов точно не установлена. Можно предположить, что они служат для физического разделения экзонов, соответствующих функциональным доменам кодируемых белков, с целью оптимизации процесса генетических перестроек (рекомбинаций), которые могут происходить с более высокой эффективностью при наличии интронов, чем в случае сосредоточения генетической информации в одном континууме. Увеличение темпа генетических перестроек функциональных доменов может рассматриваться как фактор ускорения эволюции биологических функций.
Повторяющиеся последовательности ДНК
Под повторяющимися последовательностями ДНК (повторами) понимается широкий спектр как умеренно повторяющихся, так и часто повторяющихся (высокоповторяющихся) последовательностей ДНК. По крайней мере 20—30% генома человека представлено повторами.
Высокоповторяющиеся последовательности состоят из участков длиной в 5—500 пар оснований, повторяющихся много раз и расположенных один за другим (тандемно). Эти последовательности обычно образуют кластеры и присутствуют в количестве от 1 до 10 миллионов копий на гаплоидный геном. Высокоповторяющиеся последовательности транскрипционно-неактивны и, вероятно, участвуют в структурировании хроматина.
Умеренно повторяющиеся последовательности, присутствующие в количестве менее чем 106 копий на гаплоидный геном, не образуют кластеров, а чередуются с неповторяющимися (уникальными) последовательностями. Они могут быть как короткими, так и весьма протяженными. Длинные диспергированные повторы состоят из 5000—7000 пар оснований и представлены в количестве 1000—100000 копий на гаплоидный геном. Они фланкированы с обоих концов прямыми повторами длиной в 300—600 пар оснований (рис. 38.8). Во многих случаях длинные повторы транскрибируются РНК-полимеразой II в виде молекул мРНК, содержащих такие же кэпированные 5'-концы, как и мРНК.
Короткие диспергированные повторы представляют семейства родственных, но отличных друг от друга фрагментов длиной от единиц (нескольких пар) до нескольких сотен пар нуклеотидов. Короткие повторы активно транскрибируются либо как компоненты интронов, либо под контролем ДНК- зависимой РНК-полимеразы III как самостоятельные элементы (см. гл. 39). Наиболее многочисленным семейством коротких диспергированных повторов в геноме человека является семейство Alu, насчитывающее около 500000 копий на гаплоидный геном, что составляет 3—6% от общего размера генома человека. Повторы этого семейства (а также их аналоги у животных) транскрибируются и в составе гяРНК, и в виде дискретных молекул РНК, включая хорошо изученные 4,5S-PHK и 7S-PHK. Такого типа последовательности высококонсервативны как внутри данного вида, так и у разных видов млекопитающих. По своей структуре короткие диспергированные повторы, в том числе члены семейства Alu, напоминают длинные концевые повторы ретровирусов (LTR). По-видимому, это мобильные элементы, способные как встраиваться, так и вырезаться из различных участков генома (см. ниже).
Рис. 38.8. Схема длинного диспергированного повтора. Отмечено расположение на концах повтора коротких прямых повторов (abc) и соответствующих комплементарных участков (а'b'с').