МИКРОБИОЛОГИЯ БИОЛОГИЯ ПРОКАРИОТОВ ТОМ III - А. В. ПИНЕВИЧ - 2009
ГЛАВА 16. ЦИТОГЕНЕТИКА
16.2. Размер генома
На первый взгляд, смысл термина «размер генома» (англ. genome size) очевиден. Однако в действительности требуется пояснение.
Напомним, что геномом (англ. genome; от греч. genos — род и лат. omnis — совокупный; в данном случае — набор наследственных факторов) называется полный комплект генов данного живого существа.
В свою очередь, ген (англ. gene; от греч. genos — род; в данном случае — наследственный фактор) — это функционально определенный участок ДНК, в котором закодирована первичная структура белка, первичная структура рРНК или первичная структура тРНК (см. раздел 16.3.1).
Гены белков, в свою очередь, подразделяются на структурные и регуляторные. Помимо генов в геноме имеются контролирующие генетические элементы, с которыми связываются регуляторные белки.
Ген белка имеет кодирующую область, в которую входят инициирующий кодон, открытая рамка считывания и терминирующий кодон.
Как известно, генетический код считывается (транслируется) по неперекрывающимся триплетам. В силу этого возможны три разные рамки считывания конкретной нуклеотидной последовательности (три варианта трансляции), в которых стартовыми точками соответственно служат 1-й, 2-й и 3-й нуклеотид. Открытая рамка считывания (англ. open reading frame, ORF) — это последовательность триплетов, соответствующая аминокислотной последовательности полипептида; понятно, что внутри нее не должно быть терминирующих кодонов. Средний размер открытой рамки считывания у прокариотов составляет 900 нуклеотидов, что соответствует белку из 300 аминокислотных остатков общей молекулярной массой ~30 кДа.
Для выяснения информационного содержания секвенированной нуклеотидной последовательности ее с помощью компьютерных программ транслируют во всех шести возможных рамках считывания (по три для двух комплементарных цепей). Затем для найденных открытых рамок считывания отыскиваются гомологи в компьютерной базе данных. Это позволяет ответить на вопрос: являются ли эти открытые рамки считывания актуалистическими генами, т. е. гомологичны ли продукты их трансляции ранее известным белкам. В первую очередь учитываются наиболее консервативные аминокислотные последовательности.
В результате такого анализа выяснилось, что бактериальные геномы содержат относительно много «виртуальных» генов, т. е. генов с неизвестными функциями (например, из ~4,3 тыс. открытых рамок считывания Е. coli идентифицирована только половина). Виртуальные гены архей подразделяются на три группы: 25% гомологичны бактериальным генам, 25% эукариотным генам, а 50% уникальны.
Не все гены содержат кодирующие последовательности, которые транслируются в белок. В частности, не разбиты на триплеты гены рРНК и гены тРНК.
Количественное выражение размера генома. Строго говоря, размер генома — это только его информационная емкость, т. е. совокупность кодирующих участков, которая всегда будет несколько меньше размера хромосомы.
Таким образом, выражая размер генома в единицах молекулярной массы ДНК (Да) или в степени ее полимерности (п. н.), мы невольно или сознательно допускаем неточность.
Предел варьирования размера генома в домене Bacteria очень широк: от минимального значения 580 т. п. н. (Mycoplasma genitalium; 470 открытых рамок считывания) до максимально известного значения 9,5 млн. п. н. (Myxococcus xanthus).
В свою очередь, в домене Archaea установленный к настоящему моменту разброс размера генома лежит в пределах от 490 т. п. н. («Nanoarchaeum equitans») до 2,2 млн. п. н. (Archaeoglobus fulgidus; 2,43 тыс. открытых рамок считывания).
Бактериальные геномы минимального размера (600 т. п. н. — 1,2 млн. п. н.) типичны для микоплазм.
Сравнительно небольшие геномы (порядка 2 млн. п. н.) имеются у паразитических бактерий, принадлежащих к разным таксономическим группам, например, Haemophilus spp., Helicobacter spp., Neisseria spp. и Streptococcus spp.
Более крупными геномами (4 -5 млн. п. н.) обладают свободноживущие, а также некоторые симбиотические бактерии, например, Bacillus spp., Escherichia spp., Pseudomonas spp., Rhodobacter spp. и Salmonella spp. В частности, размер генома традиционного модельного объекта — Е. coli составляет 4,6 млн. п. н. (что соответствует молекулярной массе 3-109Да) при контурной длине молекулы ДНК ~1,5 мм.
Наконец, самые большие геномы имеются у бактерий, способных к сложной дифференциации, например, у Anabaena sp. РСС 7120 (6,5 млн. п. н.), Streptomyces spp. (8 млн. п. н.), Bradyrhizobium spp. (8,7 млн. п. н.) и Myxococcus xanthus (9,5 млн. п. н.).
Если расположить приведенные значения в порядке возрастания, то получится геометрическая прогрессия 1-2-4-8, что косвенно указывает на прогрессивную эволюцию геномов путем дупликаций и взаимного слияния.
В пределах крупной таксономической группы размер генома существенно варьирует. Например, у представителей филы ВХ Cyanobacteria он составляет от 2,7 млн. п. н. (Synechococcus sp. РСС 6301) до 6,5 млн. п. н. (Anabaena sp. РСС 7120). В свою очередь, у разных видов филы BXVII Spirochaetes он колеблется в пределах
1-5 млн. п. н.
Близкородственные представители одной и той же таксономической группы, особенно штаммы одного и того же рода, обычно имеют геном одинакового размера — в качестве примера можно назвать цианобактерий Synechococcus sp. РСС 6301 и Synechococcus sp. PCC 7002. С другой стороны, даже у разных штаммов одного и того же вида, например, у Streptomyces ambofaciens, он может варьировать в пределах 6,5-8 млн. п. н., что связано с делениями участков размером до 2 млн. п. н.
Размер генома, если иметь в виду информационную емкость, отражает адаптационный потенциал прокариотного организма и широту его нормы реакции. Существует общая, хотя и не строгая закономерность: чем выше адаптационный потенциал бактерии, тем больше размер ее генома (Synechocystis sp. PCC 6803 — 3,5 млн. п. н., В. subtilis — 4,2 млн. п. н, Е. coli — 4,6 млн. п. н.). В свою очередь, симбиотические бактерии и особенно облигатные эндоцитобионты закономерно имеют геномы малого размера (Mycoplasma pneumoniae — 800 т. п. н., Treponema pallidum — 1,1 млн. п. н., Chlamydia trachomatis — 1,2 млн. п. н.).
Археи по размеру генома (порядка 1,5-2 млн.п.н.) в целом уступают бактериям, что, видимо, связано с их узкой адаптацией к экстремальным условиям существования.
Минимальный размер прокариотного генома. Ранее мы уже отмечали (см. I том учебника), что размер прокариотного генома имеет верхний ограничитель — микроскопический размер клетки, порядка 1 мкм, что позволяет вместить ДНК предельной контурной длины ~1 мм (~3 млн. п. н., или ~3 тыс. генов). В свою очередь, ультрамикробактерии, размер которых порядка 100 мкм, вынужденно обладают геномами малого размера.
Выявление и сравнительный анализ инфраструктуры малых прокариотных геномов дают возможность определить минимальный набор генов, достаточный для существования живой клетки как интегрально реплицирующейся биологической структуры. Как выяснилось, речь идет о наборе из 250-300 генов.
В конце 1990-х гг. русско-американские исследователи Е. В. Кунин (Е. V. Koonin) и А. Р. Мушегян (A. R. Mushegian) высказали предположение, что в минимальный набор входят гены, общие для сильно дивергировавших бактерий, у которых стратегией эволюции генома была множественная потеря структурно-функциональных детерминант в ходе адаптации к паразитическому существованию. В качестве объектов сравнения были взяты Mycoplasma genitalium и Haemophilus influenzae, полностью секвенированные геномы которых кодируют соответственно 468 и 1073 белка. Как выяснилось, оба генома содержат 240 ортологов (см. раздел 16.3.1.1). В свою очередь, среди неортологов были выявлены 22 незаменимых гена (см. раздел 16.1.1). Шесть из них, специфичных для паразитических бактерий, в учет не принимались. Таким образом, минимальный набор генов составил 256 (240 + 16). Важно подчеркнуть, что в число этих генов входят «актуалистические» информационные гены и гены домашнего хозяйства (см. I том учебника), в том числе гены, отвечающие за репликацию, репарацию, транскрипцию, трансляцию, транспорт и генеральный метаболизм, а также гены шаперонов.