Основы молекулярной биологии. Часть 2: Молекулярные генетические механизмы - А.Н. Огурцов 2011
Геномика и протеомика
Сравнительный анализ геномов
Компьютерный поиск подобных белковых последовательностей может обнаружить, что белки принадлежат к одному белковому семейству (а соответствующие гены образуют семейство генов). Считается, что белковые семейства образуются вследствие двух различных эволюционных процессов, дупликации генов и видообразования, которые излагаются в курсе генетики.
Рассмотрим, например, белковое семейство тубулинов - белков, из которых формируются микротрубочки цитоскелета. Согласно упрощенной схеме (рисунок 113) исходно эукариотические клетки имели только один тубулиновый ген, дупликация которого произошла на ранних стадиях эволюции.
Таблица 6 - Повторы (мотивы) в аминокислотных последовательностях белков
Название |
Последовательность* |
Функции |
АТФ/ГТФ связывание |
[A,G]-X4-G-K-[S,T] |
Основания в нуклеотид- связывающем домене, с которыми контактирует нуклеотид |
Сайт связывания пренила |
С-⊘-⊘-Х (С-конец) |
С-концевая последовательность, ковалентно присоединяемая к изопреноидным липидам в некоторых липид-заякореваемых белках (например, Ras) |
Цинковый палец (С2Н2 типа) |
С-Х2-4-C-X3-⊘-X8-H-X3-5-H |
Zn2+-связывающая последовательность в пределах ДНК- или РНК-связывающих доменов некоторых белков |
DEAD-box |
⊘2-D-E-A-D-[R,K,E,N]-⊘ |
Последовательность, которая присутствует во многих АТФ- зависимых РНК-геликазах |
Гептадный повтор |
(⊘-Х2-⊘-Х3)n, |
Повторяющаяся последовательность в белках, имеющих мотив типа скрученная спираль |
*Однобуквенные обозначения аминокислот. X = произвольная аминокислота; ⊘ = гидрофобное основание. В квадратных скобках - возможные варианты |
Последующая дивергенция различных копий исходного гена тубулина сформировала гены-предки нынешних генов а- и ß-тубулина. По мере того, как различные виды дивергировали от этих эукариотических клеток-предков, каждая из этих генных последовательностей также дивергировала, породив, тем самым, слегка отличающиеся формы а- и ß-тубулинов, которые сейчас можно найти в каждом организме.
Все различные члены тубулинового семейства имеют подобные генные последовательности, что свидетельствует о том, что они произошли от общей последовательности-предка. Поэтому все эти последовательности являются гомологичными.
Рисунок 113 - Образование различных тубулиновых генов в ходе эволюции эукариот
Различают два случая.
Паралогичными (paralogous) генами называются гены, образовавшиеся в результате дупликации гена-предка, с последующей дивергенцией, и способные эволюционировать в пределах одного вида.
Паралогичными в случае тубулина являются генные последовательности а- и ß-тубулинов, которые дивергировали в результате дупликации генов.
Ортологичными (orthologous) генами называются гены, определяющие один и тот же признак (белок), т. е. гомологичные гены, происходящие от гена-предка, входящего в геном вида, от которого произошли сравниваемые виды; происхождение ортологичных генов (в отличие от паралогичных генов) не связано с дупликациями.
В случае тубулина ортологичными являются те генные последовательности, которые возникли в результате видообразования - гены а-тубулина у различных видов, или гены ß-тубулина у различных видов.
Оценивая степень подобия тубулинов, имеющихся в настоящее время в различных организмах, можно определить их эволюционное родство (рисунок 114). На рисунке представлена филогенетическая схема (phylogenetic tree) или кладограмма (cladogram) представляющая взаимоотношения и родство между генными последовательностями тубулина.
Рисунок 114 - Филогенетическая схема (кладограмма), показывающая родство между тубулиновыми генными последовательностями
Филогенетической схемой называется схема предполагаемых генеалогических (эволюционных) связей особей, популяций или таксонов различного уровня в разрезе исторического времени; точки "ветвлений" на схеме соответствуют гипотетическим моментам образования новых форм (дивергенции).
Из трёх типов генетического родства: гомологии, ортологии и паралогии - ортологические последовательности наиболее вероятно кодируют одни и те же функции у белков.