Основы биоинформатики - Огурцов А.Н. 2013

Основания биоинформатики
Геномы и протеомы
Картографирование генома

До появления технологии анализа геномов генетический базис знаний об организме обычно включал в себя хромосомные карты сравнительно низкого разрешения и физические карты генов, производящих известные мутантные фенотипы. Начиная с карт сцепления генетических признаков, составление молекулярных карт целого генома в общем случае проходит через несколько этапов последовательного увеличения разрешения (рисунок 40).

Генетическая карта - это изображение относительных расстояний между генами, оцениваемых на основании измеренных частот рекомбинации этих генов.

Рисунок 40 - Иерархия картографирования полного генома: а - цитогенетическая карта; б - генетическая карта высокого разрешения; в - физическая карта генов; г - ДНК-последовательность нуклеотидов

Составление генетических карт - это процесс установления принадлежности генов к определённым хромосомам и приписывания им генетических расстояний относительно других (уже известных) генов. Генетические карты геномов строят по данным генетических скрещиваний или, в случае человека, анализа родословной. Генетические скрещивания позволяют установить местоположения генетических маркеров на хромосомах и определить генетическое расстояние между ними. Генетический маркер - это участок ДНК с известной локализацией. Им может служить аллель с известной локализацией, определяющая какой-либо признак; отличительный морфологический признак какой-либо хромосомы, например, перетяжка (морфологический маркер); полиморфные фрагменты ДНК (молекулярные маркеры). Генетические маркеры служат опорными точками для картирования генов. Раньше в качестве маркеров для экспериментов при составлении генетических карт использовали гены.

Теперь для построения генетических карт применяют генетические маркеры другого типа - ДНК-маркеры. Последние представляют собой генетические маркеры, обнаруживаемые с помощью молекулярных инструментов, оперирующих с самой ДНК, а не с продуктом гена или производным фенотипом. При составлении карты генома человека используются ДНК-маркеры четырёх основных типов:

1) RFLP - полиморфизм длины рестрикта (Restriction Fragment Length Polymorphism);

2) VNTR - переменное число тандемных повторений (Variable Number of Tandem Repeat), называемое также миниспутником (minisatellite);

3) STR - короткое тандемное повторение (Short Tandem Repeat), называемое также микроспутником (microsatellite);

4) SNP - полиморфизм отдельного нуклеотида (Single Nucleotide Polymorphism). С помощью микроматриц ДНК (см. п. 11.4) может быть выполнена одновременная печать сотен SNP.

Локусы с варьирующим числом тандемных повторов (VNTRs), (минисателлиты). VNTRs содержат участки длиной 10-100 bp, повторённые различное число раз. У разных индивидуумов VNTRs, построенные на одном и том же мотиве, могут содержать различное число повторов. Различия в длине этих фрагментов могут использоваться в качестве генетических маркеров. Наследование VNTRs, можно проследить и привязать к какому-либо фенотипу. VNTRs первыми из генетических данных были использованы для идентификации личности в криминалистике, а также в судебных разбирательствах по вопросам отцовства. Данный метод получил название фингерпринт (fingerprint, генетические отпечатки пальцев). Ранее VNTRs исследовались на основе полиморфизма длины рестрикционных фрагментов (RFLPs).

VNTRs почти всегда содержат несколько сайтов рестрикции для одной и той же рестриктазы, по которым их можно аккуратно нарезать. Результаты можно разделить на геле и провести Саузерн-блоттинг (см. [7], п. 11.4).

Следует иметь ввиду, что VNTRs (Variable Number of Tandem Repeat) - это характеристики генома, a RFLPs (Restriction Fragment Length Polymorphism) - это искусственная смесь рестрикционных фрагментов, полученная в лаборатории для идентификации VNTRs.

Сейчас для измерения длины VNTRs все чаще используется ПЦР (полимеразная цепная реакция), данный метод почти полностью заменил использование рестриктаз в этой области.

Полиморфизм коротких тандемных повторов (STR) (микросателлиты) - это участки из 2-5 bp, повторённых большое число раз (10-30). Существует много преимуществ использования STRs, одно из которых - достаточно равномерное их распределение по геному.

Обычно микросателлиты лежат вне экспрессирующихся генов (исключением являются сад повторы в генах болезни Хантингтона (см. п. 6.6) и некоторых других заболеваний).

Набор микросателлитных маркеров значительно упрощает идентификацию генов.

Различные дополнительные техники картирования более точно работают с ДНК, что позволяет сократить процесс идентификации генов.

Контиг, или непрерывная карта клонов - это серия перекрывающихся ДНК-клонов хромосомы в известной последовательности (см. п. 2.3), хранящиеся в клетках в составе YACs (Yeast Artificial Chromosomes) или BACs (Bacterial Artificial Chromosomes). Такая карта является весьма хорошим отображением генома.

В YACs человеческая ДНК интегрирована в маленькие дополнительные хромосомы дрожжевых клеток. Такая хромосома может содержать до 106 bp, и весь человеческий геном можно уместить в 10 000 YACs.

В бактериальных искусственных хромосомах (ВАС) ДНК вставлена в плазмиду Е. coli. Плазмида - это отдельная маленькая кольцевая двухнитевая ДНК, являющаяся дополнением к основному геному. Бактериальная искусственная хромосома может нести до 250 000 bp.

Несмотря на то, что это меньше, чем у YAC, BACs более предпочтительны; так как они стабильнее, и с ними проще работать.

Ярлык, определённый последовательностью (sequence tagged site. STS) - это короткий, секвенированный участок ДНК, обычно 200-600 bp в длину, локализованный в строго определённой области генома. Он не обязан быть полиморфным. STS может быть нанесён на карту генома с помощью ПЦР и клеток, содержащих непрерывную карту клонов.

Один из типов STS возникает из ярлыков экспрессируемых последовательностей (EST), коротких фрагментов кДНК (см. пп. 1.1 и 11.3).

кДНК - комплементарная ДНК - это последовательность, полученная из мРНК экспрессируемого гена с помощью фермента обратная транскриптаза (см. [7], п. 9.4).

Последовательности EST содержат только экзоны, сплайсированные вместе в последовательность, кодирующую белок. кДНК может быть картирована на хромосому с помощью метода FISH (Fluorescence ln Situ Hybridization) или локализованы в карте контигов.

Если исследуется организм, для которого не известна полная последовательность генома, но для которого есть полная карта контигов для всех хромосом, то можно идентифицировать STS-маркеры, плотно сцепленные с интересующим геном, после чего локализовать эти маркеры на карте контигов.





Для любых предложений по сайту: [email protected]