Молекулярная биотехнология. Принципы и применение - Глик Б., Пастернак Дж. 2002

Молекулярная биотехнология микробиологических систем
Молекулярная генетика человека
Физическое картирование генома человека

Генетические и РГ-карты указывают линейное расположение маркерных сайтов. Расстояния между сайтами измеряются в условных единицах, которые отражают частоту рекомбинации (сМ) или вероятность сохранения двух сайтов в одном радиационном гибриде (cP). Эти единицы можно перевести (в некотором приближении) в единицы реальных физических расстояний — пары нуклеотидов, которые используются в физических картах. Физическая карта целой хромосомы или ее области дает непосредственное представление о расположении генов в ДНК, что облегчает их идентификацию и характеристику и систематическое секвенирование хромосомной ДНК.

Для построения физической карты необходимо прежде всего выделить из библиотеки геномной ДНК клоны, содержащие перекрывающиеся сегменты. Исходя из данных о перекрывающихся участках и другой информации о положении клонов, можно реконструировать непрерывный ряд клонированных сегментов какого-то района хромосомы, целой хромосомы ил и всего генома. Были получены упорядоченные наборы смежных (contiguous) клонов (контиги) на основе YAC-(yeast artifltial chromosome, искусственная хромосома дрожжей), BAC-(bacterial artifitial chromosome, искусственная хромосома бактерий), PAC-(bacterio- phage PI artifitial chromosome, искусственная хромосома бактериофага Р1) и космидных библиотек ДНК человека. Отметим, что стратегия построения контигов из крупных фрагментов ДНК человека, содержащихся в YAC-, ВАС- или РАС-библиотеках, немного отличается от таковой для Р1- или космидных контигов.

Построение контигов из YAC-, ВАС- и РАС-библиотек

При построении физических карі тех или иных районов хромосом или целых хромосом из геномных библиотек, содержащих крупные вставки (YAC-, ВАС- или РАС-библиотек), наиболее приемлем метод картирования, основанный на использовании STS. STS — это короткий однокопийный участок ДНК (примерно 100—300 п. н.), который можно выявить при помощи ПЦР с использованием уникального набора праймеров. Для получения протяженного контига, охватывающего значительный участок хромосомы, требуется большое число STS, находящихся на расстоянии 50-100 т. п. н. друг от друга. Например, для физического картирования хромосомы длиной примерно 200 миллионов пар нуклеотидов (м. п. н.) необходимо от 1500 до 3000 STS. Для построения же достаточно точной физической карты всего генома человека их нужно по меньшей мере 30 000.

Для создания STS были разработаны различные подходы. В одном из них ДНК из очищенного препарата одной хромосомы человека, изолированной при помощи проточной цитофотометрии, обрабатывают рестрикгазой и клонируют в векторе, способном акцептировать небольшие (<1000 п. н.) фрагменты ДНК. Затем секвенируют вставки из клонов, выбранных случайным образом, и отбрасывают те клоны, в которых вставки короче 100 п. н., и те, которые содержат последовательности из повторяющихся элементов ДНК человека. Наличие повторов определяют при помощи компьютерных программ, сравнивая нуклеотидную последовательность вставки с последовательностями всех известных повторов ДНК человека. Затем для каждого отобранного клона находят нуклеотидные последовательности праймеров. Каждый STS тестируют на предмет уникальности амплифицируемого фрагмента хромосомной ДНК.

С помощью ПЦР-скрининга выявляют STS в индивидуальных клонах библиотеки с крупными вставками, а затем, основываясь на распределении STS в клонах, численными методами находят вероятный набор перекрывающихся клонов и относительное положение имеющихся STS (рис. 20.18). С разработкой метода РГ-картирования появилась возможность без особого труда упорядочить STS, что облегчает идентификацию составляющих контига (рис. 20.19). Выявив перекрывающиеся клоны, определяют степень их перекрывания, размер контига и общую длину охватываемой им ДНК, с помощью эндонуклеазного картирования с использованием электрофоретической системы, разделяющей фрагменты ДНК длиннее 105 п. н. (например, импульсный электрофорез). Уже получены контиги хромосомных районов, охватывающие от 1 до более чем 20 м. п. н., а в ряде случаев — и целые хромосомы. В конце концов будут получены контиги из крупных фрагментов ДНК, перекрывающие весь геном.

Построение контигов из космидных, Р1- и λ-библиотек

Более удобными для генетических исследований и широкомасштабного секвенирования часто оказываются контиги из небольших фрагментов ДНК, чем из крупных. Для построения контигов определенных районов хромосом или целых хромосом нередко используют космидные библиотеки. Обычно перекрывающиеся космидные клоны идентифицируют методом геномной дактилоскопии. Для этого из каждого клона экстрагируют ДН К и обрабатывают ее рестриктазой. Полученные фрагменты метят, разделяют при помощи электрофореза и визуализируют радиоавтографическими методами. Каждый клон порождает специфический набор фрагментов — уникальный отпечаток его ДНК; у перекрывающихся клонов один или несколько фрагментов совпадают.

Для концевого мечения ДНК-фрагментов — независимо от характера образующихся после эндонуклеазной обработки концов (5'-, 3'-выступающих или тупых) — можно использовать реакцию замещения, катализируемого ДНК-полимеразой Т4. В этом случае к препарату космидной ДНК, обработанной рестриктазой, добавляют ДНК-полимеразу и один меченый дезоксинуклеотид (рис. 20.20). Под действием 3'-экзонуклеазной активности ДНК-полимеразы происходит последовательное отщепление 3'-концевых нуклеотидов. Процесс продолжается до тех пор, пока в противопложной цепи не экспонируется нуклеотид, комплементарный меченому дезоксинуклеотиду, добавленному в реакционную смесь. Далее включается полимеразная активность ДНК-полимеразы, и к 3'-концу присоединяется свободный меченый нуклеотид. Поскольку другие нуклеотиды в реакционной смеси отсутствуют, дальнейшего роста цепи не происходит. Для мечения эндонуклеазных фрагментов существуют и другие способы. Усеченный 3'-конец фрагмента можно удлинить (достроить) при помощи фрагмента Кленова, использующего выступающий 5'-конец в качестве матрицы; достраивание осуществляется за счет добавленных в реакционную смесь дезоксирибонуклеотидов, один из которых несет метку. Кроме того, к выступающим концам рестрикционных фрагментов можно присоединять меченые линкеры.

Рис. 20.18. STS-картирование. A. STS (с 1 по 15), обнаруженные с помощью ПЦР-скрининга в клонах а—е, обозначены знаком плюс (+). Буквами L и R указаны STS, находящихся на 5'- и 3'-концах вставки (на ее левом и правом концах соответственно). Б. Идентифицировав перекрывающиеся участки, можно построить контиг из пяти клонов и карту расположения STS. Полученные данные не позволяют установить порядок некоторых из них (номера в скобках). Интервалы между STS представлены одинаковыми; в действительности они неизвестны.

Рис. 20.19. Картирование с помощью упорядоченных STS (числа с 20 по 31 над горизонтальной линией). Точками указан STS-состав клонов f—j. STS упорядочены, что позволяет без труда идентифицировать перекрывающиеся клоны.

Для выявления перекрывающихся участков необходимо проанализировать очень большое число космидных клонов, поэтому для поиска меченых рестрикционных фрагментов, общих для пары клонов, используют специальные компьютерные программы. ДНК-отпечаток каждого клона сканируют, информацию вводят в компьютер и проводят попарные сравнения. По результатам этих сравнений организуют из клонов контиги. Наличие перекрывающихся участков в клонах созданного контига подтверждается построением подробных рестрикционных карт вставок. Пробелы между контигами заполняют, выбирая зонды из ближайших концов соседних контигов и проводя скрининг библиотеки, содержащей крупные вставки, для поиска недостающих участков ДНК.

Рис. 20.20. Концевое мечение двухцепочечных ДНК с помощью ДНК-полимеразы Т4. 3'-экзонуклеазная активность ДНК-полимеразы катализирует отщепление 3'-концевых нуклеотидов фрагментов ДНК с тупыми концами (А), с выступающими 3'-концами (Б) или с выступающими 5'-концами (В). Отщепление происходит до тех пор, пока на противоположной цепи не экспонируется основание, комплементарное меченому дезоксирибонуклеотиду, введенному в реакционную смесь (dGTP*); затем «включается» полимеразная активность ДНК-полимеразы Е4, и к 3-концу присоединяется свободный меченый дезоксирибонуклеотид. Метка включается в оба конца фрагментов ДНК (на рисунке это не показано). Для мечения можно использовать любой дезоксирибонуклеотид.

Транскрипционное картирование

Клоны кДНК-библиотеки представляют собой ДНК-копии тех транскриптов экспрессирующихся генов, которые присутствовали в конкретной ткани в момент экстракции из нее мРНК. «Привязка» индивидуальных клонов кДНК к хромосомным районам создает предпосылки к выявлению возможных кандидатов на роль генов тех или иных заболеваний. Если анализ генетического сцепления показывает, что ген данного заболевания находится в той же области хромосомы, что и кДНК-последовательность(ти), то можно проверить, не происходят ли данные клоны кДНК из гена этого заболевания.

Привязку кДНК-клонов и других типов нуклеотидных экспрессируемых последовательностей к специфическим хромосомным районам называют транскрипционным картированием Для построения транскрипционных карт используют различные методы. В одном из них частично секвенируют отдельные кДНК-клоны и на основе транслированной части каждой кДНК-вставки получают STS. Данный тип STS называют экспрессируемым STS (eSTS). Для определения хромосомной локализации eSTS используют линии соматических гибридных клеток, которые содержат единственную хромосому человека (монохромосомные гибриды) или фрагменты конкретной хромосомы человека (делеционную панель). Для этого ДНК каждого из монохромосомных гибридов амплифицируют методом ПЦР с использованием eSTS-праймеров и идентифицируют ту хромосому, которая содержит данный eSTS. Затем методом ПЦР-амплификации ДНК клеточных линий делеционной панели идентифицируют район хромосомы, в котором находится данный eSTS (рис. 20.21). Кроме того, внутригенные STS можно нанести на существующие РГ-карты. К 1996 г. на всех аутосомах и Х-хромосоме было картировано около 20 000 внутригенных STS человека.

Помимо экспериментов по картированию кДНК-клонов в хромосомных районах, в Институте исследования генома в Роквилле, Мэриленд (The Institute for Genome Research) и других лабораториях приступили к реализации проекта по частичному секвенированию клонов кДНК-библиотек всех органов и тканей человека. Одной из задач этой программы является создание каталога коротких последовательностей (150—300 нуклеотидов) для каждого экспрессируемого гена человека. Такие короткие кодирующие последовательности называют маркерными экспрессируемыми последовательностями (EST, от англ, expressed sequence tags). С их помощью можно изучать размеры, разнообразие и транскрипционную активность экспрессирующихся генов человека. Более того, на основе EST можно создавать STS и использовать их для картирования и отбора геномных клонов, содержащих данный ген.

Рис. 20.21. Привязка маркера к специфическому хромосомному району с использованием делеционной панели гибридных клеток. А. Схематическое представление районов хромосомы, присутствующих в монохромосомном клеточном гибриде (А) и в клеточных линиях В—J делеционной панели гибридных клеток. Районы (с 1 по 10) определяются границами делеций в хромосомах делеционной панели. Закрашенный прямоугольник — центромера каждой хромосомы. Б. Результаты ПЦР-амплификации ДНК гибридных клеточных линий (A—J) с использованием STS-маркеров (с STS-a по STS-e). Наличие или отсутствие ПЦР-продукта указано знаком плюс или минус соответственно. Данные о наличии или отсутствии ПНР-продуктов клеточных линий делеционной панели с STS-маркером используются для определения хромосомного района, в котором находится STS. Например, STS-d отнесен к району 7, поскольку соответствующий ПЦР-продукт образуется при амплификации каждой клеточной линии делеционной панели, в которой присутствует район 7.

Частичное секвенирование кДНК-клонов и обработка полученных данных полностью автоматизированы. Каждую новую EST сравнивают с теми, которые уже были секвенированы, и если последовательность действительно является новой, ее вносят в базу данных по EST. Для поиска гомологии EST с известными генами или семействами генов и для определения категории, к которой относится функция представляемого ей гена, проводят дополнительные сравнения. К 1995 г. было идентифицировано примерно 300 000 EST из 300 кДНК-библиотек 37 органов и тканей. Примерно 90 000 EST представляют собой различающиеся экспрессирующиеся последовательности человека, из них примерно 10 000 соответствуют генам, роль которых в клетке известна, а остальные 80 000 — еще неоткрытым генам.





Для любых предложений по сайту: [email protected]