Биотехнология - Ю.О. Сазыкин 2006
Общая биотехнология
Геномика и протеомика
Общая характеристика
Успехи генетики, молекулярной биологии и биохимии привели к формированию в 1990-х гг. двух новых фундаментальных дисциплин — геномики и протеомики. Бурное развитие этих дисциплин обеспечивает в наше время прогресс в ряде разделов биотехнологии, в том числе фармацевтической.
Термин «геномика» - производный от генома — совокупности всех генов организма; — «протеомика» — производный от протеома — совокупности структурных и каталитических белков в клетке эукариота или прокариота. Обе дисциплины можно считать как бы терминологическим оформлением современного этапа развития генетики и белковой химии, приближающим их к целостной клетке. И по времени возникновения, и в методологическом аспекте главенствующее значение здесь занимает геномика; протеомика базируется на геномике, являясь этапом познания живого уже на белковом уровне.
Генетика начала XIX в. получила позднее название формальной, поскольку исследования велись на уровне «ген-признак» (открытие знаменитых основополагающих законов Г. Менделем). Существование гена было постулировано, но материальная его природа оставалась неизвестной. Лишь в 1950-е гг. после появления и быстрого подтверждения справедливости концепции о двойной спирали ДНК и о гене как участке ДНК, началось бурное развитие молекулярной генетики: были установлены размеры отдельных генов, функциональные участки в гене и т.д. Параллельно биохимиками с участием генетиков был установлен матричный механизм белкового синтеза с передачей генетического кода от ДНК к белку.
Задача геномики — установление полной генетической характеристики всей клетки — количества содержащихся в ней генов и их последовательности, количества нуклеотидов в каждом гене и их последовательности, определение функций каждого гена по отношению к метаболизму организма или, более обще, применительно к его жизнедеятельности. Геномика позволяет выразить сущность организма — его потенциальные возможности, видовые (и даже индивидуальные) отличия от других организмов, предвидеть реакцию на внешние воздействия, зная последовательность нуклеотидов в каждом из генов и число генов.
Цель геномики — получение информации о всех потенциальных свойствах клетки, которые не реализуются на данный момент, например, «молчащие гены», протеомика же дает возможность охарактеризовать клетку в данный момент, зафиксировав все находящиеся в ней белки в своего рода «моментальной фотографии» функционального состояния клетки на уровне ее протеома, т.е. совокупности всех ферментных и структурных белков, которые «работают» в отличие от неэкспрессирующихся генов. При этом, если геномика появилась прежде всего в результате развития техники секвенирования, то для протеомики такую же основополагающую роль играет техника двухмерного электрофореза — разделения белков в одном направлении по молекулярной массе, а в другом — по изоэлектрической точке. Сам по себе этот метод не нов, однако он в значительной мере усовершенствован, что позволяет следить в динамике за сотнями белков одновременно. Образно говоря, это как бы «киносъемка» клетки на молекулярном (белковом) уровне. Кадры своеобразной киноленты последовательно фиксируют нарастание и падение количества индивидуальных белков клетки во времени, например, при ее переходе из одной фазы клеточного цикла в другую и при реакции клетки на изменения внешней среды, отражают посттрансляционные превращения белков и т. д.
Протеомика позволяет также следить за белковыми взаимодействиями. Это относится, например, к передаче сигналов от поверхности клетки к факторам избирательной транскрипции в ядре. С ее помощью может быть преобразована, таким образом, не только технология скрининга иммуносупрессоров, но и ингибиторов сигнальной трансдукции в целом. Методы протеомики позволяют получить более полную, всестороннюю картину взаимодействия с клеткой новых потенциальных антимикробных агентов. Работы по изучению динамики биосинтеза ферментов вторичного метаболизма у микроорганизмов при использовании протеомики могут быть переведены на новый, более высокий уровень.
Возвращаясь к связи протеомики с геномикой, следует подчеркнуть, что протеомика может быть названа продолжением именно функциональной геномики. В отличие от геномики предметом изучения протеомики являются продукты, кодируемые генами, экспрессирующимися в данный момент.
Минимальные геномы микроорганизмов некоторых видов состоят из нескольких сотен генов. Геном человека приближается к ста тысячам генов. Размеры отдельных генов варьируют примерно от одной тысячи пар нуклеотидов и выше. Таким образом, количество пар нуклеотидов, составляющих индивидуальный геном, измеряется как минимум сотнями тысяч, обычно же многими миллионами пар нуклеотидов.
Следовательно, для полного знания генома организма надо определить последовательность (sequence) нескольких миллионов пар нуклеотидов (А-Т — аденин-тимидин, Г-Ц — гуанидин-цитозин). Провести «секвенирование», согласно вошедшему в употребление выражению, целого генома можно только при наличии высоких технологий и соответствующего оборудования.
В настоящее время в качестве ежесуточного итога работы многих десятков лабораторий в разных странах мира секвенируется приблизительно один миллион пар нуклеотидов. Хранить же полученные данные и пользоваться ими невозможно без обращения к специальным базам данных, некоторые из которых имеют статус международных. Широкую известность имеют базы данных института геномных исследований (США) и Гейдельбергского университета (Германия). Международные базы данных позволяют получать сведения о гене и его распространенности среди патогенов; о кодируемом этим геном продукте и об участии этого продукта (как правило, фермента) в том или ином метаболическом цикле; о катализировании им конкретной реакции в цикле. Иными словами, исходным тест-объектом для отбора антимикробных веществ, избирательных ингибиторов метаболизма становится уже не микробная культура, а ген (точнее, кодируемый им продукт).
Необходимо иметь в виду, что различие по последовательности нуклеотидов геномов разнообразных организмов не обязательно указывает на межвидовые различия; например, у микроорганизмов, используемых в качестве продуцентов в биотехнологической промышленности, зафиксированы различия в геномах у отдельных штаммов одного и того же вида. Внутривидовые различия в геномах могут обнаруживаться по всей лестнице живых существ, включая человека (в последнем случае индивидуальные различия, выявляемые при анализе ДНК, составляют, в частности, новый эффективный прием судебной экспертизы).
Как все недавно возникшие научные дисциплины, геномика дифференцируется по нескольким направлениям (специализируются, соответственно, и базы данных). Прежде всего, здесь должна быть упомянута структурная геномика, задачей которой является идентификация генов с помощью специальных компьютерных программ (ведется поиск открытых рамок считывания со старт- и терминирующими кодонами). В результате изучаемый геном характеризуется по молекулярной массе, количеству генов и нуклеотидной последовательности в каждом гене; у прокариот — в геноме хромосомы, у эукариот — в каждой из хромосом.
Сравнительная геномика позволяет: относительно быстро, связавшись с базой данных и, получив ответ на свой запрос, установить, является ли изученный по последовательности нуклеотидов ген уникальным, или он уже был идентифицирован в другой лаборатории, получить сведения о степени гомологии родственных генов, т.е. степени гомологии по последовательности нуклеотидов в открытой рамке считывания; ответить на вопрос об эволюционной близости одного организма другому и на ряд подобных вопросов, относящихся к фундаментальной биологии. В сравнительной геномике заложены возможности ответа и на вопросы практического характера. Например, если ведется поиск ингибиторов данного гена у патогенного микроорганизма с целью создания на их основе лекарственных средств, то важно знать, есть ли ген с такой или близкой последовательностью нуклеотидов в организме хозяина. Это позволяет сделать прогноз о степени безопасности создаваемых лекарств.
После структурной и сравнительной геномики следует назвать как сформировавшуюся научную дисциплину функциональную или метаболическую геномику. Ее цель — установление связи между геномом и метаболизмом, кластерами генов и многоступенчатыми метаболическими процессами, отдельными генами и конкретными метаболическими реакциями. Применительно к функциональной геномике относится понятие так называемых «модельных» организмов: прежде всего, это некоторые микроорганизмы, у которых прослежены связи между генами и кодируемыми этими генами ферментными и структурными белками, т.е. прокариоты и низшие эукариоты с полностью секвенированным геномом и досконально изученным метаболизмом. Примерами таких модельных микроорганизмов могут служить Escherichia coli (у прокариот) и Saccharomyces cerevisiae (у эукариот). Сопоставление гена у изучаемого организма с близким по степени гомологии геном у модельного организма позволяет предположить функции гена. Отсутствие гомологии указывает на необходимость специального изучения функций нового гена.
Особое значение применительно к фармации функциональная геномика имеет при установлении так называемой «существенности» отдельных генов. Под «существенностью» подразумевается необходимость гена для жизнедеятельности клетки. Так, при создании антимикробных лекарственных препаратов именно «существенные» гены должны быть мишенями для антимикробных веществ. Отметим, что иногда ген приобретает значение «существенности» только в особых условиях, в которых может оказаться патогенный микроорганизм.
Исходя из размеров генома и количества генов понятно, что задача полного секвенирования генома решается быстрее в случае микроорганизмов в отличие от высших эукариот. К настоящему времени полностью секвенирован геном нескольких десятков видов бактерий, в том числе патогенных. У разных видов бактерий размер генома варьирует, но в целом он близок к нескольким тысячам генов или нескольким миллионам пар оснований соответственно. Например, у Е. coli четыре с небольшим тысячи генов и, соответственно, более четырех миллионов пар оснований.
В клинике в настоящее время используется порядка двухсот природных и синтетических антибактериальных веществ. Каждое из них имеет свою мишень, как правило, это или фермент, или рибосомный белок. Всего реализованных мишеней также около двухсот. Следовательно, подавляющее количество генов в качестве мишеней для антибактериальных агентов все еще не используется. Для доказательства «существенности» генов применяется метод избирательного «выбивания» гена из генома с проверкой выживания организма после такой процедуры, который представляет большой интерес как технология скрининга антибактериальных (или шире — антимикробных) агентов.
Традиционно первичный отбор последних проводится путем испытания их действия на рост тест-культуры микроорганизма. Высокоактивные, подавляющие рост (природные или синтетические) вещества, отобранные на этом этапе, проходят дальнейшие испытания, в частности определяется антимикробный спектр их действия и активность в опытах in vivo на лабораторных животных, а также токсичность как для макроорганизма в целом, так и для его отдельных органов и тканей.
По завершении доклинических испытаний в случае получения положительных результатов ставится вопрос о передаче препарата в клинику. Затем, как правило, начинается углубленное изучение механизма действия антимикробного агента на субклеточном и молекулярном уровнях, т. е. ведется поиск его внутриклеточной мишени — макромолекулы или макромолекулярного комплекса — таргета (англ. target — мишень) по недавно принятой терминологии. Далее выявляется ген, кодирующий образование этой макромолекулы, или гены, которые кодируют образование макромолекул, входящих в макромолекулярный комплекс.
По новой технологии скрининга (в отличие от вышеуказанной) используют информацию о полностью секвенированном геноме патогена и наличии в нем «существенных» генов. В лабораториях, работающих в области создания новых антимикробных лекарств, предварительно выбирается ген, который будет использован для их испытания как таргет (точнее, в качестве мишени будет использован продукт этого гена).
Таргетный скрининг позволяет в соответствии с выбором гена отбирать биологически активные вещества с запланированным механизмом действия (в отличие от традиционного метода, когда поиск ведется «от клетки к гену»). Первый этап таргетного скрининга начинается с выделения этого гена (соответствующего фрагмента ДНК) из генома. Далее, используя полимеразную цепную реакцию (ПЦР), фрагмент ДНК амплифицируется (создается вирусный вектор, который вводится в плазмиду). Количество копий гена умножается. Затем конструируются:
✵ бесклеточная система, где наработанная матрица служит для получения информационной РНК, специфичной для гена;
✵ бесклеточная рибосомная система, где эта информационная РНК служит для наработки белкового продукта, кодируемого данным геном.
Бесклеточная система, используемая для первичного отбора и оценки активности потенциальных лекарственных веществ — ингибиторов фермента (продукта изучаемого гена), содержит как фермент, так и его субстрат. Когда наработан белок (продукт избранного для изучения гена), тогда возникает вопрос: как узнать функцию этого белка? Например, какую реакцию он катализирует как фермент, чтобы по подавлении этой реакции отобрать ингибиторы. При близком сходстве этого белка с белком из «модельного» организма подобрать бесклеточную систему (субстрат для нового белка) нетрудно. Если сходство есть, но не очень близкое, то прибегают к анализу «мотивов» — коротких участков аминокислотной последовательности, которые распределены по всей длине белковой цепи и могут оказаться сходными у двух белков.
Когда такого сходства нет или сходство обнаружено, но нет ясности в функции самого гомолога, т.е. белка, взятого для сравнения, прибегают еще к одному способу: устанавливают, с какими белками он контранскрибируется (переписывается в последовательность матричной информационной РНК). Если транскрипт — часть полицистронной (эквивалентной гену) информационной РНК, необходимой для протекания в последующем определенного метаболического процесса с участием нескольких ферментов, тогда поиск функции изучаемого белка, включенного в группу этих ферментов, сужается.
В целом подходы к установлению функций продуктов изучаемых генов многочисленны, и их разнообразие неуклонно растет. Таким образом, можно, в конечном счете, проводить серийные испытания потенциальных ингибиторов функций почти любого из тысяч генов, составляющих геном патогена и обнаруживать все возможные «уязвимые точки» микробной клетки. Подобный путь достижения цели породил в литературе термин «обратная генетика», означающий ведение исследования не от клетки и ее фенотипа к гену, а, наоборот, от гена к клетке и к ее фенотипу.
Полное секвенирование генома в сочетании с применением методов генетической инженерии вносит свой склад в фармацию еще в одном отношении. У патогенных микроорганизмов открыты гены, «существенные» для протекания инфекционного процесса, но «несущественные» при росте in vitro — на искусственных питательных средах. В последнем случае они ускользают от внимания исследователя, не поддаются идентификации и не могут быть использованы как таргеты при поиске лекарств. Скрытые или по образному выражению «молчащие» in vitro гены патогенных микроорганизмов получили название ivi генов (генов вирулентности), несмотря на то, что в их число входят не только гены, кодирующие образование токсинов, адгезинов и других факторов вирулентности. К ним относят также гены ферментов и транспортных белков, позволяющих патогенной микробной клетке жить и размножаться в тканях макроорганизма в условиях дефицита некоторых органических веществ и неорганических ионов.
Можно привести такой пример: микробная клетка, находясь in vivo, испытывает недостаток ионов железа, чего не бывает на обычных питательных средах. В этом случае в клетке синтезируется специальная система транспорта железа в клетку из среды с малой концентрацией последнего, фактически транспорт идет против градиента концентрации. Для образования такой системы необходима экспрессия определенных генов. Из молчащих, «несущественных» они становятся «существенными», т.е. подавление их функций отобранными ингибиторами приведет к подавлению роста (размножения) патогена именно в условиях in vivo, т.е. в инфицированном организме. Это, собственно, и есть цель исследователей, создающих новые лекарственные препараты.
К числу генов, которые становятся «существенными» для патогена именно in vivo, относятся гены, кодирующие оптимальный компонентный состав системы, а также недостаток в пуринах и их предшественниках.
Вышеизложенное, конечно, не означает, что во время инфекции в клетке патогена экспрессируются только ivi гены. Большинство генов экспрессируется и in vivo и in vitro. Их продукты необходимы клетке всегда. Такие гены получили образное название «house keeping gens» — дословно «гены, на которых держится дом». Они экспрессируются в любых условиях, поскольку без них клетка просто не может существовать.
Соотношение между house keeping и ivi генами у разных патогенных бактерий варьирует, но в среднем более 90 % генов принадлежит к первой группе. Поскольку ингибиторы house keeping gens обнаруживаются при поиске на питательных средах in vitro, практически все применяемые в клинике антибиотики и синтетические антибактериальные препараты являются ингибиторами функций именно этих генов.
Значительный интерес представляют пути выявления и выделения ivi генов с последующим их использованием в бесклеточных системах отбора ингибиторов. В качестве примера можно привести метод IVET (In Vivo Expression Technology).
Геном патогенной бактерии (в данном случае речь идет о штамме Salmonella typhi murium) с помощью большого набора рестриктаз делится на сотни фрагментов. Каждый отдельный фрагмент генно-инженерными методами соединяется с лишенным промотора (участок молекулы ДНК, с которым связывается РНК-полимера- за) геном хлорамфеникол-ацетилтрансферазы. Такой лишенный промотора ген не может реплицироваться при его введении в клетку. Однако он мог бы реплицироваться, если соединенный с ним ген (в данном случае фрагмент ДНК салмонеллы) имел бы промотор для своей репликации. Тогда этот промотор вызвал бы репликацию не только своего гена, но и следующего за ним, лишенного промотора. Таким образом, репликация гена хлорамфеникол-ацетилтрансферазы могла бы происходить в клетке только за счет использования или «захвата» чужого промотора.
На следующем этапе работы к этому сдвоенному фрагменту, (обозначенному x-cat, где х — фрагмент генома салмонеллы, a cat — ген хлорамфеникол - ацетил трансферазы) присоединяется также лишенный промотора лактозный оперон (lac Z), который нужен для системы окисления лактозы. Далее этот фрагмент, состоящий из трех разнородных частей (x-cat-lac Z) включается в плазмиду. Фактически в данном случае речь идет не об одном фрагменте, а о нескольких, так как часть х, происходящая из генома салмонеллы, зависит от использованной рестриктазы и поэтому содержит разные участки генома. Фрагменты x-cat-lac Z различаются именно по X. В результате получился набор разных плазмид, а после введения их в клетку Е. coli — набор разных штаммов Е. coli с разными частями генома салмонеллы.
Следующий этап работы заключается во внедрении каждого штамма Е. coli в организм лабораторного животного (мыши) и введении животному хлорамфеникола. Спустя сутки из ткани животного высевают бактериальную культуру, причем на твердую индикаторную среду с лактозой. Выросшие колонии визуально анализируют. Они оказываются или красного цвета (меняющие pH и окисляющие лактозу) или белого (бесцветные), причем красные доминируют, их более 90%. Однако отбираются и подвергаются дальнейшему изучению именно белые. Ход рассуждений в данном случае: если из животного, которому ввели хлорамфеникол высеялась жизнеспособная клетка, давшая колонию на твердой среде, значит, в этой клетке экспрессировался ген хлорамфеникол-ацетилтрансферазы и, соответственно, образовывался фермент, инактивирующий (апегилирующий) антибиотик. Следовательно, в данном фрагменте х есть ген с промотором. Этот ген экспрессировался в организме животного, а вслед за ним экспрессировался и ген хлорамфеникол-ацетилтрансферазы (лишенный собственного промотора). Но экспрессироваться мог ген, принадлежащий как к ivi, так и к house keeping генам.
В случае колоний красного цвета экспрессируется ген, кодирующий образование фермента, расщепляющего лактозу; при этом меняется цвет индикатора, колония окрашивается и можно сделать вывод, что в данном фрагменте х содержится (вместе с промотором) ген, принадлежащий к house keeping gens, т.е. он экспрессируется всегда: и в организме животного, и на искусственной питательной среде. Такой ген в данном случае не представляет интереса. Его можно обнаружить более традиционным путем (для подбора в последующем ингибиторов кодируемого им продукта).
Если колония на индикаторной среде с лактозой выросла бесцветной, значит, на искусственной питательной среде данный промотор не работал, и ген во фрагменте х не экспрессировался. Вероятно, что он нужен только при развитии инфекционного процесса и принадлежит к генам вирулентности, т.е. ivi-генам, которые не экспрессируются in vitro. Метод IVET — не единственный для идентификации ivi генов у патогенных микроорганизмов; существуют, например, методы с использованием направленного мутагенеза.
Интерес к ivi генам обусловлен тем, что они (их продукты) практически не использованы как таргеты, а в случае ivi генов можно рассчитывать на высокую избирательность действия (безопасность) создаваемых лекарственных средств. Вместе с тем геномика позволяет дифференцировать гены патогенных микроорганизмов по многим показателям, и это, в свою очередь, позволяет вести скрининг антимикробных агентов все более целенаправленно.
В качестве примера можно привести результаты, полученные при изучении представителей рода Chlamydia (внутриклеточных паразитов с относительно небольшим геномом — порядка миллиона пар нуклеотидов), которые вызывают инфекции бронхолегочного и мочеполового трактов. Прежде всего, гены этого прокариота были разделены на house keeping и ivi гены. Далее была выявлена группа генов, влияющих на апоптоз (запрограмированную гибель части популяции клеток многоклеточного организма — общебиологическое явление, отвечающее за поддержание необходимого и достаточного количества клеток) клетки-хозяина. Наконец, были идентифицированы гены, дублирующие систему жизнеобеспечения паразита. При этом было показано, что ряд этих генов близок по степени гомологии генам высших растений и приблизительно 27 % из них уникальны для рода Chlamydia.