Основы биоинформатики - Огурцов А.Н. 2013

Информационные принципы в биотехнологии
Анализ и предсказание белков
Проблемы в предсказании функции белка

В идеальном случае по аминокислотной последовательности мы можем восстановить структуру белка, а затем из структуры - функцию белка.

В действительности, несмотря на уверенность в том, что схожие аминокислотные последовательности будут иметь схожие белковые структуры, отношения между структурой и функцией более сложные.

Белки с одинаковой структурой и даже с одинаковой последовательностью могут использоваться организмами для реализации совершенно разных функций.

И наоборот, очень сильно различающиеся белки могут выполнять одинаковые функции.

Более того, как неродственные последовательности могут иметь схожую структуру, так и неродственные белки с различной структурой могут выполнять одну и ту же функцию.

В ходе эволюции белки могут:

✵ сохранять функцию и специфичность;

✵ сохранять функцию, но менять специфичность;

✵ менять функцию на подобную или ту же, но в другом метаболическом "контексте";

✵ переключаться на совершенно другую функцию.

Часто изменение функции вовсе не связано с изменением белковой последовательности или структуры. Некоторые белки являются полифункциональными, и им вовсе нет нужды меняться для изменения их биологической функции.

Например, у утки активная лактатдегидрогеназа и енолаза выполняют функцию кристалликов в хрусталике глаза, хотя и не встречают своих субстратов in situ. В других случаях кристаллики очень близки к ферментам, хотя некоторая дивергенция с потерей каталитической активности уже произошла (что доказывает, что ферментативная активность не является необходимой в хрусталике глаза).

Другой пример, белок из Е. coli, называемый Do, DegP или HtrA, при низких температурах действует как шаперон (катализирует сворачивание белков), а при повышении температуры выше 42° С превращается в протеиназу. Объясняется это, по-видимому, тем, что при нормальных условиях или при умеренном тепловом стрессе задача Do - защитить белки, у которых возникли трудности со сворачиванием; а при более жёстком тепловом стрессе, когда сохранить белки невозможно, их надо утилизировать.

Ещё пример, фермент Е. coli липоатдегидрогеназа (lipoate dehydrogenase) является также и необходимой субъединицей в пируватдегидро-геназном, 2-оксоглутаратдегидрогеназном комплексах и комплексе расщепления глицина (см. п. 12.3).

Эти примеры соотношения структуры и функции находятся на границах широкого диапазона возможного поведения белков.

Зачастую непросто определить различия в функциях количественно, то есть сформулировать критерий, по которому можно различать ситуации, когда две разные функции более похожи друг на друга, чем две другие разные функции. В некоторых случаях под изменённой функцией может скрываться общий механизм. Например, семейство енолаз содержит несколько гомологичных ферментов, которые катализируют различные реакции, сохраняя общие черты механизма реакции. Эта группа включает саму енолазу, манделатрацемазу, муконат-лактонизирующий фермент I и D-глюкоратдегидратазу. Все они отрывают протон от а-углеродного атома карбоновой кислоты, образуя енолят в качестве интермедиата. Но последующие превращения и природа продукта варьируются от фермента к ферменту. Эти белки имеют в целом очень схожие структуры типа триозофосфатизомеразного бочонка (TIM-barrel). Разные наборы аминокислот в активных центрах этих ферментов служат причиной того, что ферменты катализируют разные реакции.

Дивергенция функций: ортологи и паралоги. Семейство химотрипсинподобных сериновых протеаз включает близкородственные ферменты, сохранившие свою функцию, и далеко разошедшиеся гомологи, которые приобрели новые функции. Трипсин - это пищеварительный фермент млекопитающих, который катализирует гидролиз пептидных связей, примыкающих к положительно заряженному остатку Arg или Lys (см. [9], п. 13.4).

Трипсины со сходными последовательностями, структурами, функциями и специфичностью существуют у многих видов, включая человека, корову, атлантического лосося и даже бактерию Streptomyces griseus. Сходство фермента S. griseus с трипсинами позвоночных предполагает горизонтальный перенос генов.

Для трёх ферментов из позвоночных (человек, корова, лосось) каждая пара последовательностей имеет более 64% идентичных остатков в выравнивании, а бактериальный гомолог - только около 30% идентичных остатков с ними. При этом все они очень похожи по структуре. Эти ферменты являются ортологами - гомологичными белками в разных видах (см. п. 10.1).

Эволюция создала также родственные ферменты с разной специфичностью в рамках организмов одного вида. Химотрипсин и панкреатическая эластаза - также пищеварительные ферменты, которые, как и трипсин, разрезают пептидные связи, но химотрипсин разрезает связи, соседние с большими плоскими гидрофобными остатками (Phe, Тrр), а эластаза - смежные с маленькими остатками (Ala) (см. [9], п. 13.4). Другой гомолог - эластаза лейкоцитов - необходим для фагоцитоза и защиты против инфекций. В определённых условиях эластаза лейкоцитов ответственна за повреждение лёгких, приводящее к эмфиземе.

Некоторые гомологи трипсина приобрели принципиально новые функции:

✵ Гаптоглобин - гомолог химотрипсина, который потерял протеолитическую активность. Он действует как шаперон, предотвращающий нежелательную агрегацию белков. Гаптоглобин формирует компактный комплекс с фрагментами гемоглобина, вышедшими из эритроцитов, реализуя ряд полезных эффектов, например предотвращение потери иона железа.

✵ Сериновая протеаза риновирусов развила специальную, независимую функцию, формируя инициаторный комплекс при синтезе РНК, используя при этом аминокислоты на стороне молекулы, противоположной активному центру протеолиза. Это пример не модификации активного центра, а создания нового.

✵ Субъединицы, гомологичные сериновым протеазам, появляются в плазминогенподобных факторах роста. Роль этих субъединиц в активности фактора роста ещё неизвестна, однако они не могут выполнять протеолитическую функцию, потому что были утеряны необходимые каталитические аминокислоты.

✵ "Иммунный" белок насекомых сколексин - далёкий гомолог сериновых протеаз, который вызывает свёртывание гемолимфы в ответ на инфекцию.

В семействе химотрипсина мы видим сохранение структуры и функции в близкородственных белках и прогрессивную дивергенцию функций в некоторых (но не всех) далёких гомологах. Идея состоит в том, что общий паттерн сворачивания белка является ненадёжным ориентиром для предсказания его функций, особенно для очень далёких гомологов. Для правильного предсказания функции в далёких белках гораздо надёжнее анализировать общее строение активного центра. Например:

✵ вирусные 3С протеазы были определены как далёкие гомологи химотрипсина, несмотря на то, что серин их каталитической триады заменён на цистеин;

✵ далекая гомология между ретровирусной и аспартатной протеазами была обнаружена по консервативным остаткам Asp, Thr и Gly.

Анализ характерных паттернов укладки аминокислот активного центра, позволяет прогнозировать функции белка, даже в отсутствие экспериментальных данных об общей пространственной структуре.

Такой подход в предсказании функции белка на основе анализа структуры активного центра подобен тем методикам, которые используются при разработке лекарственных препаратов, для предсказания субстратов, которые могли бы связаться с данным белком. Важно использовать и другие экспериментальные данные, такие как паттерны экспрессии белка в ткани, и каталоги взаимодействующих белков.

Попытки определить функцию напрямую, например, с помощью "нокаута гена", иногда могут быть успешными, но такой подход является непродуктивным в случае летального фенотипа или если функцию выполняет группа белков.

Вклад биоинформатики в предсказание функции белка по его аминокислотной последовательности и структуре, по-видимому, не будет исчерпываться одним лишь алгоритмом, устанавливающим такую однозначную связь между функцией и структурой. Хотя и существует надежда, что когда-нибудь можно будет предсказывать структуру белка на основе его последовательности, но для предсказания функции белка намного более важным является использование биоинформационных данных для планирования эффективных экспериментов и для интерпретации их результатов.

Контрольные вопросы и задания

1. Какие две причины не позволяют предсказать структуру белка, опираясь только на основные физические принципы?

2. Разность между какими двумя противоположными вкладами определяет энергию стабилизации белка?

3. Почему кумулятивные ошибки при суммирования огромного количества индивидуальных вкладов атомов в общую энергию стабилизации не позволяют предсказать структуру белка опираясь только на основные физические принципы?

4. Какой альтернативный подход используется для предсказания структуры белка, если для данного белка не известны подходящие гомологи?

5. На каком допущении основывается метод Чоу-Фасмена?

6. На каком допущении основывается метод GOR?

7. Что такое нейронные сети?

8. Как организована простая нейронная сеть?

9. Как проводится предсказание вторичной структуры методом поиска ближайшего соседа?

10. Какие три алгоритма используются для предсказания структуры белка на основании оценки структур гомологов?

11. Перечислите шаги алгоритма гомологического моделирования трёхмерной структуры белков.

12. Что такое белковый трединг?

13. Какие две методики необходимо использовать для успешного распознавания структуры белка с использованием трединга?

14. Почему аналитическое определение состояния белка с максимальной стабильностью является трудноразрешимой задачей?

15. Какие энергетические вклады необходимо учитывать при оценке конформационной энергии?

16. Для преодоления каких двух проблем в задаче предсказания структуры белка был разработан метод молекулярной динамики?

17. Перечислите основные этапы вычислительной процедуры метода Монте-Карло?





Для любых предложений по сайту: [email protected]