Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014
Введение
Молекулы белков лежат в основе почти всех биологических процессов. Ученым всегда были любопытны как белки, участвующие в метаболических путях, так и молекулярные основы их функционирования. Однако в эру системной биологии еще больше внимание уделяется полному пониманию работы всей совокупности белков организма, его протеома. Все более важно, что мы не только понимаем все стороны данной функции, или функций, какого-либо белка, но и то, что наше знание распространяется на все компоненты изучаемой системы или организма и так далеко, насколько это возможно. Без всесторонней информации попытки синтеза и расчета не выйдут за рамки приближения реальности.
Для полномасштабного анализа функий белков был создан ряд постгеномных технологий, но зачастую этот анализ ограничивается ценными, но не полными результатами вроде “белок А участвует в делении клетки” или “белки В и С взаимодействуют”. Выяснение деталей молекулярного функционирования оказывается гораздо более дорогим, и проводится в лабораториях, воодушевленных специалистами по биоинформатике на заполнение пробелов в наших знаниях. Сравнение аминокислотных последовательностей белков разных видов является основой для компьютерного аннотирования функций белков, хотя запутанные механизмы, которыми эволюция связывает структуры и функцию, часто ограничивают точность и применимость предсказаний. Более того, маловероятно, что истинно новая функция будет предсказана исключительно на основе анализа последовательностей, хотя “сиротская” (orphan) активность - известный биохимический процесс, для которого еще не определены ответственные за него белки, - несомненно существует. Например, некоторые проблемы такого рода могут возникнуть потому, что хотя структура белка и определяется его последовательностью, функция белка определяется в первую очередь его структурой, поэтому несколько незначительных отличий между последовательностями белков могут оказаться значимыми при рассмотрении пространственной структуры белка в целом.
Аксиома, что структура определяет функцию, и поэтому может быть использована для предсказания этой функции, является краеугольным камнем таких областей, как предсказание структуры и структурное аннотирование функций, которые охватываются в этой книге. И хотя структурная геномика обрушила на исследователей вал результатов, все еще остаются неизвестные функции, которые стимулируют разработку структурных методов предсказания функции, и эти методы могут быть применены к модельным структурам хотя бы в некоторой степени. Таким образом, первые главы этой книги охватывают построение структур белков исходя из их последовательностей или хотя бы получение какой-то информации об этих структурах. Затем в книге обсуждаются различные пути, по которым знание структуры приводит к предсказанию функции, и, наконец, в последних двух главах речь идет о реальном применении результатов структурной геномики или моделей белков.
Глава 1 посвящена стремительному развитию методов моделирования ab initio. Этот подход все лучше подходит для точного предсказания укладки белковой цепи или в некоторых случаях даже деталей на уровне расположения атомов, например, для маленьких белков, для которых не удается выявить сходства с уже известными структурами. Глядя на недавние результаты, удивительно вспоминать сейчас, что не далее, как в 1997 году, А.Леск, оценивая результаты CASP2 (конкурса по предсказанию структуры белков) заявлял: “Я считаю результаты... разочаровывающими, или даже отрезвляющими, и многие коллеги разделяют это мнение. За исключением одной мишени, все предсказания увенчались не более чем частичным успехом.” (Lesk, 1997). Главы 2 и 3 посвящены обсуждению структур и моделированию новых структур на основе уже известных. Сравнительное моделирование, рассматриваемое в Главе 3, - это сложившаяся и важная методика, позволяющая во многих случаях последовательно создавать надежные модели. Также важно, что про полученные модели сразу известно, в какой части они более надежны, в какой — менее. Глава 2 касается распознавания укладки белка по его последовательности, которое часто является информативным само по себе (Глава 6), в то время как просто сравнение последовательностей оказывается недостаточным. Однако не менее важно, что распознавание фолда расширяет границы применимости сравнительного моделирования, и это приводит к возрастанию числа моделей, которые могут быть построены по одной экспериментальной структуре. Для мембранных белков, о которых пойдет речь в Главе 4, подходы структурной биоинформатики ограничены по фундаментальным соображениям - число известных пространственных структур все еще мало. По этой причине в Главе 4 детально рассматриваются и вопросы предсказания топологии различных классов белков, что, по сути, является предсказанием структуры низкого разрешения. В Главе 5 речь идет о завораживающем классе белков, которые, будучи изолированными, демонстрируют отсутствие внутренней упорядоченности, но приобретают её при взаимодействии с другими молекулами. Такие белки, изучение которых расцвело в последнее десятилетие, имеют свои собственные идиосинкратические правила соответствия между структурой и функцией. В Главе 5 эти вопросы также обсуждаются.
Вторая часть этой книги, озаглавленная “От структур к функциям” и начинающаяся с Главы 6, открывает обсуждение вопроса, как изменяются и эволюционируют функции белков в контексте типов их укладки, или фолдов, или типов укладки в надсемействах. Некоторые типы, будучи реально обнаруженными или только предполагаемыми, являются надежными признаками конкретных функций, что важно при предсказании функции на основе структуры; другие типы укладки - суперфолды - обеспечивают реализацию разнообразных функций. Взаимодействия белков с лигандами происходит непременно на поверхности белка, поэтому не удивительно, что многие аспекты геометрии этой поверхности и её свойства могут быть успешно использованы для предсказания функции. Такие методы рассматриваются в Главе 7. В Главе 8 обсуждаются паттерны локальной структуры, которые могут иметь тесное отношение к связыванию лигандов или катализу. Такие паттерны возникают из-за консервативности или конвергентной эволюции эффективных каталитических центров, а также ограничений на связывание, наложенных физико-химическими свойствами конкретного низкомолекулярного соединения. Кроме того, в Главе 8 рассматриваются последние успехи в применении докинга низкомолекулярных соединений для предсказания специфичности ферментов. Зачастую незамеченной остается связь между функционированием белка и его динамикой. Структуры белков не статичны, и их движения, большие или малые, часто являются ключевыми для функционирования. Молекулярная динамика и сходные с ней методы конформационного сэмплирования и анализа рассматриваются в Главе 9, в которой также представлены примеры того, как рассмотрение динамики проясняет наше понимание функционирования белков. Вместе со все нарастающим числом и спектром методов предсказания функции белка по его структуре, целесообразным становится одновременное применение нескольких методов в рамках интегральных веб-серверов. Такой подход удобен для пользователя, а также позволяет делать консенсусные предсказания. В Главе 10 описаны возможности и функционирование веб-серверов ProFunc и ProKnow, реализующих этот подход. В Главе 11 обсуждается опубликованная работа, в которой основанные на структуре методы были применены к предсказанию функции белков, полученных в рамках проектов по структурной геномике. Это позволило получить ценную картину того, какой из методов обычно оказывается наиболее информативным. Глава завершается обсуждением последних тенденций в направлении коллективного аннотирования как способа преодоления узких мест в аннотировании таких белков. Глава 12 охватывает приложения структурных методов к структурам моделей, полученным как с помощью сравнительного моделирования, так и с помощью методов ab initio. Наряду с большим количеством примеров обсуждается опубликованная работа, в которой оценивается точность моделей с функционально-значимой точки зрения, а также применимость различных методов моделирования.
Цель этой книги состоит в предоставлении современного взгляда на состояние дел в предсказании структуры белков и основанном на структуре предсказании функции белков. Каждая глава содержит ссылки на доступные веб-серверы и другие ресурсы, которые читатель может пожелать использовать в своей работе. В конце каждой главы авторы намечают направления дальнейшего развития и ожидаемые затруднения в соответствующих областях. Когда написание книги уже подходило к концу, появилось сообщение о значительном успехе в давнишней проблеме - улучшении сравнительных моделей (Jagielska et al. 2008). Тем не менее, создается впечатление, что структуры белков непрерывно готовят нам новые трудности. Стоило нам почувствовать, что научное сообщество приблизилось к объяснению явлений, природа которых до сих пор была не ясна, таких как обмен доменов, круговая перестановка, образование фибрилл, белки с присущей неупорядоченностью и многими другими, как мы сталкиваемся с метаморфными белками (Murzin 2008), исследование которых может значительно поспособствовать нашему пониманию пространства типов укладки белков. Смогут ли методы биоинформатики хотя был предсказать, какие белки могут видоизменяться между двумя типами укладки? Трудно сказать, но совершенно ясно, что биоинформатика структуры и функции белков на протяжении многих лет будет оставаться волнующей областью исследований.
Литература
Jagielska A, Wróblewska L, Skolnick J (2008) Protein model refinement using an optimized physics-based all-atom force field. Proc Natl Acad Sсi USA 105:8268-8273 Lesk AM (1997) CASP2: report on ab initio predictions. Proteins Suppl 1:151-166
Murzin AG (2008) Metamorphic proteins. Science 320:1725-1726