Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014
Интегральные серверы для предсказания функции по структуре
ProFunc
Оценка структурных методов
Насколько хороши структурные методы в предсказании функции белка? Авторы ProFunc попытались ответить на этот вопрос, применив его к 92 структурам белков с известной функцией, полученным в MCSG (Watson et al. 2007). В каждом случае предсказания сервера были настроены таким образом, чтобы исключить информацию о структурах, полученных после выхода в свет рассматриваемой структуры, для лучшего понимания того, что могло бы быть предсказано на тот момент.
Рис. 10.8. Пример анализа со страниц PDBsum, выполняемого при загрузке любой структуры на сервер ProFunc. а) Схематическая диаграмма белковой цепи, представляющая элементы вторичной структуры белка (а-спирали и ß-тяжи) вместе с различными структурными мотивами, такими как ß- и у-повороты и ß-шпильки. В этом примере остатки, взаимодействующие со связанным лигандом, отмечены точками над однобуквенным аминокислотным кодом. В структуре 2fck лигандами являются 12 нитрат-ионов и одна молекула глицерина, которые не представляют особенного интереса или функциональной информации, будучи элементами кристаллизационного раствора. б) Диаграмма топологии белковой цепи в 2fck. Диаграмма показывает, как ß-тяжи, показанные широкими серыми стрелками, объединяются сторона к стороне с образованием центрального ß-листа домена. Также диаграмма показывает относительное взаиморасположение а-спиралей, показанных здесь цилиндрами. Маленькие стрелки показывают направление белковой цепи от N- к С-концу. Числа при элементах вторичной структуры соответствуют нумерации остатков в PDB-файле. Диаграмма создана на основе результатов программы Нега (Hutchinson and Thornton 1990)
Анализ показал, что 70% структур имели бы правильное описание своей функции, если бы сервер ProFunc был доступен на тот момент, причем три четверти из этих 70% получили правильное предсказание более чем одним методом.
Из методов, основанных на структуре, двумя наиболее успешными стали сравнение типов укладки с помощью программы SSM и обратные шаблоны. Доля успешных предсказаний для у обоих составила 50-60%. Действительно, в большинстве случаев оба метода давали одинаковые лучшие результаты, хотя однажды один из методов обнаружил правильное совпадение там, где другой не смог этого сделать. Это может означать, что, поскольку два метода дают настолько схожие результаты, все, что нам действительно нужно, это метод сравнения типов укладки, такой как SSM. Однако будучи далеко не вырожденным метод обратных шаблонов дает гораздо больше специфической информации о сходстве между двумя любыми структурами. Более того, он выявляет области, имеющие наиболее высокое сходство, и, следовательно, с наибольшей вероятностью являющиеся функциональными сайтами. Кроме того, метод дает весомые свидетельства в пользу вероятной функции, показывая, как он это делает, ключевые остатки.
Конечно, единственным истинным путем проверки правильности предсказания является его экспериментальное подтверждение. Это трудно, требует затрат времени и ресурсов, хотя на этом пути наметился некоторый прогресс в направлении создания высокопроизводительных функциональных тестов (Yakunin et al. 2004).