Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014
Предсказание функции белков на основе их теоретических моделей
Точность и добавленная ценность основанных на моделях предсказаний
Хотя идеальный алгоритм для определения точности модели в целом еще только предстоит разработать, уже сейчас можно определить среднюю точность предсказания конкретных свойств, сделанных на основе структурных моделей. Большинство белков используют межмолекулярное узнавание для выполнения своих функций, причем лигандами могут быть как малые молекулы, так и многосубъединичные белковые комплексы. Таким образом, свойства поверхности, в особенности такие, как экспониро- ванность остатков, площадь доступной поверхности, карманы и электростатический потенциал, напрямую относятся к выполняемой белком функции.
Точность расчета основанных на моделях предсказаний свойств была изучена при масштабном анализе простых сравнительных моделей (Chakravarty et al. 2005). Было показано, что общая точность всех структурных свойств, которые были включены в анализ, падает в зависимости от сходства последовательностей белка-мишени и белка-шаблона, но для разных свойств это падение в разной степени влияет на их точность (Таблица 12.2).
Таблица 12.2. Точность и добавленная ценность структурных свойств при сравнительном моделировании по одному шаблону (Chakravarty and Sanchez 2004; Chakravarty et al. 2005)
Свойство |
Точность |
Добавленная ценность |
В целом |
Возрастает с увеличением идентичности между мишенью и шаблоном |
Возрастает с падением идентичности между мишенью и шаблоном |
Экспонированность остатков |
Уменьшается с увеличением размера белка; зависит от ошибок в выравнивании при идентичности меньше 30% |
Отсутствует |
Окружение заглубленных остатков |
Нет четкой зависимости от размера белка, но выше, чем для экспонированных остатков; зависит от ошибок в выравнивании при идентичности меньше 30% |
Отсутствует |
Окружение экспонированных остатков |
Нет четкой зависимости от размера белка, но ниже, чем для заглубленных остатков; зависит от ошибок в выравнивании при идентичности меньше 30% |
Умеренная |
Площадь доступной поверхности (ASA) |
Ошибка в общей площади возрастает с увеличением размера белка и очень мало зависит от ошибок в выравнивании |
Умеренная |
Идентификация карманов на поверхности |
Ложные карманы; повышенное число карманов по сравнению со структурой шаблона и мишени; нет четкого влияния ошибок в выравнивании на число карманов |
Отрицательная |
Состав карманов на поверхности |
Высокая |
|
Электростатический потенциал |
Зависит от ошибок в выравнивании при идентичности ниже 50% |
Высокая |
Например, ошибки в выравнивании оказывают незначительное влияние на правильность предсказания площади доступной поверхности (ASA), в то время как правильность предсказания электростатического потенциала начинает страдать, когда идентичность последовательностей падает ниже 50% (Таблица 12.2). Следует особо отметить, что анализ был выполнен на основе набора сравнительных моделей, построенных по одному шаблону, а моделирование петель не применялось. Таким образом, эти результаты являются репрезентативными по отношению к методам масштабного автоматизированного моделирования. Более аккуратные методики моделирования, состоящие в использовании нескольких шаблонов и оптимизации моделей, могут дать лучший результат и повысить точность предсказания конкретных свойств при заданной идентичности последовательностей.
Зная, насколько надежными являются те или иные свойства модели, интересно выяснить, какую дополнительную информацию (добавленную ценность) они имеют по отношению к структуре шаблона, по которому была построена модель. Как и прежде, систематический анализ добавленной ценности был выполнен на большом наборе моделей, построенных по одному шаблону (Chakravarty and Sanchez 2004), и позволил сделать ценные выводы о том, какие конкретно свойства моделей могут быть информативными (Table 12.2).
В целом, чем больше различие между последовательностями шаблона и мишени, тем более значимой становится добавленная ценность. Это следует из того, что в случаях с низким сходством шаблон содержит меньше информации о размере и физико-химических свойствах конкретного остатка в мишени. Однако, не все структурные свойства получают дополнительную информацию по сравнению с шаблоном. Для тех из них, которые зависят, главным образом, от положения остатка - экспонированность, соседство с заглубленными остатками и число карманов на поверхности, - модели не привносят добавленной ценности. Вероятно, это вызвано тем фактом, что заглубленные остатки, образуя структурное ядро, которое отвечает за целостность белка, являются более консервативными, чем экспонированные.
Для других структурных свойств, таких как соседство с экспонированными остатками или общая площадь доступной поверхности, модели позволяют получить некую добавленную ценность. Это имеет важное значение, когда остатки, доступные растворителю, ответственны за взаимодействие с другими молекулами, определяя, таким образом, биологическую функцию белка.
Наконец, для свойств белка, которые сильно зависят от физикохимических свойств его аминокислотной последовательности, например, состав карманов и электростатический потенциал, модели предоставляют значительную добавленную ценность. Действительно, идентификация заряженных областей имеет большое значение, поскольку эти области могут входить в сайт связывания или активный центр белка (см. Главу 7).
Подводя итог, можно сказать, что работы Чакраваты с сотр. показали, что за исключением обнаружения карманов большая часть структурных свойств моделей имеет некую добавленную ценность, и чем больше какое-либо свойство зависит от аминокислотной последовательности белка, тем более полезной оказывается модель при оценке величины этого свойства. Обнадеживает, что, в зависимости от рассматриваемого свойства, идентичность последовательностей шаблона и мишени на уровне 25-40% дает такую точность в оценке этого свойства, которая может быть получена и из ЯМР-структуры.