Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014
Распознавание фолда
Введение
Пределы пространства типов укладки
Напомним некоторые ключевые сведения о природе белков. В базе данных белковых структур размещено около 50000 экспериментально определенных белковых структур (Berman et al. 2000). В базе данных SCOP (Structural Classification of Proteins) (Murzin et al. 1995) эти структуры объединены лишь в 1100 групп с уникальным типом укладки (уникальной топологией) и около 1800 надсемейств (эволюционно связанных белковых семейств). Количество белков, структура которых известна из экспериментов, увеличивается с каждым днем, тогда как количество новых типов укладки растет крайне медленно. Более того, скорость обнаружения новых фолдов, похоже, начинает снижаться (рис. 2.2). Эти результаты привели к широкому признанию мнения, согласно которому число способов укладки, встречающихся в природе, конечно и невелико (Marsden et al. 2006). В структурных базах данных есть сотни, если не тысячи примеров, которые свидетельствуют, что структуры с высокой степенью сходства могут иметь совершенно разные последовательности. Таким образом, хотя справедливо, что последовательности с высокой степенью сходства имеют весьма похожие структуры, справедливо также и то, что похожими структурами могут обладать существенно отличающиеся друг от друга последовательности.
Таким образом, получается, что для любой последовательности, выбранной из базы данных секвенированных геномов, высока вероятность существования структуры, которая уже встречалась исследователям ранее. Главный вопрос состоит в том, как из 50000 структур выбрать правильный шаблон и каким образом осуществить выравнивание интересующей последовательности по этой структуре. Распознавание фолда связано с поиском оценочных функций, которые могут надежно определить совместимость последовательности с известной структурой и осуществить точное выравнивание в тех случаях, когда простое сходство последовательностей установить не удается.
Рис. 2.2. На диаграмме показано количество экспериментально определенных белковых структур, а также количество различных способов укладки (по определению SCOP), включенных в базу данных SCOP (Murzin et al. 1995), в разные годы. Как видно из графика, количество структур, добавленных в SCOP, быстро увеличивается, тогда как количество новых способов укладки остается в почти неизменным, начиная с 2004 года
Несмотря на размер пространства последовательностей, т.е., количество всех возможных белковых последовательностей, пространство белковых структур, вероятно, существенно меньше. Вопрос о том, связано ли это с термодинамикой, кинетикой сворачивания или с эволюционным отбором, является сложным и лежит за пределами тематики настоящей главы. Тем не менее, этот весьма неожиданный факт оказался чрезвычайно полезным при разработке методов предсказания структуры белков.