Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014
Предсказание структуры белков ab initio
Отбор моделей
Кластеризация макетов структур
С целью определения состояния с наименьшим значением свободной энергии во многих методах моделирования ab initio используются адаптированные методики кластеризации структур. В работе (Shortle et al. 1998) конформация в центре самого большого кластера для всех 12 рассмотренных случаев была ближе к нативной структуре, чем большая часть шаблонов. Структуры центра кластера принадлежали к 1-5% структур, наиболее близких к нативным.
Чжан и Сколник разработали метод итеративной кластеризации структур SPICKER (Zhang and Skolnick 2004c). Использовались 1489 репрезентативных тестовых белков, для каждого из которых было построено до 280 000 структурных макетов. Лучшие модели среди пяти наиболее высоко оцененных моделей каждого белка оказались в числе лучших 1,4% среди всех использованных макетов. Для 78% из этих 1489 белков СКО между лучшими из пяти наиболее высоко оцененных моделей и структурой макета, наиболее близкой к природной, составило менее 1 Å.
В методе моделирования ab initio ROSETTA (Bradley et al. 2005) кластеризация структурных макетов используется для отбора моделей низкого разрешения. Затем структура моделей уточняется в ходе полноатомного моделирования, результатом которого являются окончательные модели. В случае методов TASSER/I-TASSER (Zhang and Skolnick 2004а; Wu et al. 2007) используются тысячи макетов моделей, полученные в результате расчета МК; их кластеризация осуществляется с помощью метода SPICKER (Zhang and Skolnick 2004c). Окончательными моделями выступают центры кластеров. В методе, разработанном Шерагой с коллегами, осуществляется кластеризация структур, а затем - отбор структур с наименьшими значениями энергии (Oldziej et al. 2005).