Практическая химия белка - А. Дарбре 1989
Предсказание конформации пептидов и белков
Арсенал современных теоретических методов
Минимизация
Можно сказать, что минимизация энергии является оценочной процедурой, предназначенной для поиска наиболее вероятной конформации. Подобный поиск связан с минимизацией энергии, т. е. нахождением наиболее вероятной конформации, обладающей наименьшей энергией.
Строго говоря, при поиске самой выгодной конформации должна вычисляться свободная энергия системы. На практике, однако, делается допущение, что минимум на поверхности потенциальной энергии соответствует минимуму на поверхности свободной энергии. Вслед за этим полагают также, что самый глубокий минимум потенциальной энергии соответствует и самому глубокому минимуму свободной энергии. Если в последнем допущении нет достаточной уверенности, то вычисляют и сравнивают значения свободной энергии во всех локальных минимумах. Различные методы расчета свободной энергии однозначно свидетельствуют в пользу заключения, что размытый минимум потенциальной энергии может отвечать более низкому минимуму свободной энергии. Разумеется, разность значений потенциальных энергий обоих минимумов не должна быть слишком большой. При расчетах свободной энергии системы находят локальную функцию распределения Z (см. выше) методом интегрирования в окрестностях минимума. При расчетах свободной энергии используют также значения вторых производных и колебательных частот (см., например, [20J). Во всех случаях при оценке свободной энергии привлекают представления статистической механики для анализа минимумов па поверхности потенциальной энергии. Тем не менее этот подход в пептидном конформационном анализе достаточно нов и применяется пока еще редко. Следует отметить, что теоретически возможно рассчитать свободную энергию вблизи любой точки потенциальной поверхности, а не только вблизи минимума, и для этого можно использовать специальную компьютерную программу, в которой реализован метод минимизации свободной энергии.
Минимизация энергии как функции конформации используется весьма часто. Эта процедура лежит в основе машинного моделирования самосборки молекулы белка и энергетического уточнения белковых структур, установленных рентгеноструктурным методом. Известно большое число доступных программ для выполнения процедур минимизации при вычислениях; большинство таких программ позволяют пользователю самому составить функцию расчета энергии по конформационным параметрам. Разнообразие программ отражает богатый спектр математических приемов, применяемых для поиска минимума значений функций. В целом, однако, эти приемы распадаются на две группы.
Первую группу образуют градиентные методы. Хотя главным условием является нахождение точки, в которой первые производные по конформационным переменным равны нулю, а вторые производные больше нуля, некоторые методы не требуют явного вычисления производных. Эти методы можно рассматривать как семейство процедур, отличающихся способом преобразования Еi+1 — Ei(здесь і и і+1 отвечают соседним точкам конформационного пространства) для вычисления производных в точке і и выбора конформации Хi+1. Метод наискорейшего спуска является одним из самых простых, но пользуется большой популярностью в конформационных расчетах в связи с хорошей сходимостью результатов. Недостатком метода считается его невысокая скорость. Метод Ньютона — Рафсона отличается большей сложностью и требует вычисления вторых производных, тем не менее в настоящее время подобные методы используются достаточно часто. Метод Флетчера — Ривса позволяет обходиться без вычисления вторых производных, а информацию о кривизне энергетической поверхности получают с помощью использования квадратичных форм приближения. Методы Давидова [9] и Флетчера — Пауэлла [11] используют преимущества как процедуры Ньютона — Рафсона, так и процедуры Флетчера — Ривса. Перечисленные методы достаточно эффективны, но имеют недостаток: поиск прекращается в любом из локальных минимумов. Действительно, выход из минимума невозможен ввиду принципиальных особенностей алгоритмов указанного типа.
Алгоритмы минимизации второго типа представлены овражными методами и могут быть хорошо проиллюстрированы на примере симплекс-процедуры. Она успешно работает в случае необходимости минимизации энергии как функции углов вращения, а не координат х, у и z. Симплекс — многогранник с n+1 вершиной в n-мерном пространстве — анализирует значения функции во всех вершинах и перемещает вершину с самой высокой энергией в точку с более низкой энергией. Для этого в симплекс-процедуре предусмотрены операции отражения, расширения или сжатия многогранника и движения пробной точки относительно центроида остальных точек. По-видимому, градиентные методы поиска можно сравнить с поведением мяча, перемещающегося вниз к подножию холма, а симплекс-метод — с поведением слепого осьминога, нащупывающего свою пору в коралловом рифе. Разумеется, симплекс-метод имеет также недостатки, но в целом его следует считать весьма надежным. Этот метод работает и при наличии точек разрыва в производных или в самой функции; он хорошо приспособлен для учета различных дополнительных внешних условий, налагаемых на конформационные переменные или на значения энергии, а также на другую функцию конформационных переменных. Более того, этот алгоритм позволяет преодолевать мелкие минимумы, если пробная точка попадает в район с более низкой энергией. Вероятность такого «прыжка» зависит от глубины и профиля встретившегося минимума, ширины энергетического барьера и от значений управляющих параметров симплекс-процедуры. При условии что новая вершина генерируется на значительном расстоянии от центроида многогранника, вероятность встречи нового минимума заметно возрастает. В зависимости от реальных обстоятельств симплекс-процедура может быть модифицирована с целью большей эффективности в решении частных проблем (например, комплекс-процедура). Один из недостатков симплекс-метода — высокие затраты машинного времени для получения надежных результатов.
С одной стороны, градиентные методы быстро находят локальные минимумы, но они испытывают затруднения, если функция ведет себя недостаточно просто (например, имеет точки разрыва). С другой стороны, симплекс-метод может работать с большинством функций и не останавливается в локальных минимумах, что увеличивает вероятность обнаружения глобального минимума. Неоднократно высказывалось мнение о целесообразности объединения обоих методов в работах, посвященных строению пептидов и белков. Так, Робсон и Осгаторп [62] использовали двойную минимизацию, при которой градиентный метод переключался на симплекс, если происходила остановка в локальном минимуме или встречалась трудная точка, и наоборот, происходил возврат к градиентному методу при обнаружении нового минимума. Переключение происходит автоматически с помощью диагностических переменных, вычисляемых в каждом из алгоритмов в зависимости от текущего значения сходимости.
Такой подход позволяет обойтись без введения специальных алгоритмов преодоления локальных минимумов (см., например, метод термализации [33]).