Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014
Динамика белков: от структуры к функционированию
Итоги и перспективы
Вычислительные методы приобретают все большее признание в структурной биологии и исследовании белков. Функционирование белков - это обычно динамический процесс, включающий структурные перестройки и конформационные переходы между стабильными состояниями. Поскольку такие динамические процессы трудны для экспериментального изучения, методы in silico могут внести значительный вклад в понимание функционирования белков с атомарным разрешением.
Наиболее известным методом изучения динамики белков является молекулярная динамика (МД), в которой атомы рассматриваются, как классические частицы, а их взаимодействия аппроксимируются эмпирическими силовыми полями. На каждом дискретном шаге по времени решаются ньютоновские уравнения движения, что приводит к получению траектории, описывающей динамическое поведение системы. Несмотря на растущую популярность МД, сфера её применимости ограничена вычислительными требованиями. В течение ближайших 10 лет доступные времена расчета белков среднего размера, по всей вероятности, не достигнут микросекундного диапазона для большинства биомолекулярных систем. Однако поскольку функционально значимая динамика белков обычно представлена низкочастотными движениями, происходящими в диапазоне от микро- до миллисекунд, стандартные МД расчеты плохо подходят для широкого применения в изучении конформационной динамики больших биомолекул.
Для смягчения этой проблемы сэмплирования, от которой страдает стандартная МД, были предложены различные методы. Один из подходов состоит в уменьшении числа частиц либо объединением групп атомов в псевдоатомы (переход к крупнозернистому представлению), либо заменой явных молекул растворителя на его неявную континуальную модель. В обоих случаях число частиц значительно уменьшается, способствуя достижению гораздо больших времен, чем в полноатомных расчетах с явным растворителем. Однако, ухудшение “разрешения”, присущее обоим методам, может ограничить их точность и, следовательно, применимость. Другие подходы сохраняют атомарное описание и реализуют различные стратегии сэмплирования.
Алгоритмы обобщенного ансамбля, такие как обмен репликами (Replica Exchange, REX) используют тот факт, что конформационные переходы при высоких температурах происходят чаще. В методе REX при стандартной температуре расчет выполняется для нескольких копий (реплик) системы с помощью МД при различных температурах с частым обменом между репликами, посредством чего низкотемпературные реплики используют повышенные способности высокотемпературных реплик к преодолению барьеров. Хотя динамическая информация при такой постановке расчета теряется, каждая реплика по-прежнему представляет собой больцмановский ансамбль при соответствующей температуре, позволяя получить ценную информацию о термодинамике и стабильности различных конформационных подсостояний. Хотя расчеты по методу обмена репликами в полноатомном представлении часто используются в контексте сворачивания белков, с вычислительной точки зрения они быстро становятся очень требовательными для систем, содержащих более, чем несколько тысяч атомов.
В то время как метод REX является неискажающим методом сэмплирования, существует несколько методов, которые искажают систему, чтобы улучшить сэмплирование по определенным коллективным степеням свободы. Функционально значимые белковые движения зачастую соответствуют тем собственным векторам в матрице ковариации атомных флуктуаций, которые имеют наибольшие собственные значения. Если эти векторы известны из анализа главных компонент (a principal component analysis, РСА), или из экспериментальных данных или из предыдущих расчетов, то их можно использовать в таких протоколах расчета как конформационное затопление (Conformational Flooding) или коллективная динамика (КД, Essential Dynamics, ED). Однако в обоих методах за улучшение сэмплирования приходится платить утратой канонических свойств итоговой траектории.
Недавно разработанный протокол TEE-REX совмещает в себе положительные свойства алгоритма REX с положительными свойствами, возникающими вследствие специфического возбуждения функционально значимых мод (как, например, в КД), в то же время избегает вышеупомянутых недостатков обоих методов. В частности, поддерживается приблизительно каноническая целостность референсного ансамбля и значительно улучшено сэмплирование по главным коллективным модам движения. Таким образом, итоговый референсный ансамбль может быть использован для вычисления равновесных свойств системы, что позволяет провести сравнение с экспериментальными данными.
Хотя в развитии методов улучшенного сэмплирования был достигнут значительный успех, вычислительные тробования методов, основанных на МД, по-прежнему остаются высокими, и вычисления обыкновенно занимают недели и месяцы расчетного времени на современных многопроцессорных кластерах. Однако для многих вопросов в структурной биологии оказывается достаточным просто иметь представление о возможных конформациях белка и его функциональных модах и нет необходимости в детальной информации о характерных временах и энергиях. В этих случаях эластичные модели предлагают простой путь для оценки возможных функциональных движений белка. Хотя при этом делаются значительные упрощения и не получается картины движения на атомарном уровне, предсказанные коллективные движения зачастую оказываются в хорошем качественном согласии с экспериментальными результатами. Другим вычислительно эффективным путем, сохраняющим атомарное представление структуры, является метод CONCOORD, в котором белок описывается посредством геометрических ограничений. На основе плана сборки, полученного из исходной структуры, создается ансамбль структур, который представляет собой исчерпывающее сэмплирование конформационного пространства, возможное при заданных ограничениях. Однако не дается никакой информации о характерных временах и энергиях.
В настоящий момент нет единого метода, готового к повсеместному использованию для предсказания функционально значимых белковых движений на основе пространственной структуры. Однако есть большое число методов, охватывающих различные стороны этой задачи и вносящих вклад в наше понимание функции белков. Таким образом, комбинирование существующих методов станет, вероятно, наиболее прямым путем увеличения предсказательной силы методов in silico.