Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014
Сравнительное моделирование структуры белков
Этапы сравнительного моделирования структуры белков
Построение модели
При обсуждении этапа построения модели в сравнительном структурном моделировании полезно выделить две части: моделирование с использование шаблона и моделирование без использования шаблона. Такое разделение необходимо, поскольку определенные участки мишени должны строиться без использования шаблонов. К таким участкам относятся разрывы в последовательности шаблона при выравнивании мишени по шаблону. Моделирование этих областей обычно называют проблемой моделирования петель. Очевидно, что эти петли отвечают за большинство характерных отличий мишени от шаблона, и поэтому именно они определяют структурные, а следовательно, и функциональные различия. В отличие от петель, оставшаяся часть мишени, в частности ядро с консервативной упаковкой, строится с использованием структурной информации о шаблоне. Сначала мы рассмотрим некоторые основные подходы из этой последней части - моделирования с использованием шаблона. Этот способ также является первым логичным шагом при построении модели, поскольку моделирование с использованием шаблона обеспечивает структурный каркас для любого последующего моделирования петель.
3.2.4.1. Моделирование с использованием шаблона
Моделирование посредством сборки твердых тел
Первый в сравнительном моделировании и все еще широко использующийся подход состоит в том, что модель создается на основе небольшого числа твердых тел, которые получают при выравнивании с шаблонами белковых структур (Blundell et al. 1987; Browne et al. 1969; Greer 1990). Такой подход основан на естественном разбиении белковой структуры на консервативные области ядра, соединяющие их петли с высокой изменчивостью и боковые цепи, обрамляющие основную цепь белка (Topham et al. 1993). Подход используется в широко распространенной программе COMPOSER (Sutcliffe et al. 1987). Точность модели можно несколько повысить, если использовать более одного структурного шаблона для построения каркаса, а также если усреднить шаблоны с учетом их весов, определенных на основе сходства их последовательностей с последовательностью мишени (Srinivasan and Blundell 1993).
Моделирование посредством сопоставления сегментов или реконструирования координат
Большинство существующих гексапептидных сегментов белковых структур с помощью процедуры кластеризации можно объединить лишь в 100 структурно различных классов (Unger et al. 1989). Это обстоятельство составляет теоретическую основу метода преобразования координат. Используя информацию о положении атомов в структурах шаблонов, определяя и собирая короткие полноатомные сегменты, можно построить структурные модели исследуемых белков. Положения атомов, которые обычно используются в этом методе, соответствуют положениям Са-атомов сегментов, которые при выравнивании структуры шаблона и последовательности мишени являются консервативными. Такие полноатомные сегменты можно получить либо в ходе сканирования всех известных белковых структур, в том числе, не связанных с моделируемой последовательностью (Claessens et al. 1989; Holm and Sander 1991), либо в ходе конформационного поиска, который ограничен энергетической функцией (Bruccoleri and Karplus 1990; van Gelder et al. 1994). Так, в общем методе моделирования на основе сопоставления сегментов (SEGMOD) (Levitt 1992) положения некоторых атомов (обычно Са-атомов) используются для поиска по репрезентативной базе данных всех известных белковых структур. С помощью этого метода можно моделировать главную цепь, боковые цепи и разрывы. Некоторые методы моделирования боковых цепей (Chinea et al. 1995), а также группу методов моделирования петель, основу которых составляет обнаружение подходящих фрагментов в базах данных известных структур, (T.A.Jones and Thirup 1986) можно рассматривать как методы сопоставления сегментов и реконструирования координат.
Моделирование посредством удовлетворения пространственным ограничениям
В методах этой группы на начальном этапе для последовательности мишени устанавливается множество структурных ограничений. Для этого используется выравнивание мишени с родственными белками. По концепции процедура близка методу определения белковых структур на основе ограничений, установленных в экспериментах ЯМР. Ограничения обычно устанавливают, используя допущение, согласно которому соответствующие расстояния между остатками структур мишени и шаблона в процессе выравнивания одинаковы. Эти основанные на гомологии ограничения обычно дополняются стереохимическими ограничениями - длин связей, углов связей, двугранных углов, а также невалентных атомных контактов - которые устанавливаются с использованием молекулярно-механических силовых полей (Brooks et al. 1983). Затем в процессе минимизации нарушений всех ограничений строится модель. Минимизировать нарушения можно либо средствами метрической геометрии, либо путем оптимизации в вещественном пространстве. Так, изящным методом метрической геометрии является построение полноатомных моделей с использованием нижних и верхних границ для расстояний и двугранных углов (Havel and Snow 1991). Предпринимались дальнейшие попытки применения метрической геометрии в сравнительном моделировании, например, (Aszodi and Taylor 1996), однако в обсуждаемой области исследований преобладают более успешные, хотя и более консервативные подходы к моделированию в вещественном пространстве. Возможно, это связано с тем, что эволюция также оказалась весьма консервативна в сохранении структурных особенностей различных белков (Kihara and Skolnick 2003).
Сравнительное моделирование на основе критерия удовлетворения пространственным ограничениям применяется в компьютерной программе MODELLER (Fiser and Sali 2003a; Sali and Blundell 1993), которая в настоящее время является самой популярной программой компьютерного моделирования. На первом этапе построения модели на расстояния и двугранные углы последовательности мишени налагаются ограничения, полученные в ходе выравнивания мишени относительно пространственных структур шаблонов. Характер этих ограничений определяется с помощью статистического анализа связей между близкими белковыми структурами. В ходе сканирования базы данных выравниваний создаются таблицы, количественно отражающие различные взаимосвязи между белками, такие как корреляции между двумя эквивалентными расстояниями Са-Са или двугранными углами главной цепи двух близких белков (Sali and Blundell 1993). Эти взаимосвязи представляются затем в виде условных функций плотности вероятности и могут использоваться непосредственно в качестве пространственных ограничений. Например, вероятность различных значений двугранных углов основной цепи рассчитывается с учетом типа рассматриваемого остатка, конформации главной цепи и соответствующего остатка шаблона и степени сходства последовательностей двух белков. Важная особенность метода состоит в том, что форма пространственных ограничений определяется эмпирически на основе информации из баз данных выравниваний белковых структур и не содержит субъективных пользовательских допущений. Наконец, в результате оптимизации целевой функции в пространстве декартовых координат создается модель. Оптимизация выполняется с использованием метода переменной целевой функции (Braun and Go 1985), в котором, в свою очередь, применяются методы сопряженного градиента и молекулярной динамики с имитацией отжига (Gore et al. 1986).
Сходные принципы заложены и в программный пакет NEST, с помощью которого можно строить модели по гомологии на основе одиночного выравнивания последовательности по шаблону или с использованием нескольких шаблонов. Метод также позволяет рассматривать различные структуры для различных участков мишени (Petrey et al. 2003).
Сочетание выравниваний и сочетание структур
Часто бывает сложно выбрать лучшие шаблоны или определить хорошее выравнивание. В таких случаях улучшить качество сравнительной модели можно за счет многократного повторения процесса отбора шаблонов, выравнивания и построения модели с использованием различных методов оценки моделей. Такое повторение можно продолжать до тех пор, пока не перестанет наблюдаться улучшение качества модели (Fiser et al. 2003; Guenther et al. 1997). Совсем недавно такие бессистемные подходы, требующие выполнения вручную, были автоматизированы (Petrey et al. 2003). Так, был представлен автоматизированный метод, в котором оптимизируются как выравнивание, так и предполагаемая модель (John and Sali 2003). Эта задача решается с применением протокола генетического алгоритма. На начальном этапе предполагается серия первичных выравниваний, за ними следуют многократные повторные выравнивания, построение модели и ее оценка. Целью является улучшение окончательной оценки модели. В ходе повторяющегося процесса с использованием нескольких процедур, таких как мутации и скрещивания выравниваний, создаются новые выравнивания; строятся соответствующие этим новым выравниваниям сравнительные модели, которые затем оцениваются по различным критериям, зависящим отчасти от атомного статистического потенциала. В другом методе генетический алгоритм применялся к шаблонам и выравниваниям, созданным автоматически. Для оценки полученных пробных сочетаний использовалась относительно простая оценочная функция, зависевшая от структуры. Несмотря на некоторые ограничения, показано, что метод устойчив к ошибкам выравнивания и успешно упрощает задачу отбора шаблонов (Contreras-Moreira et al. 2003).
Еще одной попыткой оптимизировать процедуру выравнивания мишени по шаблону является сервер Roberta, где выравнивания создаются с помощью динамического программирования при использовании оценочной функции, в которой сочетается различная информация о белковых свойствах, в том числе последние данные о том, насколько важна та или иная область последовательности для укладки белка. В ходе систематических изменений вклада различных свойств белка в оценку выравнивания создаются очень большие ансамбли различных выравниваний. Для отбора лучших моделей из ансамбля применялись разнообразные подходы, в том числе сочетание выравниваний, степень гидрофобной заглубленности, энергетические функции низкого и высокого разрешения и сочетание этих методов (Chivian and Baker 2006).
В рамках описанных метасерверных подходов осуществляются не только оценка и классификация различных моделей, полученных с помощью множества методов, но также дальнейшая их комбинация. Эти подходы можно также рассматривать в качестве методов исследования выравнивания и конформационного пространства данной последовательности мишени (Kolinski and Bujnicki 2005).
Еще одна альтернатива сложным серверам - программа М4Т. Для М4Т характерно наличие специфической внутренней оценочной функции, которая учитывает главным образом свойства структурного окружения шаблонов. С помощью этой функции автоматически определяются лучшие шаблоны, исследуются и оптимальным образом сращиваются альтернативные выравнивания (Femandez-Fuentes et al. 2007b).
Метасерверы
В последнее время были разработаны метасерверные подходы, в которых используется множество существующих программ. В метасерверах осуществляется отбор моделей, созданных с помощью других методов, затем модели либо используются в качестве входных данных для создания новых моделей, либо рассматриваются в ходе поиска консенсусных решений. Например, в FAMS-ACE (Terashi et al. 2007) входные данные других серверов используются как стартовые точки для улучшения и перестройки, после чего для отбора наиболее точных решений используется Verify3D (Eisenberg et al. 1997). Еще одним консенсусным подходом является PCONS - метод на основе нейронной сети, в котором консенсусная модель создается путем сочетания информации о точности и структурных сходствах моделей, полученных другими методами (Wallner et al. 2007). В 3D-JURY используется та же идея; основу отбора составляет согласованность сходства модельных структур (Ginalski et al. 2003).
3.2.4.2. Моделирование без использования шаблона: моделирование петель и вставок
В сравнительном моделировании последовательности мишени часто содержат остатки-вставки, которых нет в структурах шаблонов, или области, которые структурно отличаются от соответствующих областей шаблонов. Таким образом, из структур шаблонов нельзя получить информацию об этих сегментах-вставках. Такие области часто соответствуют петлям на поверхности. Петли обычно играют важную роль при определении функциональной специфичности данного белкового каркаса, образуя функциональные участки, такие как области, определяющие комплементарность антителам (Rudolph et al. 2006), участки связывания лигандов (например, АТФ (Saraste et al. 1990), кальция (Grabarek 2006) и НАД(Ф) (Lesk 1995)), участки связывания ДНК (Tainer et al. 1995), активные центры ферментов (например, серин-треониновых киназ (Johnson et al. 1998) или аспарагиновых протеаз (Wlodawer et al. 1989)). Точность моделирования петель - главный фактор, определяющий, насколько полезным окажется сравнительное моделирование в применении, например, к локированию лигандов или аннотированию функций (рис. 3.2). Моделирование петель можно рассматривать как миниатюрную проблему сворачивания белка, поскольку правильную конформацию данного сегмента полипептидной цепи требуется рассчитать главным образом на основе последовательности самого сегмента. Однако петли в большинстве своем имеют небольшой размер и не содержат достаточной информации о своей локальной укладке. (Исключение составляют случаи, когда в наличии имеется большое количество фрагментов известной конформации, соответствующих петлям по последовательности.) С другой стороны, окружение каждой петли уникальным образом определяется растворителем и белком, который обрамляет петлю. Для нескольких редких случаев показано, что даже идентичные по последовательности декапептиды в различных белках могут иметь различную конформацию (Femandez-Fuentes and Fiser 2006; Mezei 1998).
Рис. 3.2. (Цветную версию рисунка см. на вклейке.)
Примеры петель (показаны желтым), которые отвечают за функциональную специфичность белковых надсемейств. Слева направо: флаводоксин, иммуноглобулин, нейроамидаза из белковых семейств с укладкой a+ß бочонка, иммуноглобулина и антипараллельного ß-бочонка соответственно
Существует две основные группы методов моделирования петель: 1) подходы на основе поиска по базам данных, в рамках которых осуществляется поиск сегмента, соответствующего якорной области ядра, в базе данных всех известных белковых структур (Chothia and Lesk 1987; Jones and Thirup 1986); 2) подходы на основе конформационного поиска (Bruccoleri and Karplus 1987; Moult and James 1986; Shenkin et al. 1987). Существуют также методы, которые сочетают в себе названные подходы (de Bakker et al. 2003; Deane and Blundell 2001; van Vlijmen and Karplus 1997).
Моделирование петель, основанное на фрагментах
Моделирование на основе сканирования базы данных и поиска фрагментов является точным и эффективным методом моделирования петель, если используемая база данных содержит специфические петли того же класса, что и моделируемая петля. Так, применение метода эффективно при моделировании ß-шпилек (Sibanda et al. 1989) и петель специфических типов укладки, например, гипервариабельных областей в укладке иммуноглобулина (Chothia et al. 1989). Ранее представлялось маловероятным, что область исследований, связанная с созданием банков данных структур, когда-либо достигнет такого уровня развития, при котором подходы на основе фрагментов станут эффективным способом моделирования петель (Fidelis et al. 1994). Это привело к тому, что, начиная с 2000-ых годов, стремительно развивались методы конформационного поиска. Тем не менее, в последнее десятилетие были успешно исследованы многие уголки вселенной белковых структур, в связи с чем было экспериментально определено большое количество новых способов укладки, что в свою очередь оказало существенное влияние на количество известных структурных фрагментов. Последние исследования показали, что петлевые фрагменты не только полно представлены в современных банках данных структур - их более короткие сегменты, вероятно, уже полностью изучены (Du et al. 2003).
Сообщалось, что сегменты последовательностей размером до десяти остатков имеют близкий (т.е., не менее чем на 50% идентичный) сегмент известной конформации в базе данных PDB. Несмотря на шестикратное увеличение количества последовательностей в банках данных и удвоение PDB с 2002 года, не было обнаружено ни одного сегмента последовательности, который имел бы менее чем 50%-ную идентичность с уже известными последовательностями, а в PDB не появилось ни одной уникальной конформации петли. Это свидетельствует о том, что в области секвенирования белков продолжает циркулировать ряд уже известных коротких структурных сегментов. Все сегменты последовательностей размером 10-12 остатков имеют по крайней мере один соответствующий структурный сегмент, который имеет по меньшей мере 50% идентичности, что подтверждает структурное сходство. Исключение составляет очень небольшая группа сегментов, упомянутых выше (Femandez-Fuentes and Fiser 2006). Как следствие, в последнее время были предприняты новые попытки классифицировать конформации петель с использованием более общих категорий, тем самым распространяя применимость подхода поиска по базам данных на более широкий круг случаев (Femandez-Fuentes et al. 2006а; Michalsky et al. 2003). В одной из последних работ описаны преимущества использования профилей последовательностей СММ при классификации и предсказании петель (Espadaler et al. 2004). В другой недавно опубликованной работе для интересующей исследователя петли сначала делается предсказание конформации на основе последовательности, после чего осуществляются структурные выравнивания предсказанных структурных фрагментов относительно небольшого количества структурных шаблонов петель. Эти выравнивания последовательности петли относительно шаблонов затем количественно оцениваются с использованием модели искусственной нейронной сети, обученной на наборе предсказаний с известными результатами (Peng and Yang 2007).
ArchPred является, возможно, наиболее точным методом моделирования петель на основе баз данных. Подход коротко описан в работе (Fernandez-Fuentes et al. 2006a, b). В ArchPred используется иерархическая многомерная база данных, которая была создана для классификации около 300000 фрагментов петель и элементов вторичной структуры, располагающихся по флангах петель. Помимо длины петель и типов окружающих петли вторичных структур, база данных содержит четыре внутренние координаты - расстояние и три типа углов, - которые описывают геометрию соединительных областей (Oliva et al. 1997). В ходе поиска отбор фрагментов из библиотеки осуществляется на основе соответствия длины, типов окружающих вторичных структур и удовлетворения геометрическим ограничениям для соединений, после чего фрагменты встраиваются в каркас изучаемого белка, а затем степень их соответствия оценивается по СКО соединительных областей и числу наталкиваний твердых тел на окружающие атомы белка. На последней стадии отобранные петли оцениваются с использованием стандартизованной оценки, которая содержит информацию о подобии последовательностей и вероятных значениях предсказанных и наблюдаемых двугранных углов φ/ψ главной цепи белка. Для каждой длины петли установлены границы достоверности стандартизованной оценки, определяющие те фрагменты, предсказание которых является более качественным, чем полученное с помощью метода ab initio. Программной реализацией метода является веб-сервер, который как и производит расчеты, так и выполняет регулярное обновление библиотеки фрагментов. Предсказанные сегменты возвращаются в виде выходных данных или, по желанию, могут быть дополнены боковыми цепями, а затем подвергнуты отжигу в окружении исследуемого белка с использованием минимизации методом сопряженных градиентов.
Таким образом, последние сообщения о том, что конформации петель теперь более полно представлены в PDB, свидетельствуют, что методы на основе баз данных ограничиваются способностью распознавать соответствующие фрагменты, и причина этого кроется не в отсутствии сегментов, как полагали ранее.
Моделирование петель ab initio
Для преодоления ограничений, которые характерны для методов поиска по базам данных, были разработаны методы конформационного поиска. Существует множество таких методов, в которых используются различные способы представления белков, термы целевой функции и алгоритмы оптимизации или количественного учета. Стратегии поиска включают метод минимальных возмущений (Fine et al. 1986), моделирование методом молекулярной динамики (Bruccoleri and Karplus 1987), генетические алгоритмы (Ring and Cohen 1993), методы Монте-Карло и имитации отжига (Abagyan and Totrov 1994; Collura et al. 1993), одновременный поиск множественных копий (Zheng et al. 1993), оптимизация в самосогласованном поле (КоеЫ and Delarue 1995) и количественный учет на основе теории графов (Samudrala and Moult 1998). Предсказание петель с помощью оптимизации можно применять как при одновременном моделировании нескольких петель, так и для петель, взаимодействующих с лигандами - ни одна из этих задач не имела простого решения в методах поиска по базам данных, где собраны фрагменты из несвязанных структур в различных окружениях.
В модуле MODLOOP программы MODELLER применяется подход на основе оптимизации (Fiser et al. 2000; Fiser and Sali 2003b). Оптимизация петель в MODLOOP основана на сопряженных градиентах и молекулярной динамике с имитацией отжига. Псевдофункция энергии содержит множество термов, в том числе некоторые термы из молекулярно-механического силового поля CHARMM-22 (Brooks et al. 1983) и пространственные ограничения, в основу которых положения распределения расстояний (Melo and Feytmans 1997; Sippl 1990) и двугранных углов в известных белковых структурах. Для исследования проблем сравнительного моделирования процедура моделирования петель была оптимизирована с последующей оценкой качества. Использовалось большое количество петель известной структуры как в природном, так и в лишь приблизительно верном окружениях. Производительность метода позднее была улучшена за счет использования молекулярно-механического силового поля CHARMM и обобщенного потенциала сольватации Борна (Fiser et al. 2002). Включение потенциалов сольватации в оценочную функцию было ключевым вопросом нескольких работ, появившихся позже (Das and Meirovitch 2003; de Bakker et al. 2003; DePristo et al. 2003; Forrest and Woolf 2003). Повышение точности предсказания петель стало результатом включения в оценочную функцию потенциала, близкого к энтропии, “энергии колонии”, который был разработан при сравнении геометрий и кластеризации отобранных конформаций петель (Fogolari and Tosatto 2005; Xiang et al. 2002). Постоянное совершенствование оценочных функций способствует улучшению качества методов моделирования петель. Недавно были представлены две процедуры моделирования петель, использующие эффективные статистические парные потенциалы, которые кодируются в DFIRE (Soto et al. 2008; Zhang et al. 2004). Еще один метод разработан для предсказания петель очень большой длины и использует подход ROSETTA, в котором по сути выполняется мини-упаковка сегментов петель (Rohl et al. 2004). В программе Prime выполняется процедура создания большого количества петель на основе двугранных углов, после чего следуют повторяющиеся циклы кластеризации, оптимизация боковых цепей и полная минимизация энергии отобранных структур петель с использованием полноатомного молекулярно-механического силового поля (OPLS) с неявно заданным растворителем (Jacobson et al. 2004).
3.2.4.3. Уточнение моделей
Сравнительные модели строятся с использованием лучшего из доступных наборов ограничений. Такой набор обычно представляет собой сочетание ограничений на расстояния и углы, определенных на основе различных структурных шаблонов, потенциалов молекулярно-механического силового поля и ограничений, налагаемые различными статистическими потенциальными функциями. Из-за большого количества доступных ограничений проблему можно назвать переопределенной. Этап построения модели является относительно простым и в первую очередь направлен на решение конфликта ограничений. В случае программы MODELLER эта цель достигается за счет сочетания минимизации методом сопряженных градиентов и молекулярной динамики. Для создания модели обычно требуется несколько минут. Из-за преобладания ограничений на основе шаблонов часто сложно создать модель, на уровне основной цепи белка больше похожую на мишень, чем на фактический шаблон (если принято допущение о том, что выравнивание не содержит ошибок). Сложной задачей является также дальнейшее уточнение модели, поскольку наиболее точные ограничения и потенциалы силовых полей уже были использованы при построении модели. По сути, возникает та же проблема, что и при моделировании ab initio, так как любые уточнения на этом этапе должны осуществляться без использования шаблона. Различные исследования и последние обзоры показывают, что большинство усовершенствований снижает точность моделей (Summa and Levitt 2007). Существовала лишь одна молекулярно-механическая энергетическая функция, которая улучшала исходную модель, однако улучшения были очень незначительными; с помощью статистических потенциалов также удавалось достичь очень небольшого повышения производительности.
В других перспективных методах уточнения моделей предпринимаются попытки разумно ограничить пространство конформационного поиска вокруг высококачественной исходной модели. Этого можно достичь путем простого определения максимального отклонения, которое допускается для смещений основной белковой цепи при отборе моделей (Kolinski et al. 2001). В последнее время появился еще один перспективный подход, в рамках которого определяется подпространство эволюционной и колебательной гармоник. Это сокращенное подпространство, которое состоит из сочетания эволюционно предпочтительных направлений, определяемых главными компонентами структурных вариаций в гомологичном семействе, и топологически предпочтительных направлений, полученных из анализа низкочастотных нормальных мод колебательной динамики - до 50 измерений. Такое подпространство является достаточно точным - настолько, что ядра большинства белков можно представить с точностью 1 Å, и достаточно сокращенным - настолько, что можно применять эффективные методы оптимизации, например, метод моделирования Монте-Карло с обменом репликами (Han et al. 2008; Qian et al. 2004).
3.2.4.4. Моделирование белков и комплексов с дополнительными, экспериментальными, ограничениями
В некоторых методах сравнительного моделирования могут использоваться ограничения, полученные не на основе структуры гомологичного шаблона, а из других источников. Так, основу ограничений могут составлять правила упаковки вторичной структуры (Cohen et al. 1989), данные анализа гидрофобности (Aszodi and Taylor 1994) и коррелированных мутаций (Taylor and Hatrick 1994), эмпирические потенциалы средней силы (Sippl 1995), эксперименты с использованием ядерного магнитного резонанса (Sutcliffe et al. 1992) или эксперименты по химическому перекрестному сшиванию, спиновому и фотоаффинному мечению (Orr et al. 1998), водородно-дейтериевый обмен в сочетании с масс-спектрометрией (Xiao et al. 2006), отслеживание гидроксильных радикалов (Kiselar et al. 2003), флуоресцентная спектроскопия, реконструкция изображений в электронной микроскопии (Topf et al. 2008), сайт-специфический мутагенез (Boissel et al. 1993) и т.д. Таким образом, сравнительную модель, особенно в сложных случаях, можно улучшить, добившись согласованности модели с доступными экспериментальными данными и более общими представлениями о структуре белка.
В прошлом основу сравнительного моделирования составляли сведения о шаблоне и статистические ограничения, разработанные на основе информации об известных белковых структурах и последовательностях. Однако ожидается, что с развитием крупномасштабных генетических методов и методов протеомики будет расти количество экспериментально установленных ограничений, доступных для автоматического включения в процесс моделирования. Помимо создания более точных моделей, это значительно поспособствует моделированию белковых комплексов и ансамблей.
Системный подход к моделированию больших белковых комплексов с помощью экспериментальных ограничений был разработан при моделировании комплекса ядерной поры - самого большого из известных комплексных белков клетки, который состоит из 456 белков (Alber et al. 2008). В подходе используется различная экспериментальная информация. Например, стехиометрия была определена с помощью количественного иммуноблоттинга; с помощью гидродинамических экспериментов удалось получить информацию о форме и исключенном объеме каждого нуклеопорина; иммунная электронная микроскопия (ЭМ) способствовала грубому определению локализации нуклеопоринов; на основе аффинной очистки был определен состав комплексов; анализ крио-ЭМ и биоинформатики выявил локализацию трансмембранных сегментов; в экспериментах с использованием наложения была получена информация о прямых парных взаимодействиях. Все эти входные данные были интегрированы в иерархический процесс, который объединял сравнительное моделирование, протягивание, методы жесткого и подвижного докинга. Конечной целью интеграции данных является преобразование всей доступной экспериментальной информации в пространственные ограничения, которые смогут направлять обобщенную процедуру моделирования. Процесс является гибким, что позволяет сочетать различные формы представлений, уровни разрешения (например, атомы, атомистические модели белков, элементы симметрии или целые ансамбли) и процедуры оптимизации (Alber et al. 2007а, b, 2008). В этом и близких к этому методах будут совместно использоваться результаты экспериментов по секвенированию генома, данные функциональной геномики, протеомики, системной биологии и структурной биологии.