Принципы структурной организации белков - Г. Шульц 1982
Предсказание вторичной структуры по аминокислотной последовательности
Вероятностные методы
Склонность остатка встраиваться во вторичную структуру
Простейший подход состоит в рассмотрении каждого остатка отдельно, без учета его ближних или дальних соседей. Простейший, чисто статистический подход был применен Дирксом [338, 339]. Он определил частоту встречаемости каждого из 20 остатков в а-спиралях, ß-структурах и реверсивных поворотах цепей (rt), используя кристаллографические структуры белков. Эти частоты были затем приняты в качестве характеристик, отражающих «склонности остатков встраиваться в a-, ß- и rt-конформации». В качестве примера в табл. 6.2 приведены данные Диркса, касающиеся тенденции остатков встраиваться в ß-структуру.
Для предсказания а- (ß-, rt-) структуры остатка в каждом положении цепи рассчитывался «потенциал* a-(ß-, rt-)y» как средневзвешенное a-(ß-, rt-)-склонностей m ближайших по цепи остатков. Как только потенциал a-(ß-, rt-) превышал некоторое пороговое значение, для остатка предсказывалась a-(ß-, гt-)-конформация. Таким образом, такая потенциальная функция была предназначена для ответа на вопрос — «да» или «нет». Схема определения средневзвешенного фиксировалась. Три пороговые величины, а также значение m были выбраны по наилучшему совпадению предсказанной и наблюдаемой вторичной структуры в исходном наборе. Оптимальные значения т равны 17, 11 и 3 соответственно для a-, ß- и rt предсказаний. Понятие «склонность остатка», имеющее основное значение, и следуемое из него понятие «потенциал остатка» будут использоваться в этой главе именно в определенном выше смысле.
* Термин «потенциал» здесь использован, разумеется, не в физическом, а в более широком смысле. — Прим. ред.
Таблица 6.2 Относительная частота встречаемости остатков в ß-структурах и реверсивных поворотах rta
Склонность к β-структуре |
rt-склонность |
||||||
Чоу и Фасман, 1974 [340] |
Бэджис и сотр., 1974 [31] |
Бегин и Дирке, 1975 [339] |
Льюис и сотр., 1971 [326] |
Кунтц, 1972 [203] |
Чоу и Фасман, 1974 [340] |
||
А |
Ala |
0,97 |
0.29 |
0,37 |
0,22 |
(Т) |
0,15 |
С |
Cys |
1,30 |
0,53 |
0,84 |
0,20 |
0,31 |
|
D |
Asp |
0,80 |
0,27 |
0,97 |
0,73 |
т |
0,33 |
E |
Glu |
0,26 |
0,26 |
0,53 |
0,08 |
т |
0,12 |
F |
Phe |
1,28 |
0,32 |
0,53 |
0,08 |
— |
0,19 |
G |
Gly |
0,81 |
0,31 |
0,97 |
0,58 |
т |
0,45 |
H |
His |
0,71 |
0,20 |
0,75 |
0,14 |
т |
0,18 |
I |
Ile |
1,60 |
0,41 |
0,37 |
0,22 |
— |
0,15 |
К |
Lys |
0,74 |
0,27 |
0,75 |
0,27 |
т |
0,27 |
L |
Leu |
1,22 |
0,40 |
0,53 |
0,19 |
— |
0,14 |
M |
Met |
1,67 |
0,38 |
0,64 |
0,38 |
— |
0,18 |
N |
Asn |
0,65 |
0,23 |
0,97 |
0,42 |
т |
0,45 |
P |
Pro |
0,62 |
0,34 |
0,97 |
0,46 |
т |
0,41 |
Q |
Gln |
1,23 |
0,33 |
0,64 |
0,26 |
т |
0,15 |
R |
Arg |
0,90 |
0,36 |
0,84 |
0,28 |
т |
0,27 |
S |
Ser |
0,72 |
0,35 |
0,84 |
0,55 |
т |
0,41 |
T |
Thr |
1,20 |
0,39 |
0,75 |
0,49 |
т |
0,27 |
V |
Val |
1,65 |
0,50 |
0,37 |
0,08 |
— |
0,08 |
w |
Trp |
1,19 |
0,23 |
0,97 |
0,43 |
— |
0,30 |
Y |
Tyr |
1,29 |
0,43 |
0,84 |
0,46 |
т |
0,33 |
а Наблюдаемые частоты встречаемости использованы в качестве характеристик склонности. В номенклатуре Кунтца Т означает, что соответствующий остаток стремится встраиваться в повороты цепи.
В реверсивных поворотах цепи следует учитывать относительное положение остатка. Информация только об отдельных остатках (синглетах) была использована также для предсказания реверсивных поворотов. Льюис и сотр. [326] определили реверсивные повороты пептидной цепи как фрагменты из четырех остатков i, і + 1, і + 2, і + 3, в которых расстояние между Са-атомами в положениях і и i + 3 меньше 7 Å, а цепь при этом не находится в а-спиральной конформации. Однако в отличие от Диркса четыре положения в повороте не считались эквивалентными. Частоты встречаемости, определенные для каждого остатка в положениях і, і + 1, і + 2 и i + 3, были названы «склонностью данного остатка встречаться в данном месте поворота». rt-Потенциал квартета остатков затем определялся как произведение соответствующих склонностей. Пороговое значение потенциала было установлено по наилучшему совпадению с известными экспериментальными данными (рис. 6.2).
Подобные частоты встречаемости использованы Кроуфордом и сотр. [200] и позднее Чоу и Фасманом [340] для предсказания реверсивных поворотов цепи, идентифицированных согласно данным Льюиса и сотр. [326]. В табл. 6.2 приведены частоты встречаемости, найденные Льюисом и сотр. [326], а также Чоу и Фасманом [340]. Однако чтобы придать таблице компактный вид, в ней перечислены только усредненные значения частот встречаемости остатков в реверсивных поворотах цепей. Для некоторых остатков различия положений заметны: Pro находят почти исключительно в положении і + 1, а Тrр — только в положении і + 3.
Простой подход с использованием синглетных склонностей применили также Птицын и Финкельштейн для а- и ß-предсказаний [341, 342]. По утверждению этих авторов [343] никакой дополнительной информации из встречаемостей пар остатков (дублетов) получить нельзя. Однако это положение спорно, поскольку использованные исходные данные касались всего 9 белков и поскольку разбиение 20 остатков на четыре категории было произведено довольно произвольно.