Основы биоинформатики - Огурцов А.Н. 2013

Основания биоинформатики
Понятие «информация»
Свойства информации

Для рассмотрения динамических открытых систем в настоящее время разрабатывается динамическая теория информации, которая тесно связана с синергетикой. Именно в динамической теории информации используется приведенное выше определение информации, как запомненный выбор одного варианта из нескольких возможных и равноправных (п. 5.1). Такое определение информации позволяет моделировать процессы генерации информации вообще, и предсказывать механизмы зарождения жизни на Земле в частности. Кроме того, оно допускает введение меры - количества информации по Шеннону.

Свойства, присущие всем видам информации, разделяются на две крупные группы, внутри каждой из которых свойства тесно связаны между собой. Для одной группы ключевым свойством является фиксируемость информации (рисунок 36). Для другой группы определяющим свойством является её действенность (рисунок 37). Остальные свойства, входящие в эти группы, можно расценивать как раскрытие, проявление ключевых особенностей в формах, доступных для регистрации.

Фиксируемость информации. Фиксируемость - это свойство, благодаря которому любая информация, не будучи ни материей, ни энергией, может существовать не в свободном виде, а только в зафиксированном состоянии - в виде записи на каком-либо физическом носителе.

Рисунок 36 - Классификация свойств информации относительно её фиксируемости

Способы записи информации на таком носителе всегда условны, то есть не имеют никакого отношения к её семантике (или содержательности). Например, одно и то же предложение может быть записано и на бумаге, и на дискете.

Условность способов фиксации информации означает, что любой из таких способов, никак не связанных с семантикой, тем не менее, однозначно обусловливается двумя факторами, тоже не имеющими отношения к семантике, - физической природой носителя и спецификой считывающего устройства той информационной системы, к которой относится данная информация. Фиксация информации всегда представляет собой деформацию (в той или иной степени) носителя, среднее время релаксации которого должно быть больше среднего времени считывания, что ограничивает способы записи информации на том или ином носителе. В нашем примере на бумагу наносятся чернила, а на дискете происходит намагничивание дорожек на магнитной плёнке.

В группу, "возглавляемую" свойством фиксации, входят также такие свойства, как инвариантность, бренность, изменчивость, транслируемость, размножаемость и мультипликативность информации.

Инвариантность информации по отношению к физической природе её носителей определяется как возможность фиксации информации (записи) на любом языке, любым алфавитом. Ни количество, ни семантика информации не зависят от избранной системы записи или от природы носителя. Инвариантностью определяется возможность осуществлять разные элементарные информационные акты создания, приема, передачи, хранения и использования информации. Именно свойство инвариантности лежит в основе возможности расшифровки генетического кода.

Бренность обусловлена тем, что информация всегда зафиксирована на каком-либо физическом носителе. Поэтому сохранность и само существование информации определяется судьбой её носителя. Свойство бренности позволяет говорить о сроке жизни информации, который зависит от состояния её носителя. Рано или поздно носитель деформируется или разрушается и информация исчезает.

Изменчивость - это свойство информации, ассоциируемое с её бренностью, другими словами, с сохранностью её носителя. Исчезновение информации может происходить не только из-за её разрушения, но и вследствие её изменения при деформации носителя. Под изменчивостью можно понимать такие преобразования, которые затрагивают количество и (или) семантику информации, но не лишают её смысла.

Транслируемость - это свойство, противостоящее бренности информации, это возможность передачи информации с одного носителя на другой, то есть размножение информации. Пусть VP и VГ — средние скорости размножения и гибели информации. Тогда жизнеспособность информации, L, определяется отношением

Если L > 1, число копий записи будет возрастать. При L < 1 данная информация обречена на вымирание, а при L = 1 состояние нестабильно.

Очевидно, ситуация при L > 1 отвечает проявлению свойства размножаемости - прямого следствия транслируемости. В свою очередь, следствием размножения является мультипликативность, то есть возможность одновременного существования одной и той же информации в виде идентичных копий на одинаковых или разных носителях.

Рисунок 37 - Классификация свойств информации относительно её действенности

Действенность информации. Вторая группа свойств информации объединяется ключевым свойством - действенностью (рисунок 37). Это свойство выявляется следующим образом: будучи включённой в свою информационную систему, информация может быть использована для построения того или иного оператора, который может совершать определённые целенаправленные действия. Оператор, таким образом, выступает в роли посредника, необходимого для проявления действенности информации. Нужно отметить, что реализацию информации в оператор нельзя понимать как "материализацию" информации.

Семантика (или содержательность) информации проявляется в специфике кодируемого информацией оператора, причем каждая данная информация однозначно определяет оператор, для построения которого она использована.

Однако природа целенаправленного действия такова, что должна повышаться вероятность воспроизведения информации, кодирующей такое действие. Следовательно, семантика информации всегда отражает условия, необходимые и достаточные для её воспроизведения. Эволюция семантики направлена в сторону улучшения условий воспроизведения информации.

Полипотентность информации проявляется в том, что оператор, закодированный данной информацией, может быть использован для осуществления различных действий (то есть для достижения разных целей). Например, неразборчивые (промискуитетные) ферменты {promiscuous enzymes) помимо своих субстратов могут (хотя и с меньшей эффективностью) также катализировать превращения и других метаболитов.

Это свойство не означает семантической неоднородности информации - семантика любой информации всегда однозначно отображается в операторе. Полипотентность не означает также, что на основании одной и той же информации могут быть созданы несколько разных операторов. Из свойства полипотентности следуют два вывода.

1. Располагая некоторой информацией или созданным на её основе оператором, невозможно перечислить все ситуации и цели, для достижения которых с той или иной степенью вероятности они могут оказаться пригодными (бесконечное множество комбинаций "ситуация - цель"). Таким образом, любая информация и оператор, на ней основанный, всегда могут получить априори не предполагавшиеся применения. Такое непредсказуемое заранее использование информации может подчас оказаться даже более эффективным и ценным, нежели то, для которого она первоначально предназначалась.

2. Для достижения одной и той же цели в некоторой ситуации с тем или иным эффектом может быть использовано множество разных информаций и основанных на них операторов. Это множество всегда будет открытым, так как априори невозможно перечислить все существующие и все возможные информации, а тем более предугадать, какова будет эффективность их использования.

Полезность информации предполагает, что она кому-нибудь нужна, может быть с пользой применена для некоторых целенаправленных действий. На основании свойства полипотентности можно утверждать, что полезной может оказаться любая информация. Это делает оправданным запасание информации "впрок". Таким свойством (памятью) обладают организмы с достаточно высокой организацией.

Полезность - это "потенциальное" свойство, поскольку речь идет о содействии событию, которое ещё не произошло.

Истинность информации - это свойство, которое выявляется в ходе реализации полезности. Критерий истинности - практика. Из свойства полипотентности информации следует относительность её истинности, то есть зависимость от ситуации и цели.

В том случае, когда целью является трансляция информации (что представляет собой достаточно общий случай), истинность оказывается условием существования информации.

Получается, что жизнеспособна только истинная информация. Понятно, что выявление истинности возможно только в том случае, если информация кому-то полезна. А это значит, что для жизнеспособности информации необходимо сочетание её истинности и полезности, то есть "гармония объективного и субъективного аспектов информации, отражаемых этими терминами".

Ценность информации. В математической теории связи не существует вопроса о возникновении ценной информации и её эволюции. В современной динамической теории информации это одно из центральных понятий. При этом имеется в виду, что цель задана извне; вопрос о спонтанном возникновении цели внутри самой системы не ставится.

В основе понятия "ценность" лежат такие свойства информации, как действенность и полипотентность, а также способ исчисления ценности через приращение вероятности достижения той цели, для которой данная информация используется. "Бездеятельная" информация обречена на разрушение и гибель. Как уже говорилось, полипотентность информации соответствует тому, что оператор, являющийся продуктом реализации семантики информации, может быть использован для осуществления самых разных целенаправленных действий. Целенаправленное действие специфично для живых организмов. Имеется в виду переход от "исходной ситуации" к некоторому "заданному" событию (осуществление этого события как "цели" действия) посредством оператора - механизма, применение которого в имеющихся условиях приводит к требуемому результату. Таким образом, целенаправленные действия отличаются от спонтанных изменений только в одном отношении — наличием оператора.

Мерой ценности информации является величина

Где Р - вероятность осуществления события цели в данном пространстве режимов при использовании данной информации; р - вероятность спонтанного (до получения данной информации) осуществления того же события. Р и р, а также С, могут изменяться от 0 до 1.

Ценность информации зависит от априорной вероятности достижения цели до получения информации, то есть от того, какой предварительной информацией уже располагает получатель.

Предварительная осведомлённость называется тезаурусом. Если таковая отсутствует, то априорная вероятность во всех вариантах одинакова и равна (где n - число вариантов).

Отождествление "просто информации" с "ценной" и (или) "осмысленной" является ошибкой и приводит к недоразумениям.

Генерация и рецепция информации. Генерация информации - это выбор варианта, сделанный случайно (без подсказки извне) из многих возможных и равноправных (то есть из принадлежащих одному множеству) вариантов. Если речь идет о возникновении новой информации, то выбор должен быть именно случайным.

Если выбор подсказан на основе уже имеющейся информации, то речь идет не о генерации информации, а о восприятии, рецепции информации. "Запоминаемость" ассоциируется с рецепцией информации.

В работах Н. Винера и К. Шеннона (в статической математической теории информации) процессам рецепции информации практически не уделялось внимания. От рецептора (получателя) требовалась лишь способность отличать один кодовый символ от другого.

С позиций динамической теории информации (для динамических систем) рецепция информации означает перевод системы в одно определённое состояние независимо от того, в каком состоянии она находилась раньше. В современных технических устройствах рецепция, как правило, осуществляется с помощью электрического или светового импульса. Во всех случаях энергия импульса должна быть больше барьера между состояниями.

Переключение за счёт сторонних сил называется силовым.

Другой способ переключения - параметрический. Он заключается в том, что на некоторое (конечное) время параметры мультистабильной системы изменяются настолько, что она становится моностабильной, то есть все состояния, кроме одного, становятся неустойчивыми (или даже исчезают). Система независимо от того, в каком состоянии она находится, попадает в оставшееся устойчивым состояние.

После этого возвращаются прежние значения параметров, система снова становится мультистабильной, но остаётся в том состоянии, в которое она была переведена.

Силовое и параметрическое переключения представляют собой рецепцию информации. Различаются лишь механизмы переключения, то есть рецепции информации.

В электронике предпочтение отдаётся силовому переключению.

В биологических системах преимущественно используется параметрическое переключение, например, между разными конформациями биомакромолекулы, которое может быть достигнуто как неспецифическими факторами - изменением температуры, pH и т. д., так и специфическим связыванием с лигандом-эффектором или поглощением фотона.

В случаях как генерации, так и рецепции способность генерировать или воспринимать зависит от информации, которую уже содержит рецептор или генератор.

Запоминание информации. Начиная с классических работ по теории информации установилась традиция связывать информацию с термодинамической величиной - энтропией. В динамической теории информации представление об информации как негэнтропии признано неверным, при этом существенным является необходимость разграничения понятий макроинформация и микроинформация.

Согласно определению информации, информация есть запомненный выбор, то есть макроинформация. На физическом языке "запомнить", то есть зафиксировать информацию, означает привести систему в определённое устойчивое состояние. Таких состояний должно быть не менее двух. Каждое из них должно быть устойчивым, иначе система может самопроизвольно выйти из того или иного состояния, что равносильно исчезновению информации. Простейшая запоминающая система содержит всего два устойчивых состояния и называется триггер. Этот элемент играет важную роль во всех информационных системах.

Свойством запоминания могут обладать только макроскопические системы, состоящие из многих атомов. Невозможно что-либо запомнить, располагая одним атомом, поскольку атом может находиться лишь в одном (устойчивом) состоянии, это же относится и к простым молекулам.

Наименьшая по своим размерам самая простая система, которая может запомнить только один вариант из двух возможных, - это молекула, способная находиться в двух различных изомерных состояниях, - при условии, что спонтанный переход из одной формы в другую происходит так редко, что его вероятностью практически можно пренебречь.

Примером таких молекул могут служить оптические изомеры, обладающие "правой" и "левой" хиральностью - они различаются по способности содержащих их растворов вращать вправо или влево плоскость поляризации света, пропускаемого через растворы. К таким оптическим изомерам относятся сахара и аминокислоты, содержащие 10-20 атомов. Молекулярными триггерами могут служить макромолекулы (в частности, белковые молекулы), способные существовать в нескольких (по крайней мере, двух) конформационных состояниях.

Биологические системы высокого иерархического уровня (клетка, мозг, организм, популяция) тоже, разумеется, могут быть запоминающими. При этом механизм запоминания не всегда сводится к генетическому (то есть макромолекулярному). Например, клетка (в частности, нервная), способная функционировать в двух и более устойчивых состояниях, уже является запоминающим устройством. Важную роль играет и время запоминания. В устойчивых динамических системах оно, с формальной точки зрения, бесконечно. Триггерное переключение одного состояния на другое возможно лишь за счёт стороннего сигнала, что равносильно рецепции информации. В реальности возможно спонтанное переключение за счёт случайных флуктуаций.

Итак, макроинформация может содержаться только в макрообъектах. Граница между макро- и микрообъектами проходит на уровне макромолекул, размеры которых имеют порядок нанометров.

Что касается микроинформации, то она не обязательно ассоциируется с микрочастицами. Любая незапоминаемая информация - это микроинформация.

В реальной жизни речь всегда идет о макроинформации, которая в частности подразумевается, когда мы говорим об информации в живых системах. Любое изменение макроинформации, увеличение или уменьшение, сопровождается ростом энтропии, что естественно, поскольку эти процессы необратимы. Количественной связи между изменениями макроинформации и физической энтропии не существует.





Для любых предложений по сайту: [email protected]