Код ДНК сложнее, чем бинарный код программирования?

Ведь аденин = тимин, а цетозин = гуанин.

ФилософияМатематикаГенетика

Баглан

9 февраля 2019 · 3,7 K

Александр Табакаев

Провизор, лекарствовед, либертарианец и просто добрый русский человек · 20 мар 2019

Генетический код сложнее, разнообразнее и компактнее двоичного!

Во-первых, почему ваша формулировка «аденин = тимин, цитозин = гуанин» неверна — потому что аденин ≠ тимин и цитозин ≠ гуанин, это четыре разных азотистых основания. Да, они соответствуют друг другу по принципу комплементарности в соединяющихся цепочках, но это не значит, что они идентичны друг другу по структуре или функции. Комплементарность нужна для сохранения и передачи данных.

Цепочка ДНК двойная и на противоположных участках содержит соотнесённые азотистые основания для постоянного поддержания структуры и порядка кода, чтобы при любых повреждениях или мутациях одной цепи она могла восстановиться по второй.

К цепочке ДНК подходит только такая цепочка РНК, в которой все азотистые основания соответственно противопоставлены (аденин ДНК — урацил РНК, тимин ДНК — аденин РНК, цитозин ДНК — гуанин РНК, гуанин ДНК — цитозин РНК), потому что, с одной стороны, все мы знаем, что два одинаково заряженных магнита отталкиваются, и здесь работает примерно то же (поэтому должны быть противоположные основания, а не такие же), а с другой стороны, ключ должен идеально подходить к замку, чтобы провзаимодействовать с ним, и здесь работает примерно то же (поэтому должны быть именно противоположные основания, а не какие угодно другие).

Во-вторых, что вообще кодирует ДНК? ДНК кодирует синтез белка. После того как РНК считала информацию с неприкосновенной ДНК, эта РНК передаёт информацию другим РНК, которые, в свою очередь, плывут на рибосомы, где по этим данным синтезируются белки. Белки синтезируются из аминокислот. Мажорных аминокислот (самых распространённых) у человека всего 20, то есть белки сложены из 20 аминокислот, в очень-очень разном порядке, очень-очень разной длины, поэтому таково их разнообразие. Так, цепочка из 100 аминокислот (а это белок далеко не большой) может быть представлена более чем десятью в степени 130 (число со 130 нулями) вариантами.

Но азотистые основания — не совсем элементарные единицы кода. Тогда их было бы всего четыре и всё разнообразие кодируемых ДНК белков ограничивалось сложенными из четырёх аминокислот, но это не так, потому что аминокислот попросту больше. Четыре азотистых основания складываются в 64 варианта триплетов (по три азотистых основания), и уже они кодируют аминокислоты (некоторые триплеты кодируют одни и те же аминокислоты, а некоторые кодируют остановку считывания, поэтому триплетов больше, чем мажорных аминокислот).

Самое время сделать оговорку, что четыре (пять, учитывая урацил РНК, заменяющий тимин ДНК) выше обозначенных азотистых основания — не единственные в природе. Они, как и 20 аминокислот, мажорные. Существуют ещё и минорные азотистые основания. К тому же мы говорим только о мажорных аминокислотах! В природе насчитывается до 500 аминокислот. Представьте себе такое разнообразие белков.

Более того, в иммунных клетках возможны и более сложные варианты синтеза белка, когда данные считываются не по порядку, а во всех возможных вариациях, что порождает ещё огромное количество белков иммунной системы.

Генетический код гораздо сложнее двоичного — и гораздо более компактен! — за счёт системы последовательного кодирования:
4+ азотистых основания →
64+ триплета →
20+ аминокислот →
мириады мириад мириад... белков →
невообразимое разнообразие результатов!

Валерий Ильинский

20 мар 2019

Генетический код похож на бинарный, но с тем лишь отличием, что в бинарном коде информация закодирована двумя символами (0 и 1), а в генетическом -- четырьмя (А, Т, Г, Ц). Из этих 4 нуклеотидов состоит спираль ДНК, информация считывается триплетами (то есть 3 подряд идущих нуклеотида кодируют одну аминокислоту при синтезе белка). А ваша часть вопроса про "аденин=тимин и... Читать далее