2007 год в молекулярной биологии вполне можно считать знаковым. После того, как биологи наконец оклемались от потрясения, вызванного полной прочиткой генома человека, оказалось, что дела обстоят еще удивительнее, чем предполагалось. В результате опрокинулось даже новейшее определение гена. Но все по-порядку.
Для начала напомню, в чем же заключался шок от расшифровки человеческого генома.
1. Генов (то есть кодирующих определенный белок участков генома) очень мало. От 25-ти до 30-ти тысяч. Приблизительно столько же, сколько у дрозофилы.
2. Это составляет где-то 25% всего генома.
3. Остальные 75% непонятно что.
наступил после расшифровки генома шимпанзе.
Вывод: отличия нас от обезьяны на уровне ДНК можно пересчитать на пальцах. 75% некодирующего генома все еще непонятно зачем.
И вот стартовал и уже завершился этим летом большой пилотный проект ENCODE (ENCyclopedia Of DNA Elements) с участием сотен ученых из 35 групп. Проанализирован тщательно и дотошно пока всего лишь 1% генома. Выводы ошеломляющие. Во-первых, считывается ВЕСЬ геном. Даже те 75% непонятных некодирующих последовательностей. Более того, куча считывается с перекрыванием на "генные" участки. "Генный" в кавычках, потому что с определением теперь уже довольно сложно. То ген как ген, считывается в виде матричной РНК и кодирует вполне себе приличный белок. То вдруг кусок его считывается вместе с каким-то "мусором" и он уже вдруг не ген, а непонятно что.
Итак, на выходе после считывания всего генома, имеем кучу молекул РНК, которые:
1. кодируют белок, те самые 30 тысяч (интенсивно и успешно изучаются).
2. являются структурными или транспортными молекулами, их не так много (тоже более мене изучены).
3. кодируют так называемые small-RNA и miRNA (только-только начинают изучать. причем здесь уже наметилась явная проблема в различии между "молекулярной функцией" и "биологической ролью". То есть уже представляют, как они работают, но все еще не совсем понятно зачем)
4. ничего не кодируют. Пока их называют условно ncRNA (non-coding). Непонятно зачем они вообще. Зато их количество оценивают... от 40 до 65 тысяч и вполне возможно, что в ближайшем будущем откорректируют число в сторону увеличения. Впрочем уже первые исследования показывают, что роль этой непонятной РНК может быть ошеломляющей. Есть подозрения, что именно она отличает нас от обезьян и играет решающую роль в развитии человеческого мозга.
Дальше все еще хуже. Кристаллография и структурный анализ молекул РНК показал, что наряду с Уотсон-Криковскими парами (ТА и ГС), существуют не Уотсон-Криковские связи (шатающиеся и Хукстена), а также неучтенное раньше водо-и катионно-обменное влияние на структуру, не говоря уже о различных химических модификациях, как метилирование.
Еще вчера казалось, что достаточно хорошенечко изучить взаимодействие этих 30 тысяч генов, как тут же все станет ясно. Конечно же это должно быть нелегко, но если всем вместе напрячься, то объем задач казался вполне выполнимым. Как сегодня уже точно ощущение, что еще не спилив первый замок с первой двери, вдруг в замочную скважину стало отчетливо видно вторую дверь, на которой уже десять замков.
Для начала напомню, в чем же заключался шок от расшифровки человеческого генома.
1. Генов (то есть кодирующих определенный белок участков генома) очень мало. От 25-ти до 30-ти тысяч. Приблизительно столько же, сколько у дрозофилы.
2. Это составляет где-то 25% всего генома.
3. Остальные 75% непонятно что.
наступил после расшифровки генома шимпанзе.
Вывод: отличия нас от обезьяны на уровне ДНК можно пересчитать на пальцах. 75% некодирующего генома все еще непонятно зачем.
И вот стартовал и уже завершился этим летом большой пилотный проект ENCODE (ENCyclopedia Of DNA Elements) с участием сотен ученых из 35 групп. Проанализирован тщательно и дотошно пока всего лишь 1% генома. Выводы ошеломляющие. Во-первых, считывается ВЕСЬ геном. Даже те 75% непонятных некодирующих последовательностей. Более того, куча считывается с перекрыванием на "генные" участки. "Генный" в кавычках, потому что с определением теперь уже довольно сложно. То ген как ген, считывается в виде матричной РНК и кодирует вполне себе приличный белок. То вдруг кусок его считывается вместе с каким-то "мусором" и он уже вдруг не ген, а непонятно что.
Итак, на выходе после считывания всего генома, имеем кучу молекул РНК, которые:
1. кодируют белок, те самые 30 тысяч (интенсивно и успешно изучаются).
2. являются структурными или транспортными молекулами, их не так много (тоже более мене изучены).
3. кодируют так называемые small-RNA и miRNA (только-только начинают изучать. причем здесь уже наметилась явная проблема в различии между "молекулярной функцией" и "биологической ролью". То есть уже представляют, как они работают, но все еще не совсем понятно зачем)
4. ничего не кодируют. Пока их называют условно ncRNA (non-coding). Непонятно зачем они вообще. Зато их количество оценивают... от 40 до 65 тысяч и вполне возможно, что в ближайшем будущем откорректируют число в сторону увеличения. Впрочем уже первые исследования показывают, что роль этой непонятной РНК может быть ошеломляющей. Есть подозрения, что именно она отличает нас от обезьян и играет решающую роль в развитии человеческого мозга.
Дальше все еще хуже. Кристаллография и структурный анализ молекул РНК показал, что наряду с Уотсон-Криковскими парами (ТА и ГС), существуют не Уотсон-Криковские связи (шатающиеся и Хукстена), а также неучтенное раньше водо-и катионно-обменное влияние на структуру, не говоря уже о различных химических модификациях, как метилирование.
Еще вчера казалось, что достаточно хорошенечко изучить взаимодействие этих 30 тысяч генов, как тут же все станет ясно. Конечно же это должно быть нелегко, но если всем вместе напрячься, то объем задач казался вполне выполнимым. Как сегодня уже точно ощущение, что еще не спилив первый замок с первой двери, вдруг в замочную скважину стало отчетливо видно вторую дверь, на которой уже десять замков.
Tags:
no subject
Date: 2007-08-28 08:34 am (UTC)no subject
Date: 2007-08-28 08:47 am (UTC)no subject
Date: 2007-08-28 10:17 am (UTC)В любом случае спасибо за доходчивый ликбез!