[personal profile] progenes
Next-Generation Digital Information Storage in DNA

ДНК кодирует 2 бита на нуклеотид или 455 триллиона битов на грамм (16х1020 нуклеотидов. Для сравнения геном человека3,27х109 нуклеотидов длиной) , не ограничена плоским слоем и может все еще читаться тысячелетие спустя, несмотря на деградацию при хранении в неидеальных условиях. Первые попытки сохранять информацию в ДНК были предприняты в 1988 году. Тогда удалось закодировать 7920 битов. Теперь вот новый подход. В этой работе взяли html драфт книжки на 53425 слов, 11 джпегов и 1 джава-скрипт (простите, лень переключать раскладку) и закодировали это все в 54898 штук коротких нуклеотидных кусков, в каждом по 96 битов. Затем это все распечатали на струйном принтере. Нет, ну серьезно. Ну хорошо, почти серьезно. Биочипы делаются по принципу струйных принтеров. Ну как вам это объяснить? Ладно, в следующий раз объясню, как работает Illumina HiSeq. Короче, это все потом обратно прочитали, сложили и раскодировали книжку с картинками.
В отличии от попытки 1988 года, эти авторы закодировали не два, а один бит на нуклеотид: аденин и цитозин - 0, а гуанин или тимин - 1.
В общем у них получилась плотность 5.5 petabits/mm3 at 100x synthetic coverage. По приблизительным подсчетам содержимое интернета помещается на пластинке размером с ноготь на мизинце, а всю информацию, которая есть на Земле, можно закодировать в 4 гр ДНК.

Хороших вам выходных!

Date: 2012-09-14 06:21 pm (UTC)
From: [identity profile] sabotagecat.livejournal.com
коды рида-соломона решают

Date: 2012-09-15 04:09 am (UTC)
From: [identity profile] toman-k.livejournal.com
В данном случае - нет, это не очень эффективно. Всё равно чисто технологически нужно многократное дублирование. И вероятное повреждение может накрыть не одну пару оснований, а разом вынести (потерять) целый кусок, целую молекулу. Так что проще тупо многократно дублировать, а вот на издержки кодирования как раз не тратиться. С кодированием вот товарищам уже пришлось в 2 раза расшириться, чтобы, НЯП, не поиметь себе проблем, во-первых, с экстремальным нуклеотидным составом (в конце концов, по технологии прочтения это же надо ПЦРить ещё), во-вторых, с поли-А и поли-что-нибудь-ещё участками, кошмаром почти любого секвенатора, даже *... Вот как раз тут применение каких-то кодов могло бы, пожалуй, помочь обойтись таки меньшими жертвами, чем прямое раздувание сразу в 2 раза. Но именно для избегания проблем состава и гомополимерных кусков, а не для коррекции ошибок, скорее.

Profile

progenes: (Default)
progenes

March 2025

S M T W T F S
      1
2345678
9101112131415
1617 1819202122
23242526272829
3031     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 6th, 2026 09:48 pm
Powered by Dreamwidth Studios