progenes | Фигасе. Вот это и я, понимаю, биоинформатики.

Next-Generation Digital Information Storage in DNA

ДНК кодирует 2 бита на нуклеотид или 455 триллиона битов на грамм (16х10²⁰ нуклеотидов. Для сравнения геном человека3,27х10⁹ нуклеотидов длиной) , не ограничена плоским слоем и может все еще читаться тысячелетие спустя, несмотря на деградацию при хранении в неидеальных условиях. Первые попытки сохранять информацию в ДНК были предприняты в 1988 году. Тогда удалось закодировать 7920 битов. Теперь вот новый подход. В этой работе взяли html драфт книжки на 53425 слов, 11 джпегов и 1 джава-скрипт (простите, лень переключать раскладку) и закодировали это все в 54898 штук коротких нуклеотидных кусков, в каждом по 96 битов. Затем это все распечатали на струйном принтере. Нет, ну серьезно. Ну хорошо, почти серьезно. Биочипы делаются по принципу струйных принтеров. Ну как вам это объяснить? Ладно, в следующий раз объясню, как работает Illumina HiSeq. Короче, это все потом обратно прочитали, сложили и раскодировали книжку с картинками.
В отличии от попытки 1988 года, эти авторы закодировали не два, а один бит на нуклеотид: аденин и цитозин - 0, а гуанин или тимин - 1.
В общем у них получилась плотность 5.5 petabits/mm³ at 100x synthetic coverage. По приблизительным подсчетам содержимое интернета помещается на пластинке размером с ноготь на мизинце, а всю информацию, которая есть на Земле, можно закодировать в 4 гр ДНК.

Хороших вам выходных!

Flat | Top-Level Comments Only

From:

sabotagecat.livejournal.com

коды рида-соломона решают

toman-k.livejournal.com

В данном случае - нет, это не очень эффективно. Всё равно чисто технологически нужно многократное дублирование. И вероятное повреждение может накрыть не одну пару оснований, а разом вынести (потерять) целый кусок, целую молекулу. Так что проще тупо многократно дублировать, а вот на издержки кодирования как раз не тратиться. С кодированием вот товарищам уже пришлось в 2 раза расшириться, чтобы, НЯП, не поиметь себе проблем, во-первых, с экстремальным нуклеотидным составом (в конце концов, по технологии прочтения это же надо ПЦРить ещё), во-вторых, с поли-А и поли-что-нибудь-ещё участками, кошмаром почти любого секвенатора, даже *... Вот как раз тут применение каких-то кодов могло бы, пожалуй, помочь обойтись таки меньшими жертвами, чем прямое раздувание сразу в 2 раза. Но именно для избегания проблем состава и гомополимерных кусков, а не для коррекции ошибок, скорее.

S	M	T	W	T	F	S
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Понятно о непонятном

Фигасе. Вот это и я, понимаю, биоинформатики.

Фигасе. Вот это и я, понимаю, биоинформатики.

no subject

no subject

Profile

March 2025

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags