![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Сижу разбираюсь с алгоритмами для сбивки де ново секвенирования. Читаю статьи, мало чего смыслю, пробую разобраться. В Nature methods обзор алгоритмов и что я вижу? Ссылаются на википедию! А вы говорите!
Черт, кто мне может в терминологии, приближенной к олигофренам, объяснить разницу между
1. SOAPdenovo (Bruijn graph short read Assembler) пайплайн
2. TGICL c встроенным CAP3 assembler,
3. также особенности ассемблера MIRA.
Черт, кто мне может в терминологии, приближенной к олигофренам, объяснить разницу между
1. SOAPdenovo (Bruijn graph short read Assembler) пайплайн
2. TGICL c встроенным CAP3 assembler,
3. также особенности ассемблера MIRA.
no subject
Date: 2011-06-06 02:00 pm (UTC)Если не секрет, зачем вам алгоритмы multi-alignment-а ? Вы планируете использовать (или уже используете) new generation sequencing в вашем research-е, или просто интересно ?
У нас (по-работе) все цепи днк получены Sanger-ом (electropherogram), но некоторые клиенты планируют начать секвенсировать новыми сиквенсерами (типа Illumina..). Для нас в этом много челенджа, начиная с того, как записать столько данных (надо переделывать модель данных), кончая именно проблемой построения одного (или нескольких) "цепей-конценсуса".
no subject
Date: 2011-06-06 02:04 pm (UTC)no subject
Date: 2011-06-06 02:19 pm (UTC)У нас assembly часто делается "вручную" (особенно в приложениях, где каждая мутация важна, типа донорские анализы HLA, иногда в HIV drug resistance). Там оператор видит электроферограммы, видит alignment и вручную его "подкручивает". Но всё это возможно только когда есть десяток цепей, а не несколько сотен.
У нас сделали вывод, что для рутинных анализов new generation sequencing ещё не достаточно развит.
no subject
Date: 2011-06-06 04:13 pm (UTC)no subject
Date: 2011-06-07 09:28 am (UTC)no subject
Date: 2011-06-07 04:10 pm (UTC)Мирой мои данные прилично собрались, но сама программа, гм, не для средних умов. Поэтому собирала не я, а отдельный биоинформатик :)
CAP3 я сама пользовалась, вполне успешно, но имхо, на 454 данных он затребует слишком много памяти (он был сделан лет 20 назад, для сэнгеровских данных).
А чего Newbler не попробовать? Он достаточно простой и родной для 454.
Кстати, вот: http://www.biomedcentral.com/1471-2164/11/571