progenes | Надо же

You're viewing

progenes's journal
Create a Dreamwidth Account Learn More

Reload page in style: site light

Сижу разбираюсь с алгоритмами для сбивки де ново секвенирования. Читаю статьи, мало чего смыслю, пробую разобраться. В Nature methods обзор алгоритмов и что я вижу? Ссылаются на википедию! А вы говорите!

Черт, кто мне может в терминологии, приближенной к олигофренам, объяснить разницу между
1. SOAPdenovo (Bruijn graph short read Assembler) пайплайн
2. TGICL c встроенным CAP3 assembler,
3. также особенности ассемблера MIRA.

Flat | Top-Level Comments Only

From:

jtell.livejournal.com

Привет.

Если не секрет, зачем вам алгоритмы multi-alignment-а ? Вы планируете использовать (или уже используете) new generation sequencing в вашем research-е, или просто интересно ?

У нас (по-работе) все цепи днк получены Sanger-ом (electropherogram), но некоторые клиенты планируют начать секвенсировать новыми сиквенсерами (типа Illumina..). Для нас в этом много челенджа, начиная с того, как записать столько данных (надо переделывать модель данных), кончая именно проблемой построения одного (или нескольких) "цепей-конценсуса".

From:

progenes.livejournal.com

мы секвенируем транскриптомикс. Просеквенировать транскрипты пол-дела. Проблема в том, что различные алгоритмы сбивок в контиги при одних и тех же сиквенсах дают различную картину. Я, как биолог, интерпретирую результаты. Чтобы понять, что и как мне интерпретировать, надо бы прикинуть, где зарыты проблемы эссемблинга. А их, как оказалось, очень много. Практически все в них и упирается.

From:

jtell.livejournal.com

Понятно. Кроме assembly есть ещё ошибки самого секвенсора (например стречи (stretch) А - когда подрят идут "много А", секвенсер иногда добавляет лишние нуклеотиды).

У нас assembly часто делается "вручную" (особенно в приложениях, где каждая мутация важна, типа донорские анализы HLA, иногда в HIV drug resistance). Там оператор видит электроферограммы, видит alignment и вручную его "подкручивает". Но всё это возможно только когда есть десяток цепей, а не несколько сотен.

У нас сделали вывод, что для рутинных анализов new generation sequencing ещё не достаточно развит.

From:

vigna.livejournal.com

А у тебя какие данные, 454 или иллюмина?

From:

progenes.livejournal.com

454

From:

vigna.livejournal.com

Тогда МЫЛО тебе точно не пойдёт, оно для коротких ридов.
Мирой мои данные прилично собрались, но сама программа, гм, не для средних умов. Поэтому собирала не я, а отдельный биоинформатик :)
CAP3 я сама пользовалась, вполне успешно, но имхо, на 454 данных он затребует слишком много памяти (он был сделан лет 20 назад, для сэнгеровских данных).
А чего Newbler не попробовать? Он достаточно простой и родной для 454.
Кстати, вот: http://www.biomedcentral.com/1471-2164/11/571

Flat | Top-Level Comments Only

Profile

progenes

March 2025

S	M	T	W	T	F	S
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Page Summary

Style Credit

Style: Radiant Aqua for Venture by onlyembers

Expand Cut Tags

No cut tags

Page generated Apr. 19th, 2026 11:47 pm

Понятно о непонятном

Надо же

Надо же

no subject

no subject

no subject

no subject

no subject

no subject

Profile

March 2025

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags