[personal profile] progenes
Все посмотрели уже Аватар? Понравилось? А теперь смотрите сюда и слушайте. Если дело пойдет и дальше так, то фиг вы получите не только клонированных инопланетян, но и людишек даже в ближайшие тыщу лет!

Приблизительно в 2001 году у нас в группе стартовал проект по визуализации развития ячменного семени. Идея заключалась в том, чтобы накрошить семя на тонкие срезы, все заснять и сложить с помощью информатиков в 3D модель. Это программа-минимум. Программа-максимум заключалась в том, чтобы сделать точный анатомический атлас семени и интегрировать в модель места работы определенных генов. Лет пять бодались, получилась убогая картинка, которая не обогатила человечество знаниями ни на йоту. Вот такая.


Взяли на проект нового цитолога и новых информатиков, дали им лазер для нарезки. Накрошили и собрали модель чуток получше. Но показать вам ее я не могу, потому что биологи поссорились с информатиками по поводу на каком сервере вывешивать картинки - у нас в институте, или у них в недружественном университете. Пока не решат, человечество так и не узнает, что там в ячменном семени внутри. Впрочем, ничего нового там тоже не нашли, просто красиво. Я видела.

UPD: оказалось, что самые красивые картинки ньювасюковцы Pattern Recognition Group выложила у нас на сайте: Projects=>Automatic Generation of 3-D and 4-D Models. Выглядит душераздирающе.

Теперь касательно реализации программы-максимум про те гены, которые там работают. Я там каким-то боком, поэтому расскажу, меня прет. Вырезали лазером ткани очень махонькие из этих срезов. Выделили из них РНК и загибридизовали на ячменный чип на котором 43 тысячи генов. Звучит наверное очень красиво и удивительно. Но пока все интеллектуальные силы информатиков брошены на конструирование 3D-эффектов Аватаров, я тут обливаюсь горючими слезами. Я уже вижу, какие генные последовательности включились в этом гребаном семени, я головой и ручками в Экселе посчитала. Но как только я решила посмотреть, что именно это за гены, то тут (цензоред) меня ждало жестокое разочарование. Потому что из всех 43 тыщ генов автоматически определены едва 5%. А остальное 95% неидентифицированное нечто по 60 нуклеотидов длинной. И вот уже вторую неделю я терзаю всемирное биоинформатическое комьюнити в надежде, что может какая биоинформатическая сволочь их когда-то где-то определила, иначе все эти чипы (цензоред)коту под хвост. Мне "пшеничные" спецы смеются гомерически в лицо, потому что у них дела обстоят еще хуже, у них и этой информации нету.

А в это время, в Германии финансирование немецкого кинематографа больше, чем финансирование науки. А бюджет одного голливудского Аватара будет поболе финансирования всей мировой биоинформатики. Поняли? Так что клонированные аватары в ближайшем будущем только в кино.

Date: 2010-01-18 08:35 am (UTC)
From: [identity profile] progenes.livejournal.com
В общем я не сижу сложив руки. Бластить 60ти меры против всего генбанка это ж я весь мусор на них поцепляю. В общем актуальное положение такое: как я и ожидала, существует некий UniGene из которого эти 60ти меры вроде как генерировали. И мне его прислали. Прикол в том, что беглый анализ этого UniGene показал во-первых, повторы (причем точные!). Штук пятсот. Это раз. во-вторых, количество ЕSTs в нем меньше 43 тыщ (ну, допустим нагенерировали по два олига на ген, хотя это еще надо оперделить). И в-третьих, мы таки пробластили 60ти меры против этого UniGenе. Сейчас на выходе у нас около 40 тыщ 100% хитов (скажем, с максимальным score E-value). То есть я уже частично знаю кДНКовые последовательности из которых нагенерировали олиго. На этой неделе будем делать BLASTX2 уже этих сиквенсов, кроме того, коллеги из штатов утверждают, что умеют делать автоматическую аннотацию KEGG и GO. Мой личный опыт говорит, что автоматически корректно аннотируется ну... процентов 20%. GO аннотацию я вообще на дух не переношу. В растительной геномике нет ничего круче MapMan аннотации арабидопсиса http://mapman.gabipd.org/web/guest;jsessionid=E771EB5980DE138DC7C077E2161B03E4.ajp13_mapman_gabipd_org . Так вот, эта аннотация была сделана преимущественно головой. Теперь они предлагают сервис побластить свои EST против арабидопсисной аннотации. Вероятно это будет следующий шаг.

Так вот, у меня вопрос: что еще можно сделать на ниве аннотации?

Date: 2010-01-18 03:46 pm (UTC)
From: [identity profile] igor-t-ru.livejournal.com
найти сoответствующие est по идентификатору не очень сложно даже для 43000
(и никакого бласта)

wget + cкрипт на awk в одну строчку

Пример запроса
http://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?retmax=100000000&db=nucest&term=HV_CEb0009P15f

Date: 2010-01-18 03:49 pm (UTC)
From: [identity profile] progenes.livejournal.com
ну как мне объяснили, там идентификаторы разные. как бы вам так поизящнее показать. а ну ка я сейчас гугл-документы попробую

Date: 2010-01-18 03:52 pm (UTC)
From: [identity profile] progenes.livejournal.com
а ну обратите сюда ваш ясный взор. это кусочек аннотации.
https://spreadsheets.google.com/ccc?key=0ArOK-CLBlg6idDVybllXTlpLN1p4emI3S19lMHI3Snc&hl=de

Date: 2010-01-18 04:04 pm (UTC)
From: [identity profile] igor-t-ru.livejournal.com
А я на google под другим именем
И результат :
We're sorry, .... does not have permission to access this spreadsheet.

надо доступ к документу разрешить

Date: 2010-01-18 04:05 pm (UTC)
From: [identity profile] progenes.livejournal.com
да я вроде уже что-то понажимала и открыла для всех.

Date: 2010-01-18 04:50 pm (UTC)
From: [identity profile] igor-t-ru.livejournal.com
Wow!
Если это примеры описания чипа - то тут есть все!

вторая колонка - est genbank accession
http://www.ncbi.nlm.nih.gov/nucest/BG367398


проблема только с Tigrом
TA42382_4513
TA33198_4513
TA57713_4513
TA57517_4513
TA42198_4513
TA46427_4513
TA34173_4513
TA43230_4513

И на это 5 колонка
A_13_P269158 TA34173_4513 Hv.1414 TC183125

http://www.ncbi.nlm.nih.gov/UniGene/download.cgi?TYPE=1&DIR=Hv&ID=1414&LINE=2&value=Download%20Sequences

Date: 2010-01-18 04:58 pm (UTC)
From: [identity profile] igor-t-ru.livejournal.com
И совсем тяжелый случай
TC170298

http://compbio.dfci.harvard.edu/tgi/cgi-bin/tgi/tc_report.pl?species=14&tc=TC170298&report_type=n

Сколько таких?

Date: 2010-01-18 05:03 pm (UTC)
From: [identity profile] progenes.livejournal.com
Ну таких немного, но толку от них. С какого перепугу там оказалось картофельное ЕСТ. Допустим, есть там какая-то похожесть. А в чем она выражается? Тигровые мы тоже уже достали, хоть и забодались. Но теперь все-равно по новой надо бластить, против протеиных последовательностей, чтобы хоть как-то приблизиться к функции. Иначе как мне их интерпретировать?

Date: 2010-01-18 05:27 pm (UTC)
From: [identity profile] igor-t-ru.livejournal.com
Интерпретация полученной информации дело биологов :) - почему картошка и зачем панда на собаку похожа:)

то есть чистый список est из genbank у вас уже есть?
я правильно понял?

надо бластить - а дальше смотреть на результат

Date: 2010-01-18 05:58 pm (UTC)
From: [identity profile] igor-t-ru.livejournal.com
для поиска протеинов приличный результат получается если бластить est против mrna_refseq - mrna связаны с GenesDB а уж в GenesDB много чего есть

Date: 2010-01-18 05:59 pm (UTC)
From: [identity profile] progenes.livejournal.com
ну спасибо. мы бластитим против своих растительных банков. а то одни мыши с дрозофилами и хьюман получается

Date: 2010-01-18 06:18 pm (UTC)
From: [identity profile] igor-t-ru.livejournal.com
Ну эт как то по детсадовски :) - а отфильтровать хиты по taxid?
я говорю об информации лежащей в GenesDB - если связь с GenesDB можете вытащить из своих баз - ok


EST BG367398

HIT http://www.ncbi.nlm.nih.gov/nuccore/115463078

Gene :
http://www.ncbi.nlm.nih.gov/sites/entrez?db=gene&cmd=Retrieve&dopt=full_report&list_uids=4338353

Date: 2010-01-18 06:21 pm (UTC)
From: [identity profile] progenes.livejournal.com
Эх... родной. шо ж я ручками не соображу как бластить и искать этот АТР транспортер? Но у меня таких статистически достоверных из трех повторов из 6ти стадий насобиралось 18 тыщ. Мне что? поодиночке их смотреть? Это конечно хорошо так смотреть, но очень неправильно неправильно.

Date: 2010-01-18 07:56 pm (UTC)
From: [identity profile] igor-t-ru.livejournal.com
кто ж ручками совсем что-то делает? а программисты на что?
эт так сказать идея былв

Прислали б полный чип или список чистых est я б тоже поигрался -
где побластить 47000 est - найдется -

Profile

progenes: (Default)
progenes

March 2025

S M T W T F S
      1
2345678
9101112131415
1617 1819202122
23242526272829
3031     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 31st, 2026 03:33 pm
Powered by Dreamwidth Studios