Все посмотрели уже Аватар? Понравилось? А теперь смотрите сюда и слушайте. Если дело пойдет и дальше так, то фиг вы получите не только клонированных инопланетян, но и людишек даже в ближайшие тыщу лет!
Приблизительно в 2001 году у нас в группе стартовал проект по визуализации развития ячменного семени. Идея заключалась в том, чтобы накрошить семя на тонкие срезы, все заснять и сложить с помощью информатиков в 3D модель. Это программа-минимум. Программа-максимум заключалась в том, чтобы сделать точный анатомический атлас семени и интегрировать в модель места работы определенных генов. Лет пять бодались, получилась убогая картинка, которая не обогатила человечество знаниями ни на йоту. Вот такая.

Взяли на проект нового цитолога и новых информатиков, дали им лазер для нарезки. Накрошили и собрали модель чуток получше. Но показать вам ее я не могу, потому что биологи поссорились с информатиками по поводу на каком сервере вывешивать картинки - у нас в институте, или у них в недружественном университете. Пока не решат, человечество так и не узнает, что там в ячменном семени внутри. Впрочем, ничего нового там тоже не нашли, просто красиво. Я видела.
UPD: оказалось, что самые красивые картинкиньювасюковцы Pattern Recognition Group выложила у нас на сайте: Projects=>Automatic Generation of 3-D and 4-D Models. Выглядит душераздирающе.
Теперь касательно реализации программы-максимум про те гены, которые там работают. Я там каким-то боком, поэтому расскажу, меня прет. Вырезали лазером ткани очень махонькие из этих срезов. Выделили из них РНК и загибридизовали на ячменный чип на котором 43 тысячи генов. Звучит наверное очень красиво и удивительно. Но пока все интеллектуальные силы информатиков брошены на конструирование 3D-эффектов Аватаров, я тут обливаюсь горючими слезами. Я уже вижу, какие генные последовательности включились в этом гребаном семени, я головой и ручками в Экселе посчитала. Но как только я решила посмотреть, что именно это за гены, то тут (цензоред) меня ждало жестокое разочарование. Потому что из всех 43 тыщ генов автоматически определены едва 5%. А остальное 95% неидентифицированное нечто по 60 нуклеотидов длинной. И вот уже вторую неделю я терзаю всемирное биоинформатическое комьюнити в надежде, что может какая биоинформатическая сволочь их когда-то где-то определила, иначе все эти чипы (цензоред)коту под хвост. Мне "пшеничные" спецы смеются гомерически в лицо, потому что у них дела обстоят еще хуже, у них и этой информации нету.
А в это время, в Германии финансирование немецкого кинематографа больше, чем финансирование науки. А бюджет одного голливудского Аватара будет поболе финансирования всей мировой биоинформатики. Поняли? Так что клонированные аватары в ближайшем будущем только в кино.
Приблизительно в 2001 году у нас в группе стартовал проект по визуализации развития ячменного семени. Идея заключалась в том, чтобы накрошить семя на тонкие срезы, все заснять и сложить с помощью информатиков в 3D модель. Это программа-минимум. Программа-максимум заключалась в том, чтобы сделать точный анатомический атлас семени и интегрировать в модель места работы определенных генов. Лет пять бодались, получилась убогая картинка, которая не обогатила человечество знаниями ни на йоту. Вот такая.

Взяли на проект нового цитолога и новых информатиков, дали им лазер для нарезки. Накрошили и собрали модель чуток получше. Но показать вам ее я не могу, потому что биологи поссорились с информатиками по поводу на каком сервере вывешивать картинки - у нас в институте, или у них в недружественном университете. Пока не решат, человечество так и не узнает, что там в ячменном семени внутри. Впрочем, ничего нового там тоже не нашли, просто красиво. Я видела.
UPD: оказалось, что самые красивые картинки
Теперь касательно реализации программы-максимум про те гены, которые там работают. Я там каким-то боком, поэтому расскажу, меня прет. Вырезали лазером ткани очень махонькие из этих срезов. Выделили из них РНК и загибридизовали на ячменный чип на котором 43 тысячи генов. Звучит наверное очень красиво и удивительно. Но пока все интеллектуальные силы информатиков брошены на конструирование 3D-эффектов Аватаров, я тут обливаюсь горючими слезами. Я уже вижу, какие генные последовательности включились в этом гребаном семени, я головой и ручками в Экселе посчитала. Но как только я решила посмотреть, что именно это за гены, то тут (цензоред) меня ждало жестокое разочарование. Потому что из всех 43 тыщ генов автоматически определены едва 5%. А остальное 95% неидентифицированное нечто по 60 нуклеотидов длинной. И вот уже вторую неделю я терзаю всемирное биоинформатическое комьюнити в надежде, что может какая биоинформатическая сволочь их когда-то где-то определила, иначе все эти чипы (цензоред)коту под хвост. Мне "пшеничные" спецы смеются гомерически в лицо, потому что у них дела обстоят еще хуже, у них и этой информации нету.
А в это время, в Германии финансирование немецкого кинематографа больше, чем финансирование науки. А бюджет одного голливудского Аватара будет поболе финансирования всей мировой биоинформатики. Поняли? Так что клонированные аватары в ближайшем будущем только в кино.
Tags:
no subject
Date: 2010-01-12 04:10 am (UTC)Если нужно пробовать разные алгоритмы на одних и тех же данных, то имеет смысл перегнать данные в базу данных для скорости, и играться с запросами на SQL (хотя бы для первичной фильтрации и обработки, с целью уменьшить объём и привести к удобной форме). Результаты можно скормить в тот же Эксель, или, скажем, в программу на каком-нибудь из .NET-языков (в принципе, запросы к БД можно прямо в программе писать, пользуясь LINQ (http://en.wikipedia.org/wiki/Language_Integrated_Query)). Можно, конечно, и Питон или ещё что, но у .NET скорость повыше должна быть.
Если же нужно постоянно анализировать разные данные в одинаковом формате, по одинаковому алгоритму, тогда уже имеет смысл писать отдельную программу. Это уже довольно продвинутый этап, когда эксперимент поставлен на поток и стабильно, в течение многих дней, генерит кучу информации. Если стабильности формата данных и алгоритмов нет, то написание и отладка скриптов может занять не меньше времени, чем анализ ручками.