Получила результаты экспрессионного анализа, секвенирование РНК по методу 454. 48 проб. На выходе увесистый ZIP, в распакованом виде около 300 гигов (но я все еще не распаковала), а это уже около 2000 (2 тыщ) штук разнообразных файлов, преимущественно Excel, которые при открытии весело сообщают, что ячейки в таблице закончились.
readmy доброжелательно гласит:
The probability of gene A expressed equally between two samples can be calculated with the following formula:
2x(1-∑p(i|x))
(if ∑p(i|x)>0.5)
p(i|x)=(N2/N1)y*(x+y)!/x!y!(1+N2/N1) (x+y+1)
НЕРВНО РЖУ. Даже если открывать файлы, чтобы посмотреть, что там в них внутри, не вникая в содержание, то по минуте на каждый файл - это чистых 4 дня рабочего времени. И это только глянуть мельком! Мне кажется, биоинформатика уже укусила себя за хвост.
Пысы. А у нового Excel есть ограничение по количеству ячеек в таблицах? И о чем эта формула вообще? УМОРА! Я вот даже еще совершенно не огорчилась, я просто ошарашена. Моя задача - это все ПЕРЕСЧИТАТЬ! Пойду лучше горох подготовлю на высадку.
readmy доброжелательно гласит:
The probability of gene A expressed equally between two samples can be calculated with the following formula:
2x(1-∑p(i|x))
(if ∑p(i|x)>0.5)
p(i|x)=(N2/N1)y*(x+y)!/x!y!(1+N2/N1) (x+y+1)
НЕРВНО РЖУ. Даже если открывать файлы, чтобы посмотреть, что там в них внутри, не вникая в содержание, то по минуте на каждый файл - это чистых 4 дня рабочего времени. И это только глянуть мельком! Мне кажется, биоинформатика уже укусила себя за хвост.
Пысы. А у нового Excel есть ограничение по количеству ячеек в таблицах? И о чем эта формула вообще? УМОРА! Я вот даже еще совершенно не огорчилась, я просто ошарашена. Моя задача - это все ПЕРЕСЧИТАТЬ! Пойду лучше горох подготовлю на высадку.
no subject
Date: 2011-03-09 10:20 am (UTC)no subject
Date: 2011-03-09 10:22 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-03-09 10:28 am (UTC)А вы уверены, что это именно xls, а не cvs?
Присоединяюсь к вопросу
Date: 2011-03-09 10:37 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-03-09 10:29 am (UTC)no subject
Date: 2011-03-09 10:43 am (UTC)no subject
Date: 2011-03-09 10:30 am (UTC)no subject
Date: 2011-03-09 10:31 am (UTC)no subject
Date: 2011-03-09 10:46 am (UTC)no subject
Date: 2011-03-09 10:42 am (UTC)У Екселя 2008 и 2010 нет. Но у всех 32х битных Экселей есть ограничение по использованию памяти. Примерно в 2 гигабайта. Если переполнить, начинает ругаться и виснет.
У 64х битного Екселя 2010 никаких ограничений нет. Но для его установки надо 64хбитную Винду и соответственно 64х битный комп.
И ещё: Оффис или весь 64х битный или весь 32х битный. Совместить 32х битный Ворд и 64х битный Эксель не получится.
no subject
Date: 2011-03-09 10:44 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-03-09 10:47 am (UTC)доїннясеквенування обійдеться дешевше...no subject
Date: 2011-03-09 11:13 am (UTC)(no subject)
From:no subject
Date: 2011-03-09 10:51 am (UTC)no subject
Date: 2011-03-09 10:53 am (UTC)no subject
Date: 2011-03-09 10:57 am (UTC)А пересчеты сложные? И сами представляете КАК считать?
no subject
Date: 2011-03-09 11:54 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-03-09 10:58 am (UTC)ага :-)))
Date: 2011-03-09 11:12 am (UTC)теперь человек специально обученный нужен.
шоб с базами работать
no subject
Date: 2011-03-09 11:17 am (UTC)no subject
Date: 2011-03-09 12:56 pm (UTC)no subject
Date: 2011-03-09 12:41 pm (UTC)no subject
Date: 2011-03-09 12:42 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-03-09 01:21 pm (UTC)Если файлы имеют расширение .csv, то их по умолчанию открывает Excel, хотя это простые текстовые файлы, в которых ячейки разделены точкой с запятой (англ стандарт) или запятой (рос стандарт). Сам регулярно такие делаю и на некоторых объектах не укладываюсь.
no subject
Date: 2011-03-09 01:50 pm (UTC)http://www.ted.com/talks/anders_ynnerman_visualizing_the_medical_data_explosion.html
no subject
Date: 2011-03-09 04:01 pm (UTC)no subject
Date: 2011-03-09 07:19 pm (UTC)Хоча якщо CSV, то їх саме у LibreOffice зручно відкривати напряму - розпізнає.
І взагалі правильна була порада про бази даних - все ж більш підходящий формат. Але не привід програмістам брати з бюджету сотні тисяч на платні ;)
no subject
Date: 2011-03-09 07:41 pm (UTC)no subject
Date: 2011-03-09 08:05 pm (UTC)no subject
Date: 2011-03-09 09:39 pm (UTC)А ты в гугловые таблицы не пробовала ЭТО загрузить?
Может, всем клаудом навалиться?
:-)
Только смотри, гугль не поломай, а то всем будет плохо...
;-)
no subject
Date: 2011-03-11 02:29 am (UTC)Может поможет, хотя я таких огромных массивов не просчитывал. максимум только gene-arrays.
no subject
Date: 2011-03-16 12:10 am (UTC)На самом деле, можно взять Python (это такой язык типа бейсика, но удобнее) и написать действительно очень простой код пересчитывающий нужные данные из таблиц. И программистом для этого быть совсем не обязательно.
Если есть желание, могу рассказать и показать как. В плане программирования всё очень просто.