Сильно

Mar. 9th, 2011 11:12 am
progenes: (Default)
[personal profile] progenes
Получила результаты экспрессионного анализа, секвенирование РНК по методу 454. 48 проб. На выходе увесистый ZIP, в распакованом виде около 300 гигов (но я все еще не распаковала), а это уже около 2000 (2 тыщ) штук разнообразных файлов, преимущественно Excel, которые при открытии весело сообщают, что ячейки в таблице закончились.

readmy доброжелательно гласит:
The probability of gene A expressed equally between two samples can be calculated with the following formula:

2x(1-p(i|x))

(if p(i|x)>0.5)

p(i|x)=(N2/N1)y*(x+y)!/x!y!(1+N2/N1) (x+y+1)

НЕРВНО РЖУ. Даже если открывать файлы, чтобы посмотреть, что там в них внутри, не вникая в содержание, то по минуте на каждый файл - это чистых 4 дня рабочего времени. И это только глянуть мельком! Мне кажется, биоинформатика уже укусила себя за хвост.

Пысы. А у нового Excel есть ограничение по количеству ячеек в таблицах? И о чем эта формула вообще? УМОРА! Я вот даже еще совершенно не огорчилась, я просто ошарашена. Моя задача - это все ПЕРЕСЧИТАТЬ! Пойду лучше горох подготовлю на высадку.

Date: 2011-03-09 01:58 pm (UTC)
From: [identity profile] zametilprosto.livejournal.com
просто количество строк в файле? А как данные представлены?
В принципе, как человек работающий с базами данных "могу смочь" что-то подсказать (а мне, как сами понимаете, любопытно, как той Варваре на базаре!). Но "могу и не смочь"

Если хотите - пишите на zametilprosto "маленькая собачка" yandex.ru

Только файлы в 300 гб не пролезут :)

Date: 2011-03-09 02:17 pm (UTC)
From: [identity profile] progenes.livejournal.com
Огромное спасибо за предложенную помощь. На этот раз я нею точно не смогу воспользоваться по ряду причин, у нас обязательства перед партнерами. Но если вам угодно что-то посмотреть, как любопытной варваре, то я завсегда работу придумать могу, но в другой раз.

Date: 2011-03-09 02:22 pm (UTC)
From: [identity profile] zametilprosto.livejournal.com
Любопытно (я ж вроде говорил, что в юности успел поработать в институте Общей Генетики, хотя занимался теми же БД, в основном по популяционной генетике). Так что будет возможность - спрашивайте!

Строго говоря обещать что все получится я не могу, потому что плохо представляю ваши задачи, но именно это и добавляет любопытства :)

Profile

progenes: (Default)
progenes

March 2025

S M T W T F S
      1
2345678
9101112131415
1617 1819202122
23242526272829
3031     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 29th, 2025 07:34 pm
Powered by Dreamwidth Studios