[personal profile] progenes
Обрабатываю результаты, совершенно не соображаю, как мне посчитать достоверность хотя бы приблизительно. Случай нетривиальный, требуется помощь зала в подсчете дельтадельтаСт в qRT-PCR.
Под кат смотреть тем, кто считает себя хорошим математиком и может дать совет. Остальным будет неинтересно.

1. Итак, прибор фиксирует определенное значение. Оно означает, что в момент фикисрования значения (цикла) количество продукта в реакции удваивается. Значение называется Ст.

2. Эти значения колеблются от 18 до 30. То есть все, что я меряю, имеет значения в разумных пределах, например 20.2, 18.6, 27.1, 21.3 и так далее. Это установлено параметрами реакции. Одновременно фиксируется 200 таких значений. Одно из этих значений - контроль и равен он 21 (назовем его ген К).

3. Дальше я пляшу от этого контроля и считаю дельта Ст. Например, одно из 200сот значений, назовем его ген А 22, 5, значит 22,5- 21= 1,5

4. Поскольку продукт удваивается, то эта разница означает, что у меня исходного продукта было 2,25 раз меньше (таковы условия игры). То есть разница в дельта Ст в одну единицу означает удвоенную разницу в продукте по принципу геометрической прогрессии. Если дельта СТ равна 3, то соответственно разница в 9 и так далее.

5. Если одно из 200 значений меньше 21 (контроля), например, 20.3 (назовем его ген Б), то у меня дельтаСт имеет минусовое значение. 20.3-21=-0.7 Это для меня большого значения не имеет. Это говорит только о том, что у меня исходного продукта было в 0.49 раз больше.

6. Этот контроль ген К у меня используется исключительно для нормализации результатов. Потому что в следующем измерении я повторяю реакцию для 200 значения при новых условиях. Контроль для нормализации остается прежним. Только вышеупомянутый ген А при новых условиях показывает значение не 22.5, а скажем, 24.1. А ген Б вместо 20.3 показывает 20.0.

7. Таким образом для гена А и Б я первым делом провожу нормализацию против контроля :
Сырые данные:
Эксперимент 1
ген А 22.5
ген Б 20.3
ген К 21.0
Эксперимент 2
ген А 24.1
ген Б 20.0
ген К 21.0
Нормализованные данные (дельта Ст):
Эксперимент 1
ген А 1.5
ген Б -0.7

Эксперимент 2
ген А 3.1
ген Б -1


8. Теперь я сравниваю дельта Ст для гена А и Б в разных экспериментах. Это называется дельта-дельта Ст.
Ген А 1.5-3.1= -1.6
Ген Б -0.7 +1 = 0.3

7. Как я выше уже сказала, изменение на одну единицу обозначает разницу в исходном продукте в два раза. Разницу я считаю как
Ratio = 2^-дельта дельта Ст. Итого,

Ген А =2^-(-1.6)=3.03
Ген Б =2^-(0.3)=0.8

8. До этого момент мне все ясно. Теперь начинается статистика. Я повторяю все измерения скажем дважды. Любой биолог, скажет, что с двумя повторами никакой статистики не сделаешь. Но тут есть нюансы. Метод достаточно надежный, с внутренним контролем (ген К), довольно чувствительный и дорогой. Я посмотрела публикации и вижу, что народ умудряется публиковать вообще с одним измерением без повтором. Валидируют один раз метод и больше валидирование не повторяют. Но я повторила это все дважды. Это мало для того, чтобы делать ттест и считать Р-value.

9. Поэтому максимум считают coefficient of variation. И тут у меня полный ступор. Если считать coefficient of variation для трех сырых значений трех измерений скажем гена М, например, 22.1 22.0 22.3 то у нас получается чудесное значение CV 0.56% . А если считать coefficient of variation для дельта СТ 1.10 1 1.3, то получается уже 11% !

Еще хуже, если значения для гена С 21.1 21.0 21.3 то для сырых значений CV 0.59%, а для нормализованых против котроля значений 0.1 0 0.3 CV будет показывать безобразные 93%!!! А ведь реальная разница одна и та же.

10. Че делать?

11. UPD Я не одна такая дура и это радует.  12. UPD2.  Болельщикам и помощникам. Спасибо за ответы и советы и нужные вопросы. Я пока все еще не разобралась, как мне считать вариабельность, но наверное буду делать так, тем более есть на что ссылаться: "To analyse gene profiles between the two biological replicates, a one-way ANOVA (P < 0.05), using Statistica software (Statsoft, Tulsa, OK), was performed on each TF. In order to calculate relative TF expression levels, the efficiency values of each amplification reaction were taken into account using LinReg software.  Amplification reactions of efficiencies lower than 1.6 were considered as missing data. Differences in transcript abundance during seed developmental stages were also evaluated by a one-way ANOVA test (P < 0.05) and a Student–Newman–Keuls test for each TFs using SAS software package (SAS Institute 1999). To compare expression profiles, expression values were adjusted by a normal distribution." Осталось узнать, чем отличается one-way ANOVA от two-way ANOVA, как это все отличается от банального ттеста и что такое Student–Newman–Keuls test.
Page 1 of 3 << [1] [2] [3] >>

Date: 2009-03-09 05:50 pm (UTC)
From: [identity profile] dorinem.livejournal.com
Подпишусь на комментарии, пожалуй. Сама сейчас собираюсь делать риал-тайм, и в упор не понимаю, как там обрабатывают результаты. Именно с этого места.

Date: 2009-03-09 05:59 pm (UTC)
From: [identity profile] cikavo.livejournal.com
в. пп. 2,3 ви рахуєте Delta^2, а повинні 2^Delta

Date: 2009-03-09 06:01 pm (UTC)
From: [identity profile] arnoubea.livejournal.com
а что нужно? показать, что результаты для А и Б отличаются от К статистически-значимо (significantly)?

Date: 2009-03-09 06:10 pm (UTC)
From: [identity profile] progenes.livejournal.com
Нет. То есть не совсем.

То есть давайте на конкретном примере.
Эксперимент 1 (два повтора)
ген А 22.5 22.3 reproducible?
ген Б 20.3 20.1 reproducible?
ген К 21.0 21.0

Эксперимент 2 (два повтора)
ген А 24.1 24.3 reproducible?
ген Б 20.0 20.2 reproducible?
ген К 21.0 21.0

И!

Ген А эксп1 vs эксп2 significant?
Ген Б эксп1 vs эксп2 significant?

Date: 2009-03-09 06:11 pm (UTC)
From: [identity profile] progenes.livejournal.com
Так. Але це виключно для демонстрації суті значення.

Date: 2009-03-09 06:12 pm (UTC)
From: [identity profile] progenes.livejournal.com
Понимаю! У меня уже дым коромыслом над головой.

не математик но скажу :-)

Date: 2009-03-09 06:17 pm (UTC)
From: [identity profile] q-uadrat.livejournal.com
1. почему Вы везде используете основание 2? У Вас реакция всегда идет с 100% эффективностью?
2. Сейчас сильно не рекомендуют использовать только один референтный ген
3. Видел недавно в пнасе значения дельтадельтацт типа 400+/-300. А вообще, говорят, что 20-30% - это нормальная ошибка

Date: 2009-03-09 06:20 pm (UTC)
From: [identity profile] enedven.livejournal.com
такой безобразный коэффициент вариации на нормированных значениях у Вас получается потому, что Вы сравниваете этим подсчётом не отличие абсолютных, изначальных величин, а уже саму дельту. Естественно, она получается огромной.
Вам нужно взять некоторую допустимую погрешность альфа и проверить одной из формул, выполняется ли некоторое правило ("Верно ли, что вариативность гена А не превышает 0.1%?") и рассчитав по имеющимся у Вас данным, сказать, что "Да, это верно с вероятностью 99.995 %" /если погрешность взята за 0.005/

Re: не математик но скажу :-)

Date: 2009-03-09 06:23 pm (UTC)
From: [identity profile] progenes.livejournal.com
1. почему Вы везде используете основание 2? У Вас реакция всегда идет с 100% эффективностью?
Я расчитываю эффективность для каждого конкретного гена отдельно. Но в данном случае это не меняет постановку вопроса. Мне там все ясно, а математиков запутаю.
2. Сейчас сильно не рекомендуют использовать только один референтный ген
Я использую 5 референтных генов, которые отдельно подыскивала, базируясь на статьях и результатах micro macro arrays, чтобы были developmental independent. И это не считая всяких контролев контаминации и эффективности обратной транскрипции. Но это тоже не имеет отношение к вопросу.
3. Видел недавно в пнасе значения дельтадельтацт типа 400+/-300. А вообще, говорят, что 20-30% - это нормальная ошибка

Понимаю! Но не понимаю от чего эту ошибку считать? У меня в данном случае пять референтрых генов на large scale qRT-RCR и там такой разброс значений Ст, что я уже не соображаю от чего считать.

Date: 2009-03-09 06:24 pm (UTC)
From: [identity profile] tahbko.livejournal.com
постою, послушаю...

Date: 2009-03-09 06:26 pm (UTC)
From: [identity profile] shao-s.livejournal.com
Ну, я хорошим математиком себя не считаю... Но что-то умное сказать попробую. Сначала уточняющие вопросы:

1. А как делают статистику в тех статьях, которые ты видела, и где используют два измерения? Что там меряют - коэффициент вариации, или что ещё?
2. Непараметрические критерии применять пробовала? Или это нельзя по условиям задачи?

Date: 2009-03-09 06:27 pm (UTC)
From: [identity profile] progenes.livejournal.com
Я это понимаю. Я пробую сообразить, есть ли какая-то возможность абсолютные значения релятивировать так, чтобы все 200 генов имели значения в одной величине. Особенность именно этой платформы заключается в том, что она не работает с абсолютными величинами. Они не имеют значения.

Date: 2009-03-09 06:27 pm (UTC)
From: [identity profile] enedven.livejournal.com
погуглите на "проверка гипотезы о значимости дисперсии".
если я правильно понимаю Вашу задачу, и вам нужно подтвердить некоторое утверждение касательно дисперсии некоторой величины (предположительно нормально распределенной)

Date: 2009-03-09 06:33 pm (UTC)
From: [identity profile] progenes.livejournal.com
1. Here, we wanted to determine the variation between different biological replicates which encompasses both technical and biological variation. Using cDNA synthesised from DR2 harvested in three independent experiments we measured the expression of 201 TF genes. (Это при том, что их платформа содержит 2500 генов. Похоже это пилотная проверка) The ΔCT (CT_gene of interest - CT_reference gene) was calculated and the precision of the assay was assessed using the coefficient of variation (CV). Despite the fact that the majority of gene models tested (111 genes) displayed an extremely low expression level (CT > 35), the obtained mean CV was 14%. This is in good agreement with published expression data for human keratinocyte subclones, in which a CV of 18% was found for genes with a CT > 30.
И это все! Больше ничего там нетути. Нам, гагарам, совершенно непонятно, как это им так удалось посчитать. Допустим, все эти гены имели приблизительно одинаковый Ст в пределах 35ти, тогда понятно. А если одни 35, а другие 28, а контроль 21, тогда будет туфта.
http://www.plantmethods.com/content/3/1/7 "A quantitative RT-PCR platform for high-throughput expression profiling of 2500 rice transcription factors"

2. Что такое непараметрические критерии? Я вот интуитивно ощущаю, что 22.5 и повтор 22.3 это ок, а 22.5 и повтор 21 это не ок.

Re: не математик но скажу :-)

Date: 2009-03-09 06:37 pm (UTC)
From: [identity profile] q-uadrat.livejournal.com
Все, понял. Я делаю так: высчитываю конечную дельту и стандартное отклонение. Вернее, это делает програмное обеспечение CFX96 ))) Хотя, конечно, при малой выборке это наверное не совсем корректно.

Date: 2009-03-09 06:38 pm (UTC)
From: [identity profile] enedven.livejournal.com
погуглите на "проверка гипотезы о значимости дисперсии".
если я правильно понимаю Вашу задачу, и вам нужно подтвердить некоторое утверждение касательно дисперсии некоторой величины (предположительно нормально распределенной)

Date: 2009-03-09 06:38 pm (UTC)
From: [identity profile] progenes.livejournal.com
охотно погуглю. надеюсь, что соображу. Спасибо!

Я, конечно, не гинеколог...

Date: 2009-03-09 06:45 pm (UTC)
From: [identity profile] olegtal.livejournal.com
"Слова Ваши смутны как сон верблюда".*
Если хотите, пришлите данные на oleg.talibov@gmail.com , я попробую чем-нибудь помочь (до конца недели).

______
* - одна из гневных филиппик акад. Багбанлы (Войскунский и Лукодьянов "Экипаж Меконга").

Re: не математик но скажу :-)

Date: 2009-03-09 06:47 pm (UTC)
From: [identity profile] progenes.livejournal.com
Если я тестирую экспрессию пяти генов в трех линиях, то я могу позволить себе повторов для любой статистики. А когда у меня платформа на 200 генов и я тестирую 5 линий, а каждой по 5 стадий развития и к каждой дикий тип для контроля, то получается столько runs, что рухнет институтский бюджет.
From: [identity profile] progenes.livejournal.com
Спасибо! Я еще помучаюсь, если не вырожу ничего, то обращусь!
From: [identity profile] olegtal.livejournal.com
Если выродите, дайте знать. Я в последние два месяца, похоже, стремительно меняю основную специальность.

Re: не математик но скажу :-)

Date: 2009-03-09 06:54 pm (UTC)
From: [identity profile] q-uadrat.livejournal.com
Ну, тогда повторов лучше совсем не делать - будет больше похоже на чип! Но, если серьезно - даже не знаю, что в таком случае можно посоветовать

Re: не математик но скажу :-)

Date: 2009-03-09 06:58 pm (UTC)
From: [identity profile] progenes.livejournal.com
Ха! Я чипы уже повторяю по три раза! Сейчас редкий чип можно продать в журнал без соответствующей статистики.

Date: 2009-03-10 01:46 am (UTC)
From: [identity profile] tanchik.livejournal.com
Точно скажу, что нельзя coefficient of variation считать для итогового значения. Просто потому что микроскопическая разница в первичных данных даст огромный разброс в конечном значении. Правда, больше ничего точно не скажу..

Date: 2009-03-10 06:00 am (UTC)
From: [identity profile] 1inuxoid.livejournal.com
дуже якось розмито літерами :)
Page 1 of 3 << [1] [2] [3] >>

Profile

progenes: (Default)
progenes

March 2025

S M T W T F S
      1
2345678
9101112131415
1617 1819202122
23242526272829
3031     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 4th, 2026 03:11 pm
Powered by Dreamwidth Studios