Обрабатываю результаты, совершенно не соображаю, как мне посчитать достоверность хотя бы приблизительно. Случай нетривиальный, требуется помощь зала в подсчете дельтадельтаСт в qRT-PCR.
Под кат смотреть тем, кто считает себя хорошим математиком и может дать совет. Остальным будет неинтересно.
1. Итак, прибор фиксирует определенное значение. Оно означает, что в момент фикисрования значения (цикла) количество продукта в реакции удваивается. Значение называется Ст.
2. Эти значения колеблются от 18 до 30. То есть все, что я меряю, имеет значения в разумных пределах, например 20.2, 18.6, 27.1, 21.3 и так далее. Это установлено параметрами реакции. Одновременно фиксируется 200 таких значений. Одно из этих значений - контроль и равен он 21 (назовем его ген К).
3. Дальше я пляшу от этого контроля и считаю дельта Ст. Например, одно из 200сот значений, назовем его ген А 22, 5, значит 22,5- 21= 1,5
4. Поскольку продукт удваивается, то эта разница означает, что у меня исходного продукта было 2,25 раз меньше (таковы условия игры). То есть разница в дельта Ст в одну единицу означает удвоенную разницу в продукте по принципу геометрической прогрессии. Если дельта СТ равна 3, то соответственно разница в 9 и так далее.
5. Если одно из 200 значений меньше 21 (контроля), например, 20.3 (назовем его ген Б), то у меня дельтаСт имеет минусовое значение. 20.3-21=-0.7 Это для меня большого значения не имеет. Это говорит только о том, что у меня исходного продукта было в 0.49 раз больше.
6. Этот контроль ген К у меня используется исключительно для нормализации результатов. Потому что в следующем измерении я повторяю реакцию для 200 значения при новых условиях. Контроль для нормализации остается прежним. Только вышеупомянутый ген А при новых условиях показывает значение не 22.5, а скажем, 24.1. А ген Б вместо 20.3 показывает 20.0.
7. Таким образом для гена А и Б я первым делом провожу нормализацию против контроля :
Сырые данные:
Эксперимент 1
ген А 22.5
ген Б 20.3
ген К 21.0
Эксперимент 2
ген А 24.1
ген Б 20.0
ген К 21.0
Нормализованные данные (дельта Ст):
Эксперимент 1
ген А 1.5
ген Б -0.7
Эксперимент 2
ген А 3.1
ген Б -1
8. Теперь я сравниваю дельта Ст для гена А и Б в разных экспериментах. Это называется дельта-дельта Ст.
Ген А 1.5-3.1= -1.6
Ген Б -0.7 +1 = 0.3
7. Как я выше уже сказала, изменение на одну единицу обозначает разницу в исходном продукте в два раза. Разницу я считаю как
Ratio = 2^-дельта дельта Ст. Итого,
Ген А =2^-(-1.6)=3.03
Ген Б =2^-(0.3)=0.8
8. До этого момент мне все ясно. Теперь начинается статистика. Я повторяю все измерения скажем дважды. Любой биолог, скажет, что с двумя повторами никакой статистики не сделаешь. Но тут есть нюансы. Метод достаточно надежный, с внутренним контролем (ген К), довольно чувствительный и дорогой. Я посмотрела публикации и вижу, что народ умудряется публиковать вообще с одним измерением без повтором. Валидируют один раз метод и больше валидирование не повторяют. Но я повторила это все дважды. Это мало для того, чтобы делать ттест и считать Р-value.
9. Поэтому максимум считают coefficient of variation. И тут у меня полный ступор. Если считать coefficient of variation для трех сырых значений трех измерений скажем гена М, например, 22.1 22.0 22.3 то у нас получается чудесное значение CV 0.56% . А если считать coefficient of variation для дельта СТ 1.10 1 1.3, то получается уже 11% !
Еще хуже, если значения для гена С 21.1 21.0 21.3 то для сырых значений CV 0.59%, а для нормализованых против котроля значений 0.1 0 0.3 CV будет показывать безобразные 93%!!! А ведь реальная разница одна и та же.
10. Че делать?
11. UPD Я не одна такая дура и это радует. 12. UPD2. Болельщикам и помощникам. Спасибо за ответы и советы и нужные вопросы. Я пока все еще не разобралась, как мне считать вариабельность, но наверное буду делать так, тем более есть на что ссылаться: "To analyse gene profiles between the two biological replicates, a one-way ANOVA (P < 0.05), using Statistica software (Statsoft, Tulsa, OK), was performed on each TF. In order to calculate relative TF expression levels, the efficiency values of each amplification reaction were taken into account using LinReg software. Amplification reactions of efficiencies lower than 1.6 were considered as missing data. Differences in transcript abundance during seed developmental stages were also evaluated by a one-way ANOVA test (P < 0.05) and a Student–Newman–Keuls test for each TFs using SAS software package (SAS Institute 1999). To compare expression profiles, expression values were adjusted by a normal distribution." Осталось узнать, чем отличается one-way ANOVA от two-way ANOVA, как это все отличается от банального ттеста и что такое Student–Newman–Keuls test.
Под кат смотреть тем, кто считает себя хорошим математиком и может дать совет. Остальным будет неинтересно.
1. Итак, прибор фиксирует определенное значение. Оно означает, что в момент фикисрования значения (цикла) количество продукта в реакции удваивается. Значение называется Ст.
2. Эти значения колеблются от 18 до 30. То есть все, что я меряю, имеет значения в разумных пределах, например 20.2, 18.6, 27.1, 21.3 и так далее. Это установлено параметрами реакции. Одновременно фиксируется 200 таких значений. Одно из этих значений - контроль и равен он 21 (назовем его ген К).
3. Дальше я пляшу от этого контроля и считаю дельта Ст. Например, одно из 200сот значений, назовем его ген А 22, 5, значит 22,5- 21= 1,5
4. Поскольку продукт удваивается, то эта разница означает, что у меня исходного продукта было 2,25 раз меньше (таковы условия игры). То есть разница в дельта Ст в одну единицу означает удвоенную разницу в продукте по принципу геометрической прогрессии. Если дельта СТ равна 3, то соответственно разница в 9 и так далее.
5. Если одно из 200 значений меньше 21 (контроля), например, 20.3 (назовем его ген Б), то у меня дельтаСт имеет минусовое значение. 20.3-21=-0.7 Это для меня большого значения не имеет. Это говорит только о том, что у меня исходного продукта было в 0.49 раз больше.
6. Этот контроль ген К у меня используется исключительно для нормализации результатов. Потому что в следующем измерении я повторяю реакцию для 200 значения при новых условиях. Контроль для нормализации остается прежним. Только вышеупомянутый ген А при новых условиях показывает значение не 22.5, а скажем, 24.1. А ген Б вместо 20.3 показывает 20.0.
7. Таким образом для гена А и Б я первым делом провожу нормализацию против контроля :
Сырые данные:
Эксперимент 1
ген А 22.5
ген Б 20.3
ген К 21.0
Эксперимент 2
ген А 24.1
ген Б 20.0
ген К 21.0
Нормализованные данные (дельта Ст):
Эксперимент 1
ген А 1.5
ген Б -0.7
Эксперимент 2
ген А 3.1
ген Б -1
8. Теперь я сравниваю дельта Ст для гена А и Б в разных экспериментах. Это называется дельта-дельта Ст.
Ген А 1.5-3.1= -1.6
Ген Б -0.7 +1 = 0.3
7. Как я выше уже сказала, изменение на одну единицу обозначает разницу в исходном продукте в два раза. Разницу я считаю как
Ratio = 2^-дельта дельта Ст. Итого,
Ген А =2^-(-1.6)=3.03
Ген Б =2^-(0.3)=0.8
8. До этого момент мне все ясно. Теперь начинается статистика. Я повторяю все измерения скажем дважды. Любой биолог, скажет, что с двумя повторами никакой статистики не сделаешь. Но тут есть нюансы. Метод достаточно надежный, с внутренним контролем (ген К), довольно чувствительный и дорогой. Я посмотрела публикации и вижу, что народ умудряется публиковать вообще с одним измерением без повтором. Валидируют один раз метод и больше валидирование не повторяют. Но я повторила это все дважды. Это мало для того, чтобы делать ттест и считать Р-value.
9. Поэтому максимум считают coefficient of variation. И тут у меня полный ступор. Если считать coefficient of variation для трех сырых значений трех измерений скажем гена М, например, 22.1 22.0 22.3 то у нас получается чудесное значение CV 0.56% . А если считать coefficient of variation для дельта СТ 1.10 1 1.3, то получается уже 11% !
Еще хуже, если значения для гена С 21.1 21.0 21.3 то для сырых значений CV 0.59%, а для нормализованых против котроля значений 0.1 0 0.3 CV будет показывать безобразные 93%!!! А ведь реальная разница одна и та же.
10. Че делать?
11. UPD Я не одна такая дура и это радует. 12. UPD2. Болельщикам и помощникам. Спасибо за ответы и советы и нужные вопросы. Я пока все еще не разобралась, как мне считать вариабельность, но наверное буду делать так, тем более есть на что ссылаться: "To analyse gene profiles between the two biological replicates, a one-way ANOVA (P < 0.05), using Statistica software (Statsoft, Tulsa, OK), was performed on each TF. In order to calculate relative TF expression levels, the efficiency values of each amplification reaction were taken into account using LinReg software. Amplification reactions of efficiencies lower than 1.6 were considered as missing data. Differences in transcript abundance during seed developmental stages were also evaluated by a one-way ANOVA test (P < 0.05) and a Student–Newman–Keuls test for each TFs using SAS software package (SAS Institute 1999). To compare expression profiles, expression values were adjusted by a normal distribution." Осталось узнать, чем отличается one-way ANOVA от two-way ANOVA, как это все отличается от банального ттеста и что такое Student–Newman–Keuls test.
no subject
Date: 2009-03-09 05:50 pm (UTC)no subject
Date: 2009-03-09 06:12 pm (UTC)no subject
Date: 2009-03-09 05:59 pm (UTC)no subject
Date: 2009-03-09 06:11 pm (UTC)no subject
Date: 2009-03-09 06:01 pm (UTC)no subject
Date: 2009-03-09 06:10 pm (UTC)То есть давайте на конкретном примере.
Эксперимент 1 (два повтора)
ген А 22.5 22.3 reproducible?
ген Б 20.3 20.1 reproducible?
ген К 21.0 21.0
Эксперимент 2 (два повтора)
ген А 24.1 24.3 reproducible?
ген Б 20.0 20.2 reproducible?
ген К 21.0 21.0
И!
Ген А эксп1 vs эксп2 significant?
Ген Б эксп1 vs эксп2 significant?
Остановитесь, дайте паузу в месяц и разберитесь
From:Re: Остановитесь, дайте паузу в месяц и разберитесь
From:Re: Остановитесь, дайте паузу в месяц и разберитесь
From:не математик но скажу :-)
Date: 2009-03-09 06:17 pm (UTC)2. Сейчас сильно не рекомендуют использовать только один референтный ген
3. Видел недавно в пнасе значения дельтадельтацт типа 400+/-300. А вообще, говорят, что 20-30% - это нормальная ошибка
Re: не математик но скажу :-)
Date: 2009-03-09 06:23 pm (UTC)Я расчитываю эффективность для каждого конкретного гена отдельно. Но в данном случае это не меняет постановку вопроса. Мне там все ясно, а математиков запутаю.
2. Сейчас сильно не рекомендуют использовать только один референтный ген
Я использую 5 референтных генов, которые отдельно подыскивала, базируясь на статьях и результатах micro macro arrays, чтобы были developmental independent. И это не считая всяких контролев контаминации и эффективности обратной транскрипции. Но это тоже не имеет отношение к вопросу.
3. Видел недавно в пнасе значения дельтадельтацт типа 400+/-300. А вообще, говорят, что 20-30% - это нормальная ошибка
Понимаю! Но не понимаю от чего эту ошибку считать? У меня в данном случае пять референтрых генов на large scale qRT-RCR и там такой разброс значений Ст, что я уже не соображаю от чего считать.
Re: не математик но скажу :-)
From:Re: не математик но скажу :-)
From:Re: не математик но скажу :-)
From:Re: не математик но скажу :-)
From:no subject
Date: 2009-03-09 06:20 pm (UTC)Вам нужно взять некоторую допустимую погрешность альфа и проверить одной из формул, выполняется ли некоторое правило ("Верно ли, что вариативность гена А не превышает 0.1%?") и рассчитав по имеющимся у Вас данным, сказать, что "Да, это верно с вероятностью 99.995 %" /если погрешность взята за 0.005/
no subject
Date: 2009-03-09 06:27 pm (UTC)(no subject)
From:no subject
Date: 2009-03-09 06:27 pm (UTC)если я правильно понимаю Вашу задачу, и вам нужно подтвердить некоторое утверждение касательно дисперсии некоторой величины (предположительно нормально распределенной)
(no subject)
From:no subject
Date: 2009-03-09 06:24 pm (UTC)no subject
Date: 2009-03-09 06:26 pm (UTC)1. А как делают статистику в тех статьях, которые ты видела, и где используют два измерения? Что там меряют - коэффициент вариации, или что ещё?
2. Непараметрические критерии применять пробовала? Или это нельзя по условиям задачи?
no subject
Date: 2009-03-09 06:33 pm (UTC)И это все! Больше ничего там нетути. Нам, гагарам, совершенно непонятно, как это им так удалось посчитать. Допустим, все эти гены имели приблизительно одинаковый Ст в пределах 35ти, тогда понятно. А если одни 35, а другие 28, а контроль 21, тогда будет туфта.
http://www.plantmethods.com/content/3/1/7 "A quantitative RT-PCR platform for high-throughput expression profiling of 2500 rice transcription factors"
2. Что такое непараметрические критерии? Я вот интуитивно ощущаю, что 22.5 и повтор 22.3 это ок, а 22.5 и повтор 21 это не ок.
(no subject)
From:Я, конечно, не гинеколог...
Date: 2009-03-09 06:45 pm (UTC)Если хотите, пришлите данные на oleg.talibov@gmail.com , я попробую чем-нибудь помочь (до конца недели).
______
* - одна из гневных филиппик акад. Багбанлы (Войскунский и Лукодьянов "Экипаж Меконга").
Re: Я, конечно, не гинеколог...
Date: 2009-03-09 06:48 pm (UTC)Re: Я, конечно, не гинеколог...
From:no subject
Date: 2009-03-10 01:46 am (UTC)no subject
Date: 2009-03-10 06:00 am (UTC)no subject
Date: 2009-03-10 07:30 am (UTC)no subject
Date: 2009-03-10 07:35 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:Re: Шоб мне не мучица
From:Re: Шоб мне не мучица
From:Re: Шоб мне не мучица
From:Re: Шоб мне не мучица
From:Re: Шоб мне не мучица
From:Re: Шоб мне не мучица
From:Re: Шоб мне не мучица
From:Да еще вопрос.
From:Re: Да еще вопрос.
From:Re: Да еще вопрос.
From:Re: Да еще вопрос.
From:Теперь дурацкий вопрос
From:Re: Теперь дурацкий вопрос
From:Re: Теперь дурацкий вопрос
From:Re: Теперь дурацкий вопрос
From:Re: Пока не получил.
From:Теперь со всех получил.
From:Re: Теперь со всех получил.
From:no subject
Date: 2009-03-10 01:48 pm (UTC)Т.е. нельзя увидеть менее чем двухкратное различие.
Ещё такой маленький вопросик - а эффективность амплификации референсов и таргетов однакова? Проверяли? :-)
А в литературе приходилось такое встречать?
Vlad
no subject
Date: 2009-03-10 02:22 pm (UTC)2. Разная. Я подсчитала эффективность амплификации с помощью linReg. Она у меня колеблется от 1.7 до 2.0. Все, что за рамками, фильтруется. Я сравнивала конечные результаты Ratio = 2^-дельта дельта Ст и
Ratio =(E target)^delta Ct target (Exp1-Exp2)/(E refer)^delta Ct refer(Exp1-Exp2)
Различия в абсолютных значениях есть, но они не существенные. У меня одна и та же проблема, как расчитывать достоверность в биологических повторах. Ст? дельта Ст? дельтадельтаСт? В разных источниках по разному.
(no subject)
From: (Anonymous) - Date: 2009-03-10 04:33 pm (UTC) - Expand(no subject)
From:(no subject)
From: (Anonymous) - Date: 2009-03-11 03:11 pm (UTC) - Expand(no subject)
From:(no subject)
From:no subject
Date: 2009-03-10 02:31 pm (UTC)no subject
Date: 2009-03-10 04:20 pm (UTC)(no subject)
From:(no subject)
From: (Anonymous) - Date: 2009-03-11 03:14 pm (UTC) - Expandkostia_inochkin распределение рабочих сил
Date: 2009-03-11 09:46 am (UTC)Лаборантами японцев возьмем. Чтоб везде было чисто, и все приборы работали.
С растениями должны работать прибалты, потому что растения растут медленно.
no subject
Date: 2009-03-20 03:08 pm (UTC)Судя по тексту вы фиксируете значения двухсот разных параметров,
и проделав это дважды хотите сделать стат.обработку.
Но если для каждого параметра сделано лишь 2 измерения, то какая же тут может быть статистика?
no subject
Date: 2009-03-20 05:22 pm (UTC)