progenes | Математики и статистики, help!

Обрабатываю результаты, совершенно не соображаю, как мне посчитать достоверность хотя бы приблизительно. Случай нетривиальный, требуется помощь зала в подсчете дельтадельтаСт в qRT-PCR.
Под кат смотреть тем, кто считает себя хорошим математиком и может дать совет. Остальным будет неинтересно.

1. Итак, прибор фиксирует определенное значение. Оно означает, что в момент фикисрования значения (цикла) количество продукта в реакции удваивается. Значение называется Ст.

2. Эти значения колеблются от 18 до 30. То есть все, что я меряю, имеет значения в разумных пределах, например 20.2, 18.6, 27.1, 21.3 и так далее. Это установлено параметрами реакции. Одновременно фиксируется 200 таких значений. Одно из этих значений - контроль и равен он 21 (назовем его ген К).

3. Дальше я пляшу от этого контроля и считаю дельта Ст. Например, одно из 200сот значений, назовем его ген А 22, 5, значит 22,5- 21= 1,5

4. Поскольку продукт удваивается, то эта разница означает, что у меня исходного продукта было 2,25 раз меньше (таковы условия игры). То есть разница в дельта Ст в одну единицу означает удвоенную разницу в продукте по принципу геометрической прогрессии. Если дельта СТ равна 3, то соответственно разница в 9 и так далее.

5. Если одно из 200 значений меньше 21 (контроля), например, 20.3 (назовем его ген Б), то у меня дельтаСт имеет минусовое значение. 20.3-21=-0.7 Это для меня большого значения не имеет. Это говорит только о том, что у меня исходного продукта было в 0.49 раз больше.

6. Этот контроль ген К у меня используется исключительно для нормализации результатов. Потому что в следующем измерении я повторяю реакцию для 200 значения при новых условиях. Контроль для нормализации остается прежним. Только вышеупомянутый ген А при новых условиях показывает значение не 22.5, а скажем, 24.1. А ген Б вместо 20.3 показывает 20.0.

7. Таким образом для гена А и Б я первым делом провожу нормализацию против контроля :
Сырые данные:
Эксперимент 1
ген А 22.5
ген Б 20.3
ген К 21.0
Эксперимент 2
ген А 24.1
ген Б 20.0
ген К 21.0
Нормализованные данные (дельта Ст):
Эксперимент 1
ген А 1.5
ген Б -0.7

Эксперимент 2
ген А 3.1
ген Б -1

8. Теперь я сравниваю дельта Ст для гена А и Б в разных экспериментах. Это называется дельта-дельта Ст.
Ген А 1.5-3.1= -1.6
Ген Б -0.7 +1 = 0.3

7. Как я выше уже сказала, изменение на одну единицу обозначает разницу в исходном продукте в два раза. Разницу я считаю как
Ratio = 2^-дельта дельта Ст. Итого,

Ген А =2^-(-1.6)=3.03
Ген Б =2^-(0.3)=0.8

8. До этого момент мне все ясно. Теперь начинается статистика. Я повторяю все измерения скажем дважды. Любой биолог, скажет, что с двумя повторами никакой статистики не сделаешь. Но тут есть нюансы. Метод достаточно надежный, с внутренним контролем (ген К), довольно чувствительный и дорогой. Я посмотрела публикации и вижу, что народ умудряется публиковать вообще с одним измерением без повтором. Валидируют один раз метод и больше валидирование не повторяют. Но я повторила это все дважды. Это мало для того, чтобы делать ттест и считать Р-value.

9. Поэтому максимум считают coefficient of variation. И тут у меня полный ступор. Если считать coefficient of variation для трех сырых значений трех измерений скажем гена М, например, 22.1 22.0 22.3 то у нас получается чудесное значение CV 0.56% . А если считать coefficient of variation для дельта СТ 1.10 1 1.3, то получается уже 11% !

Еще хуже, если значения для гена С 21.1 21.0 21.3 то для сырых значений CV 0.59%, а для нормализованых против котроля значений 0.1 0 0.3 CV будет показывать безобразные 93%!!! А ведь реальная разница одна и та же.

10. Че делать?

11. UPD Я не одна такая дура и это радует. 12. UPD2. Болельщикам и помощникам. Спасибо за ответы и советы и нужные вопросы. Я пока все еще не разобралась, как мне считать вариабельность, но наверное буду делать так, тем более есть на что ссылаться: "To analyse gene profiles between the two biological replicates, a one-way ANOVA (P < 0.05), using Statistica software (Statsoft, Tulsa, OK), was performed on each TF. In order to calculate relative TF expression levels, the efficiency values of each amplification reaction were taken into account using LinReg software. Amplification reactions of efficiencies lower than 1.6 were considered as missing data. Differences in transcript abundance during seed developmental stages were also evaluated by a one-way ANOVA test (P < 0.05) and a Student–Newman–Keuls test for each TFs using SAS software package (SAS Institute 1999). To compare expression profiles, expression values were adjusted by a normal distribution." Осталось узнать, чем отличается one-way ANOVA от two-way ANOVA, как это все отличается от банального ттеста и что такое Student–Newman–Keuls test.

Flat | Top-Level Comments Only

From:

dorinem.livejournal.com

Подпишусь на комментарии, пожалуй. Сама сейчас собираюсь делать риал-тайм, и в упор не понимаю, как там обрабатывают результаты. Именно с этого места.

From:

progenes.livejournal.com

Понимаю! У меня уже дым коромыслом над головой.

From:

cikavo.livejournal.com

в. пп. 2,3 ви рахуєте Delta^2, а повинні 2^Delta

From:

progenes.livejournal.com

Так. Але це виключно для демонстрації суті значення.

From:

arnoubea.livejournal.com

а что нужно? показать, что результаты для А и Б отличаются от К статистически-значимо (significantly)?

From:

progenes.livejournal.com

Нет. То есть не совсем.

То есть давайте на конкретном примере.
Эксперимент 1 (два повтора)
ген А 22.5 22.3 reproducible?
ген Б 20.3 20.1 reproducible?
ген К 21.0 21.0

Эксперимент 2 (два повтора)
ген А 24.1 24.3 reproducible?
ген Б 20.0 20.2 reproducible?
ген К 21.0 21.0

И!

Ген А эксп1 vs эксп2 significant?
Ген Б эксп1 vs эксп2 significant?

Остановитесь, дайте паузу в месяц и разберитесь

From:

sgustchalost.livejournal.com - Date: 2009-03-11 03:13 pm (UTC) - Expand

Re: Остановитесь, дайте паузу в месяц и разберитесь

From:

progenes.livejournal.com - Date: 2009-03-11 03:24 pm (UTC) - Expand

Re: Остановитесь, дайте паузу в месяц и разберитесь

From:

sgustchalost.livejournal.com - Date: 2009-03-11 03:42 pm (UTC) - Expand

From:

q-uadrat.livejournal.com

1. почему Вы везде используете основание 2? У Вас реакция всегда идет с 100% эффективностью?
2. Сейчас сильно не рекомендуют использовать только один референтный ген
3. Видел недавно в пнасе значения дельтадельтацт типа 400+/-300. А вообще, говорят, что 20-30% - это нормальная ошибка

From:

progenes.livejournal.com

1. почему Вы везде используете основание 2? У Вас реакция всегда идет с 100% эффективностью?
Я расчитываю эффективность для каждого конкретного гена отдельно. Но в данном случае это не меняет постановку вопроса. Мне там все ясно, а математиков запутаю.
2. Сейчас сильно не рекомендуют использовать только один референтный ген
Я использую 5 референтных генов, которые отдельно подыскивала, базируясь на статьях и результатах micro macro arrays, чтобы были developmental independent. И это не считая всяких контролев контаминации и эффективности обратной транскрипции. Но это тоже не имеет отношение к вопросу.
3. Видел недавно в пнасе значения дельтадельтацт типа 400+/-300. А вообще, говорят, что 20-30% - это нормальная ошибка

Понимаю! Но не понимаю от чего эту ошибку считать? У меня в данном случае пять референтрых генов на large scale qRT-RCR и там такой разброс значений Ст, что я уже не соображаю от чего считать.

Re: не математик но скажу :-)

From:

q-uadrat.livejournal.com - Date: 2009-03-09 06:37 pm (UTC) - Expand

Re: не математик но скажу :-)

From:

progenes.livejournal.com - Date: 2009-03-09 06:47 pm (UTC) - Expand

Re: не математик но скажу :-)

From:

q-uadrat.livejournal.com - Date: 2009-03-09 06:54 pm (UTC) - Expand

Re: не математик но скажу :-)

From:

progenes.livejournal.com - Date: 2009-03-09 06:58 pm (UTC) - Expand

From:

enedven.livejournal.com

такой безобразный коэффициент вариации на нормированных значениях у Вас получается потому, что Вы сравниваете этим подсчётом не отличие абсолютных, изначальных величин, а уже саму дельту. Естественно, она получается огромной.
Вам нужно взять некоторую допустимую погрешность альфа и проверить одной из формул, выполняется ли некоторое правило ("Верно ли, что вариативность гена А не превышает 0.1%?") и рассчитав по имеющимся у Вас данным, сказать, что "Да, это верно с вероятностью 99.995 %" /если погрешность взята за 0.005/

From:

progenes.livejournal.com

Я это понимаю. Я пробую сообразить, есть ли какая-то возможность абсолютные значения релятивировать так, чтобы все 200 генов имели значения в одной величине. Особенность именно этой платформы заключается в том, что она не работает с абсолютными величинами. Они не имеют значения.

(no subject)

From:

enedven.livejournal.com - Date: 2009-03-09 06:38 pm (UTC) - Expand

From:

enedven.livejournal.com

погуглите на "проверка гипотезы о значимости дисперсии".
если я правильно понимаю Вашу задачу, и вам нужно подтвердить некоторое утверждение касательно дисперсии некоторой величины (предположительно нормально распределенной)

(no subject)

From:

progenes.livejournal.com - Date: 2009-03-09 06:38 pm (UTC) - Expand

From:

tahbko.livejournal.com

постою, послушаю...

From:

shao-s.livejournal.com

Ну, я хорошим математиком себя не считаю... Но что-то умное сказать попробую. Сначала уточняющие вопросы:

1. А как делают статистику в тех статьях, которые ты видела, и где используют два измерения? Что там меряют - коэффициент вариации, или что ещё?
2. Непараметрические критерии применять пробовала? Или это нельзя по условиям задачи?

From:

progenes.livejournal.com

1. Here, we wanted to determine the variation between different biological replicates which encompasses both technical and biological variation. Using cDNA synthesised from DR2 harvested in three independent experiments we measured the expression of 201 TF genes. (Это при том, что их платформа содержит 2500 генов. Похоже это пилотная проверка) The ΔCT (CT_gene of interest - CT_reference gene) was calculated and the precision of the assay was assessed using the coefficient of variation (CV). Despite the fact that the majority of gene models tested (111 genes) displayed an extremely low expression level (CT > 35), the obtained mean CV was 14%. This is in good agreement with published expression data for human keratinocyte subclones, in which a CV of 18% was found for genes with a CT > 30.
И это все! Больше ничего там нетути. Нам, гагарам, совершенно непонятно, как это им так удалось посчитать. Допустим, все эти гены имели приблизительно одинаковый Ст в пределах 35ти, тогда понятно. А если одни 35, а другие 28, а контроль 21, тогда будет туфта.
http://www.plantmethods.com/content/3/1/7 "A quantitative RT-PCR platform for high-throughput expression profiling of 2500 rice transcription factors"

2. Что такое непараметрические критерии? Я вот интуитивно ощущаю, что 22.5 и повтор 22.3 это ок, а 22.5 и повтор 21 это не ок.

(no subject)

From:

shao-s.livejournal.com - Date: 2009-03-10 09:41 am (UTC) - Expand

From:

olegtal.livejournal.com

"Слова Ваши смутны как сон верблюда".*
Если хотите, пришлите данные на oleg.talibov@gmail.com , я попробую чем-нибудь помочь (до конца недели).

______
* - одна из гневных филиппик акад. Багбанлы (Войскунский и Лукодьянов "Экипаж Меконга").

From:

progenes.livejournal.com

Спасибо! Я еще помучаюсь, если не вырожу ничего, то обращусь!

Re: Я, конечно, не гинеколог...

From:

olegtal.livejournal.com - Date: 2009-03-09 06:49 pm (UTC) - Expand

From:

tanchik.livejournal.com

Точно скажу, что нельзя coefficient of variation считать для итогового значения. Просто потому что микроскопическая разница в первичных данных даст огромный разброс в конечном значении. Правда, больше ничего точно не скажу..

From:

1inuxoid.livejournal.com

дуже якось розмито літерами :)

From:

enedven.livejournal.com

осмелюсь попросить: когда будет найден подходящий путь решения, напишите, что именно это был за путь /хотя бы в общих чертах/, а то магистр прикладной математики в моей душе очень интересуется :)

From:

progenes.livejournal.com

Напишу обязательно. Сейчас штудирую статьи на эту тему. Как-то все элегантно обходят статистические рифы, стыдливо рисуют скаттер-плот двух биологических повторов и считают correlation coefficient (Rквадрат)

(no subject)

From:

progenes.livejournal.com - Date: 2009-03-10 08:32 am (UTC) - Expand

(no subject)

From:

sgustchalost.livejournal.com - Date: 2009-03-11 03:36 pm (UTC) - Expand

(no subject)

From:

progenes.livejournal.com - Date: 2009-03-11 03:56 pm (UTC) - Expand

(deleted comment)

Re: Шоб мне не мучица

From:

progenes.livejournal.com - Date: 2009-03-11 04:24 pm (UTC) - Expand

Re: Шоб мне не мучица

From:

sgustchalost.livejournal.com - Date: 2009-03-11 04:26 pm (UTC) - Expand

Re: Шоб мне не мучица

From:

progenes.livejournal.com - Date: 2009-03-11 04:27 pm (UTC) - Expand

Re: Шоб мне не мучица

From:

sgustchalost.livejournal.com - Date: 2009-03-11 04:30 pm (UTC) - Expand

Re: Шоб мне не мучица

From:

progenes.livejournal.com - Date: 2009-03-11 04:31 pm (UTC) - Expand

Re: Шоб мне не мучица

From:

progenes.livejournal.com - Date: 2009-03-11 04:26 pm (UTC) - Expand

Re: Шоб мне не мучица

From:

sgustchalost.livejournal.com - Date: 2009-03-11 04:27 pm (UTC) - Expand

Да еще вопрос.

From:

sgustchalost.livejournal.com - Date: 2009-03-11 04:38 pm (UTC) - Expand

Re: Да еще вопрос.

From:

progenes.livejournal.com - Date: 2009-03-11 04:44 pm (UTC) - Expand

Re: Да еще вопрос.

From:

sgustchalost.livejournal.com - Date: 2009-03-11 04:53 pm (UTC) - Expand

Re: Да еще вопрос.

From:

progenes.livejournal.com - Date: 2009-03-11 05:01 pm (UTC) - Expand

Теперь дурацкий вопрос

From:

sgustchalost.livejournal.com - Date: 2009-03-11 05:09 pm (UTC) - Expand

Re: Теперь дурацкий вопрос

From:

progenes.livejournal.com - Date: 2009-03-11 05:14 pm (UTC) - Expand

Re: Теперь дурацкий вопрос

From:

progenes.livejournal.com - Date: 2009-03-11 05:25 pm (UTC) - Expand

Re: Теперь дурацкий вопрос

From:

sgustchalost.livejournal.com - Date: 2009-03-11 05:31 pm (UTC) - Expand

(deleted comment)

Re: Пока не получил.

From:

progenes.livejournal.com - Date: 2009-03-11 05:43 pm (UTC) - Expand

Теперь со всех получил.

From:

sgustchalost.livejournal.com - Date: 2009-03-11 05:54 pm (UTC) - Expand

Re: Теперь со всех получил.

From:

progenes.livejournal.com - Date: 2009-03-11 07:20 pm (UTC) - Expand

From: (Anonymous)

Скажите, а вас не смущает то, что "цена деления" (или разрешение) равно двум?
Т.е. нельзя увидеть менее чем двухкратное различие.
Ещё такой маленький вопросик - а эффективность амплификации референсов и таргетов однакова? Проверяли? :-)
А в литературе приходилось такое встречать?
Vlad

From:

progenes.livejournal.com

1. я подумаю над этим. Меня смущает, но мне непонятно, почему в статьях лихо показывают Ст до третьего знака после запятой. Хотя я поняла основную мысль.

2. Разная. Я подсчитала эффективность амплификации с помощью linReg. Она у меня колеблется от 1.7 до 2.0. Все, что за рамками, фильтруется. Я сравнивала конечные результаты Ratio = 2^-дельта дельта Ст и
Ratio =(E target)^delta Ct target (Exp1-Exp2)/(E refer)^delta Ct refer(Exp1-Exp2)

Различия в абсолютных значениях есть, но они не существенные. У меня одна и та же проблема, как расчитывать достоверность в биологических повторах. Ст? дельта Ст? дельтадельтаСт? В разных источниках по разному.

(no subject)

From: (Anonymous) - Date: 2009-03-10 04:33 pm (UTC) - Expand

(no subject)

From:

progenes.livejournal.com - Date: 2009-03-11 07:11 am (UTC) - Expand

(no subject)

From: (Anonymous) - Date: 2009-03-11 03:11 pm (UTC) - Expand

(no subject)

From:

progenes.livejournal.com - Date: 2009-03-11 03:35 pm (UTC) - Expand

(no subject)

From:

progenes.livejournal.com - Date: 2009-03-11 03:35 pm (UTC) - Expand

From:

murrka.livejournal.com

ja dolgo muchilas' i poxerila :( no u menja raznica expressii raz v 1000

From: (Anonymous)

И это правильно. Вот при такой разнице можно верить QPCR

(no subject)

From:

progenes.livejournal.com - Date: 2009-03-11 07:12 am (UTC) - Expand

(no subject)

From: (Anonymous) - Date: 2009-03-11 03:14 pm (UTC) - Expand

From:

aprilforeva.livejournal.com

Русские для ДНК годятся. Напортачить там грязными руками сложновато, а сиквенсы праймеров для проверки можно индусу показать. Ну и опять же: русские произвели на свет нового мутанта! - это звучит гордо.
Лаборантами японцев возьмем. Чтоб везде было чисто, и все приборы работали.
С растениями должны работать прибалты, потому что растения растут медленно.

From:

1a1.livejournal.com

Есть сайт посвященный статистике в биологии и медицине - возможно там найдется полезная информация http://www.biometrica.tomsk.ru

Судя по тексту вы фиксируете значения двухсот разных параметров,
и проделав это дважды хотите сделать стат.обработку.
Но если для каждого параметра сделано лишь 2 измерения, то какая же тут может быть статистика?

From:

progenes.livejournal.com

Спасибо за сайт! Посмотрю. Я уже и так продвинулась, мне очень помогли ЖЖ френды. Зависит от метода. в некоторых случаях, особенно, используя биочипы, очень часто обходятся двумя повторами. При этом не столько считают достоверность, а фиксируют тенденцию.

Flat | Top-Level Comments Only

Profile

progenes

March 2025

S	M	T	W	T	F	S
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Page Summary

Style Credit

Style: Radiant Aqua for Venture by onlyembers

Expand Cut Tags

No cut tags

Page generated Mar. 4th, 2026 04:40 am