[personal profile] progenes
Попробуем теперь разобраться с задачками. В комментарии наведывались суровые статистики, у которых формулы математицкие. Я попробую объяснить логику рассуждений для тех, кто с формулами не дружит. Кое в чем и сама, наконец, разобралась.

Под катом таблички.

Задача 1


Задача 2


Задача 3


Задача 4


Поскольку я на переправе меняла коней, то некоторые по умолчанию считали количество фальш-позитивных 5%, пока я не уточнила, что фальш-позитивных как бы нет. Однако этот тупой пример позволяет распознать два важных параметра: чувствительность теста и специфичность теста.
Чувствительность - это какой % больных демонстрируют позитивный результат 95% (Задача 1-3) или 99,5%(Задача 4).
Специфичность - это какой % здоровых демонстрируют негативный результат (опять 95%, это 100%-5%), или 100%, как в последней задаче уточнено в процессе обсуждения. Мы можем, например, поиграться и предположить, что 3% здоровых почему-то продемонстрируют аномальный результат. Тогда финал будет выглядеть так:



За подготовку задачи и объяснение для чайников благодарность объявляется учебнику для дураков биологов от Harvey Motulsky "Intuitive Biostatistics", раздел 14 "Intrepreting Lab Tests: Introduction to Bayesian Thinking", страница 133.

Date: 2012-05-04 10:20 am (UTC)
From: [identity profile] mile-x.livejournal.com
1. Согласен.
Одно замечание: итоговое число у автора 95/50090*100=0,18966%, что по правилу округления равно 0,19%, а не 0,18%

2. Не согласен. Напоминаю, что по условию задачи «НАЛИЧИЕ ГЕНА НЕ ГАРАНТИРУЕТ развитие болезни».
А это значит, что С=500 и F=500, верно лишь при условии, что НАЛИЧИЕ ГЕНА ГАРАНТИРУЕТ развитие болезни, что не есть правда.

Date: 2012-05-04 10:29 am (UTC)
From: [identity profile] progenes.livejournal.com
Вы в чем-то, разумеется, правы, но я попробую объяснить и оправдать свою логику. Тут я исходила из того, что такое, собственно, болезнь. Это некое патологическое состояние организма, верно? Третья задача уже изобиловала клиническими симптомами, возникал вопрос, а почему во второй задаче нет симптомов? Жизненная практика показывает, что не всегда наличие гена гарантирует развитие болезни. Иначе нам не надо было бы делать скриниг фермента, а достаточно было бы сделать тест на наличие мутации и гарантировать болезнь. Но мы пробуем проскринировать популяцию на наличие первых признаков патологии, измененной активности фермента.

(no subject)

From: [identity profile] mile-x.livejournal.com - Date: 2012-05-04 10:41 am (UTC) - Expand

(no subject)

From: [identity profile] tannenbaum.livejournal.com - Date: 2012-05-04 01:07 pm (UTC) - Expand

Date: 2012-05-04 10:24 am (UTC)
From: [identity profile] mile-x.livejournal.com
3. Согласен

4. Согласен. В моем решении у меня здесь есть ошибка

Date: 2012-05-04 10:28 am (UTC)
From: [identity profile] kondybas.livejournal.com
Слишком сложно.
Если группа риска 0.01% и надежность теста 95%, то получить позитивный результат можно в трех случаях:
Р1 = в группе риска И болен = 0.0001 * 0.95
Р2 = в группе риска И здоров (а тест лажанул) = 0.0001 * 0.05
Р3 = не в группе риска И здоров = 0.9999 * 0.05
Вероятность оказаться больным в таком раскладе Рб = Р1/(Р1+Р2+Р3) = 0,0018963968459926
Edited Date: 2012-05-04 10:28 am (UTC)

Date: 2012-05-04 10:38 am (UTC)
From: [identity profile] progenes.livejournal.com
Сам ты сложно! ты еще скажи, что это проще. Тут в табличке железобетонная логика, доступная даже биологам. И медикам.

(no subject)

From: [identity profile] kondybas.livejournal.com - Date: 2012-05-04 12:41 pm (UTC) - Expand

(no subject)

From: [identity profile] progenes.livejournal.com - Date: 2012-05-04 12:44 pm (UTC) - Expand

Date: 2012-05-04 12:07 pm (UTC)
From: [identity profile] mile-x.livejournal.com
Не, у Буратино тест уже! обнаружил такой эффект, а значит Рб = Р1/(Р1+Р3).

(no subject)

From: [identity profile] kondybas.livejournal.com - Date: 2012-05-04 12:22 pm (UTC) - Expand

(no subject)

From: [identity profile] tannenbaum.livejournal.com - Date: 2012-05-04 12:51 pm (UTC) - Expand

(no subject)

From: [identity profile] kondybas.livejournal.com - Date: 2012-05-04 12:55 pm (UTC) - Expand

(no subject)

From: [identity profile] tannenbaum.livejournal.com - Date: 2012-05-04 01:38 pm (UTC) - Expand

(no subject)

From: [identity profile] gegmopo4.livejournal.com - Date: 2012-05-04 01:38 pm (UTC) - Expand

Date: 2012-05-04 07:52 pm (UTC)
From: [identity profile] egh0st.livejournal.com
учитывая округления с 0.19 до 0.18 можно сказать что все (в т.ч. и я) кто выдал сразу 0.19% в первой задаче полностью правы.

На правах математика (ц) наиболее малозначимый фактор был отброшен, ваш же P2. Посему элементарно выводится 0.19 с погрешностью в ваши же P2 :) то есть пол десятитысячного процента.

Date: 2012-05-04 10:31 am (UTC)
From: [identity profile] erdweibchen.livejournal.com
На мой взгляд, стоило бы теперь еще и задачи корректно сформулировать, ибо лошадей на переправе меняли несколько на колбасу.

Date: 2012-05-04 11:45 am (UTC)
ext_605364: geg MOPO4 (Default)
From: [identity profile] gegmopo4.livejournal.com
1. Какое-то у вас странноватое округление.

2. Во второй задаче вы лошадей так и не поменяли. Условие задачи (вы явно оговорили, что «наличие гена еще не гарантирует развитие болезни») противоречит решению.

4. В самом условии ключевого фактора нет (он был упомянут только в комментариях, и после этого решение тривиально). К тому же формулировка противоречит предыдущим задачам, к которым невольно привязана. Следовало говорить не о «настолько аномально высоком уровне целлюлазы», а о каком-нибудь совершенно другом тесте, не на целлюлазу.

Date: 2012-05-04 11:49 am (UTC)
From: [identity profile] erdweibchen.livejournal.com
Именно так.

Date: 2012-05-04 12:10 pm (UTC)
From: [identity profile] progenes.livejournal.com
Можно, я не буду еще раз оправдываться, а? http://progenes.livejournal.com/160562.html?thread=7875122#t7875122

Пока я писала четвертую задачу, то считала другими логичными прикидками и ценности специфичности не осознала.

(no subject)

From: [identity profile] erdweibchen.livejournal.com - Date: 2012-05-04 12:16 pm (UTC) - Expand

(no subject)

From: [identity profile] progenes.livejournal.com - Date: 2012-05-04 12:18 pm (UTC) - Expand

(no subject)

From: [identity profile] erdweibchen.livejournal.com - Date: 2012-05-04 12:39 pm (UTC) - Expand

(no subject)

From: [identity profile] progenes.livejournal.com - Date: 2012-05-04 12:42 pm (UTC) - Expand

(no subject)

From: [identity profile] erdweibchen.livejournal.com - Date: 2012-05-04 12:44 pm (UTC) - Expand

(no subject)

From: [identity profile] progenes.livejournal.com - Date: 2012-05-04 12:48 pm (UTC) - Expand

(no subject)

From: [identity profile] erdweibchen.livejournal.com - Date: 2012-05-04 01:42 pm (UTC) - Expand

(no subject)

From: [identity profile] progenes.livejournal.com - Date: 2012-05-04 04:03 pm (UTC) - Expand

(no subject)

From: [identity profile] erdweibchen.livejournal.com - Date: 2012-05-04 04:19 pm (UTC) - Expand

(no subject)

From: [identity profile] progenes.livejournal.com - Date: 2012-05-04 06:44 pm (UTC) - Expand

(no subject)

From: [identity profile] erdweibchen.livejournal.com - Date: 2012-05-04 09:29 pm (UTC) - Expand

(no subject)

From: [identity profile] progenes.livejournal.com - Date: 2012-05-05 07:36 am (UTC) - Expand

(no subject)

From: [identity profile] gegmopo4.livejournal.com - Date: 2012-05-05 10:20 am (UTC) - Expand

(no subject)

From: [identity profile] progenes.livejournal.com - Date: 2012-05-05 02:04 pm (UTC) - Expand

(no subject)

From: [identity profile] vanilla-saffron.livejournal.com - Date: 2012-05-05 06:44 pm (UTC) - Expand

(no subject)

From: [identity profile] erdweibchen.livejournal.com - Date: 2012-05-05 07:53 pm (UTC) - Expand

(no subject)

From: [identity profile] vanilla-saffron.livejournal.com - Date: 2012-05-06 10:21 am (UTC) - Expand

(no subject)

From: [identity profile] gegmopo4.livejournal.com - Date: 2012-05-04 12:17 pm (UTC) - Expand

Date: 2012-05-04 12:06 pm (UTC)
From: [identity profile] mfreidin.livejournal.com
Ради интереса, а в Германии студентов/аспирантов - медиков/биологов учат в массовом порядке основам тервера и матстатистики?

Date: 2012-05-04 12:40 pm (UTC)
From: [identity profile] progenes.livejournal.com
Вроде и учат, но я приперлась с этими задачками на кофе к студентам и давай им показывать. Уже первая повергла в трепет, потом быстро сообразили. Но глаза на массовый скрининг открылись.

(no subject)

From: [identity profile] user-ami.livejournal.com - Date: 2012-05-04 03:44 pm (UTC) - Expand

Date: 2012-05-04 12:06 pm (UTC)
From: [identity profile] Николай Сергушенков (from livejournal.com)
Ура! Ошибся только в последнем - ошибочно предположил фальш-позитивных. Мораль - не умножай сущностей сверх необходимого :)

Date: 2012-05-04 12:51 pm (UTC)
From: [identity profile] progenes.livejournal.com
Да я сама точно также ошиблась.

(no subject)

From: [identity profile] yurvor.livejournal.com - Date: 2012-05-04 05:21 pm (UTC) - Expand

Date: 2012-05-04 12:12 pm (UTC)
From: [identity profile] rempel.livejournal.com
очень полезно, спасибо!

Date: 2012-05-04 12:28 pm (UTC)
From: [identity profile] dr-blastarr.livejournal.com
Кстати, если у буратин есть папа и мама, то каждый из родителей может обладать от одной до двух копий этого гена. В последнем случае все их дети будут носителями. Поэтому не факт, что даже "у братьев и сестёр будет фифти-фифти" этого гена.

Плюс — по условию наличие гена не приводило к болезни, о чём уже написали выше.

Date: 2012-05-04 12:57 pm (UTC)
From: [identity profile] progenes.livejournal.com
То есть выводок на тысячу детишек вас не смущает?

Допустим вы генетик в консультации и не знаете судьбу папы и мамы. Предполагается самы минимальный сценарий - один из родителей носитель аллели.

Уточняю, не "наличие гена не приводило к болезни", а "наличие гена еще не гарантирует развитие болезни".

(no subject)

From: [identity profile] dr-blastarr.livejournal.com - Date: 2012-05-04 02:30 pm (UTC) - Expand

Date: 2012-05-04 12:36 pm (UTC)
From: [identity profile] sshamil.livejournal.com
*Походу, не только меня сбило "наличие гена еще не гарантирует развитие болезни". У вас таблички простые, 2 на 2, а не понявшим приходилось 3 варианта вводить: 1) гена нет, 2) ген есть, но здоров, 3) болен. И вероятность считать как А/(А+В+С). Отсюда решения получились... гхм... многограннее :))
Ну ладно, вполне списываемо на "трудности перевода" с биологического на математический.

Очень хорошая тема, и неплохая "игра ума". Спасибо. Пишите еще.

Date: 2012-05-04 12:42 pm (UTC)
From: [identity profile] tannenbaum.livejournal.com
Не поняла! Вы ведь не сказали, что 500 буратиновых братьев больны, а 500 здоровы. Вы сказали, что 500 - носители гена, а спросили, какова вероятность, что Буратино болен?? И ведь Вы сами подчеркнули, что носитель - не значит болен, то есть деление на больных и здоровых заведомо было НЕ фифти-фифти! Кто-то сошел с ума, или я, или пес.

(no subject)

From: [identity profile] mile-x.livejournal.com - Date: 2012-05-04 01:52 pm (UTC) - Expand

Date: 2012-05-04 12:56 pm (UTC)
From: [identity profile] user-ami.livejournal.com
:-/ А что такое "бассейновый способ мышления"? Я вообще без образования, размышляла на уровне "с одной стороны, их 10000 раз больше, с другой -- в 19 раз меньше", но ответы у меня почему-то получились правильные. При этом плавать я не умею и в бассейны не хожу.

Date: 2012-05-04 01:01 pm (UTC)
From: [identity profile] progenes.livejournal.com
Такое размышление на уровне "с одной стороны, их 10000 раз больше, с другой -- в 19 раз меньше" и есть "бассейновое".

(no subject)

From: [identity profile] user-ami.livejournal.com - Date: 2012-05-04 03:37 pm (UTC) - Expand

(no subject)

From: [identity profile] -pg-.livejournal.com - Date: 2012-05-05 05:22 am (UTC) - Expand

(no subject)

From: [identity profile] progenes.livejournal.com - Date: 2012-05-05 07:40 am (UTC) - Expand

Date: 2012-05-04 05:46 pm (UTC)
From: [identity profile] andrey boytsov (from livejournal.com)
Спасибо за задачи!

По-моему в задаче 3 не все гладко.
В пунктах 1-3 были расклады не просто на 10000, а на 10000 с симптомами(!). И это важно.

Если, например, взять 7000 случайных здоровых, то будет где-то 350 с повышенной целлюлазой.
Но если целенаправленно отобрать 7000 здоровых с симптомами, то пол. тестов уже не обязательно 350 (например, если эти симптомы часто вызываются той же повышенной целлюлазой, вне зависимости от причин повышения).

Независимость наличия симптомов и вероятности положительного теста не следует ни из чего, даже при известном диагнозе. А без этого пункты 4-7 не работают.

Date: 2012-05-04 07:06 pm (UTC)
From: [identity profile] alex-celly.livejournal.com
Оффтоп:
Вот свежее российское "безгмо":
Image
Не фотожаба, у меня мать сегодня такое же купила - в холодильнике стоит

Date: 2012-05-05 05:19 am (UTC)
From: [identity profile] -pg-.livejournal.com
"Чувствительность - это какой % больных демонстрируют позитивный результат 95%.
Специфичность - это какой % здоровых демонстрируют негативный результат."

Помню, когда нам преподавали теорию распознавания образов (а понятия эти идут корнями оттуда), у нас эти штуки называли по другому. :)
"Ложно позитивный результат" называли "ложная тревога", а "ложно негативный результат" - "пропуск цели". :)
Но у нас была не совсем медицина. :)
Edited Date: 2012-05-05 05:20 am (UTC)

Date: 2012-05-05 03:31 pm (UTC)
From: [identity profile] velta-1.livejournal.com
А мне все равно Буратину жалко!!!

Хотя я поняла логику, и нашла правильные ответы. И исходя из правильного ответа, (хотя бы на первый вопрос, пока нос у Буратино еще не размяк) - я понимаю, что деревянненький может спать спокойно: хотя разница в вероятности в 20 раз, все равно 0,2% это мало для беспокойства.
Однако 0,2% диабета 1 типа выявляется в среднем в популяции, у ЗДОРОВЫХ родителей. Никто не беспокоится по этому поводу. А вот вероятность заболеть при одном больном родителе - уже 5-10%. И ведь тоже - разница в 25-50 раз, не так чтоб совсем безнадежная ситуация. А сколько беды от этого! Сколько одиноких людей, сколько развалившихся семей! Да и сколько детей диабетиков! Ведь для каждой семьи вероятность-то тут определяется не цифрой 5%, а законом динозавра: или встречу, или не встречу...

Date: 2012-05-05 09:17 pm (UTC)
From: [identity profile] marynochka.livejournal.com
А мне вот интересно, как вычислялись условия задачи? Если скрининг бывает и положительным и отрицательным и у здоровых и у больных, как вычислили сколько процентов у кого? Очевидно пользовались другими признаками? Или по резльтатам вскытия? Или как?

Date: 2012-05-15 06:16 am (UTC)
From: [identity profile] rusty-spur.livejournal.com
Задача 1 - наглядный результат поголовного скрининга на редкие заболевания...

Date: 2012-05-25 11:07 pm (UTC)
From: [identity profile] kid-carrier.livejournal.com
В решении 2 имхо ошибка. Причем серьезная, ибо выводы ровно противоположные получаются.
Вы говорили в комментариях:
1. Распространенность гена - 50%
2. Наличие гена не гарантирует болезнь

Это логично, иначе у нас не была бы заболеваемость 0,01%! Если бы наличие гена гарантировало болезнь, то у нас 50% болело бы. А так у нас болеют 0,02% из носителей гена.

И еще замечание. Если брат Буратины носитель гена и болеет, то это вовсе не означает, что у половины братьев-сестер ген есть, у другой - нет. Это очень грубое допущение. Согласно моим расчетам, если брат буратины - носитель гена и нам это точно известно, это значит, что сам буратина тоже носитель гена (хотя бы одного) с вероятностью 86% примерно. Такая высокая вероятность из-за того, что ген доминантный.

Ответ на задачу 2 - 0,35%, и не более 0,38%.
Edited Date: 2012-05-25 11:09 pm (UTC)

Profile

progenes: (Default)
progenes

March 2025

S M T W T F S
      1
2345678
9101112131415
1617 1819202122
23242526272829
3031     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 7th, 2026 04:37 am
Powered by Dreamwidth Studios