136
Синдром статистической снисходительности или значение и назначение P-значения Никита Николаевич Хромов-Борисов Никита Николаевич Хромов-Борисов Кафедра медицинской информатики СПбГМУ им. акад. И.П. Павлова [email protected] (812) 234-18-40 8-952-204-89-49 1

Syndrome of statistical leniency ppt

  • Upload
    -

  • View
    92

  • Download
    5

Embed Size (px)

DESCRIPTION

Syndrome of statistical lenien

Citation preview

Page 1: Syndrome of statistical leniency ppt

Синдром статистической

снисходительности

или

значение и назначение P-значения

Никита Николаевич Хромов-БорисовНикита Николаевич Хромов-БорисовКафедра медицинской информатики

СПбГМУ им. акад. И.П. Павлова

[email protected]

(812) 234-18-40

8-952-204-89-49

1

Page 2: Syndrome of statistical leniency ppt

9th International Congress of Human Genetics

18-23 August 1996. Rio de Janeiro, Brazil

2

Page 3: Syndrome of statistical leniency ppt

Статистика

• 80% ёжиков колются,

а 20% - нюхают грибы

• При упоминании • При упоминании

слова «статистика»

многие врачи

раздражаются и

приходят в

замешательство или в

уныние.

3

Page 4: Syndrome of statistical leniency ppt

Единые требования

• Редакции многих отечественных и зарубежных биомедицинских

журналов при подготовке к публикации научных статей

рекомендуют авторам руководствоваться «Едиными требованиями

к рукописям, представляемым в биомедицинские журналы».

• Требования разрабатывает Международный комитет редакторов

медицинских журналов (International Committee of Medical Journal медицинских журналов (International Committee of Medical Journal

Editors – ICMJE).

• Эти требования регулярно пересматриваются, и последняя их

редакция датирована октябрем 2008 г.:

• http://www.icmje.org/index.html

• На русский наиболее удачно переведена редакция 2005 г.:

• http://www.mediasphera.ru/mjmp/2005/5/10.pdf

4

Page 5: Syndrome of statistical leniency ppt

Единые требования, раздел «Статистика»

• В этих требованиях в разделе «Статистика» сказано:

• «Описывайте статистические методы настолько детально,

чтобы осведомленный читатель, имеющий доступ к

исходным данным, мог проверить сообщаемые Вами

результаты.

• По возможности, подвергайте полученные данные

количественной оценке и представляйте их с количественной оценке и представляйте их с

соответствующими показателями ошибок измерения и

неопределенности или варьирования измерений (такими как

доверительные интервалы).

• Не следует полагаться исключительно на проверку

статистических гипотез, например, на использование Р-

значений, которые не содержат важную информацию о

размере эффекта».

5

Page 6: Syndrome of statistical leniency ppt

Открой личико

• Katrina Kelner, Deputy Editor for Life Sciences,

Science

• Журнал “Science” принял такую политику в

отношении открытости данных:

• «После публикации, все данные, необходимые

для понимания, оценки и проверки выводов

статьи, должны быть доступны всем читателям

журнала».

6

Page 7: Syndrome of statistical leniency ppt

Журнал «Экология человека»

7

Page 8: Syndrome of statistical leniency ppt

Экология человека, 2008. - № 7. - С. 57-64.

• Обновленные требования появились недавно в журнале

«Экология человека», в которых в частности содержится

чрезвычайно важное предостережение:

• «Всегда следует помнить, что выявление

статистически значимых различий еще не означает

наличия достоверных или клинически важных наличия достоверных или клинически важных

различий, а также причинно-следственных связей».

• Несмотря на рекомендацию «не полагаться

исключительно на использование P-значения», до сих

пор во многих научных публикациях оно фигурирует как

решающий показатель значимости наблюдаемых

авторами эффектов, различий, корреляций и т.п.

8

Page 9: Syndrome of statistical leniency ppt

Р-значение• Напомним, как определяется и вычисляется Р-значение.

• P-значение есть условная вероятность, а именно:

• Вероятность получить наблюдаемое значение tнабл. статистики

некоего критерия T и все остальные еще менее вероятные

значения этой статистики (или значения, еще более

отклоняющиеся от ожидаемых) ПРИ УСЛОВИИ, что верна отклоняющиеся от ожидаемых) ПРИ УСЛОВИИ, что верна

нулевая гипотеза H0:

• Pval = Pr[|T| ≥ |tнабл.| | H0].

• Тут следует обратить внимание на то, что «еще менее

вероятные данные» не являются «данными», мы их не

наблюдаем.

• Мы их додумываем из всех возможных значений в рамках

выбранной нами (нулевой) модели.

9

Page 10: Syndrome of statistical leniency ppt

P-значение есть вероятность наблюдать исход (x), плюс все «еще более

экстремальные исходы». Они представлены затушеванной областью

хвоста распределения, соответствующего нулевой модели

Goodman S. A Dirty Dozen: Twelve P-Value Misconceptions. Semin. Hematol. 45:135-140 © 2008

10

Page 11: Syndrome of statistical leniency ppt

Интерпретация P-значения

• Распространенной является интерпретация P-

значения как меры (силы) доказательства,

предоставляемого имеющимися данными,

против нулевой гипотезы.

• Однако, строго говоря, оно не является мерой в

математическом смысле (не обладает свойством

аддитивности) и не удовлетворяет, как

минимум, двум важнейшим принципам теории

статистики – Принципу правдоподобия и

Р-постулату.

11

Page 12: Syndrome of statistical leniency ppt

Принцип правдоподобия

• В словесной формулировке Принцип

правдоподобия есть положение о том, что

статистический анализ данных должен

оперировать теми и только теми данными,

которые реально получены в эксперименте. которые реально получены в эксперименте.

• В математических терминах Принцип

правдоподобия утверждает, что вся информация

о неизвестном параметре µ содержится в

функции правдоподобия для µ, вычисляемой из

полученных данных.

12

Page 13: Syndrome of statistical leniency ppt

• Однако, для вычисления Р-значения, как это

следует из его определения, используются не

только наблюдаемые в эксперименте данные,

но и все другие, еще менее вероятные, которые

в реальности не были наблюдены. в реальности не были наблюдены.

• Другими словами, вычисление Р-значения не

основано на функции правдоподобия и,

соответственно, не удовлетворяет Принципу

правдоподобия.

13

Page 14: Syndrome of statistical leniency ppt

Р-постулат

• Чтобы Р-значение служило реальной и адекватной

мерой статистического доказательства, оно должно

удовлетворять простому правилу (постулату) согласно

которому одинаковые P-значения должны

предоставлять одинаковые доказательства против предоставлять одинаковые доказательства против

нулевой гипотезы.

• Это правило называют «Р-постулатом»

• Wagenmakers E.-J. A practical solution to the pervasive

problems of p values // Psychonomic Bulletin & Review,

2007. - Vol. 14.- № 5. - P. 779-804.

• Однако, это минимальное требование не выполняется.

14

Page 15: Syndrome of statistical leniency ppt

Р-постулат

• Интуитивно можно понять, что Р = 0,01 для эксперимента с 10

наблюдениями явно не будет иметь той же доказательной

силы, что и Р = 0,01 для эксперимента с 300 наблюдениями.

• Равным образом, Р = 0,001, полученное в одном опыте, и

Р = 0,01 – в другом, не означает, что эффект, наблюдаемый в

первом опыте, в 10 раз более убедителен, чем эффект во первом опыте, в 10 раз более убедителен, чем эффект во

втором опыте.

• Это прекрасно понимал Р.А. Фишер:

• «Критерий значимости [P-значение] не позволяет нам

делать какие-либо выводы о проверяемой гипотезе в

терминах математической вероятности»

• Fisher R.A. The design of experiments. Edinburgh: Oliver & Boyd,

1935.

15

Page 16: Syndrome of statistical leniency ppt

«Парадокс» правила остановки

• Вероятность обманчивого доказательства,

основанного на малом Р-значении,

достигает 100% при увеличении числа

наблюдений до бесконечного ∞→nнаблюдений до бесконечного

НО!!

∞→n

( ) 10

→< HPcritval

Pr α

( ) γγ ≤<0

HLRPr

Page 17: Syndrome of statistical leniency ppt

А – одинаковые эффекты могут иметь разные P-значения.

B – разные эффекты могут иметь одинаковые P-значения.

Goodman S. A Dirty Dozen: Twelve P-Value Misconceptions. Semin. Hematol. 45:135-140 © 2008

17

Page 18: Syndrome of statistical leniency ppt

Распространенное заблуждение, или чем не

является P-значение

• Квинтэссенцию традиционных (частотнических)

заключений при проверке статистических гипотез

принято интерпретировать так:

• чем меньше P-значение, тем сильнее (весомее) доводы

(свидетельства, доказательства) против нулевой (свидетельства, доказательства) против нулевой

гипотезы H0, которые предоставляют нам

имеющиеся (наблюдаемые) данные; тем больше у нас

оснований сомневаться в H0.

• Отсюда невольно (и вроде бы естественно) возникает

соблазн интерпретировать P-значение как вероятность

нулевой гипотезы.

18

Page 19: Syndrome of statistical leniency ppt

P-значение не есть вероятность нулевой

гипотезы!

• Например, в известной книге С.Гланца можно встретить

утверждение:

• «Упрощая, можно сказать, что Р — это вероятность

справедливости нулевой гипотезы»

• Гланц С. Медико-биологическая статистика. — М.: • Гланц С. Медико-биологическая статистика. — М.:

Практика, 1998. — с. 119.

• Это мнение глубоко ошибочно и чревато пагубными

последствиями.

• К чести автора, в последующих (у нас не переведенных)

изданиях этой его книги оно отсутствует.

19

Page 20: Syndrome of statistical leniency ppt

+ CD ! Программа

«БИОСТАТИСТИКА»• Автор: Гланц С.

• Издательство: Практика

• c. 460, 1998 г.

• ISBN: 5-89816-009-4, 0-07-024268-2

• Принципиальная ошибка:

• P-значение можно • P-значение можно интерпретировать как вероятность нулевой гипотезы

• В последующих английских изданиях этой книги эта фраза отсутствует.

• Но их перевод на русский язык не предвидится.

20

Page 21: Syndrome of statistical leniency ppt

P-значение не есть вероятность нулевой

гипотезы!

• Поскольку Р-значение вычисляется в предположении, что верна

нулевая гипотеза, то оно никак не может быть одновременно

вероятностью того, что нулевая гипотеза неверна:

• P[D|H0] ≠ P[H0|D].

• Здесь D = |T| ≥ |tнабл.| суть все значения статистики критерия T,

которые равны наблюдаемому значению |t | и превышают его. которые равны наблюдаемому значению |tнабл.| и превышают его.

• Подробнее о том, чем не является Р-значение, см.

энциклопедическую статью:

• http://en.wikipedia.org/wiki/P-value

• и недавнюю работу С. Гудмана, в которой перечислена «грязная

дюжина» ошибочных интерпертаций Р-значения:

• Goodman S. A dirty dozen: Twelve P-value misconceptions // Semin.

Hematol., 2008. - Vol. 45. – P. 135-140.

21

Page 22: Syndrome of statistical leniency ppt

P-значение есть реализация вероятностной

переменной P*

• Кроме того, чрезвычайно важно осознавать, что P-значение

есть наблюдаемое значение соответствующей вероятностной

переменной (случайной величины) P*.

• Это означает, что всякий раз мы будем наблюдать одно из ее

возможных значений и в разных опытах оно будет

варьировать. варьировать.

• Когда нулевая гипотеза H0 верна, то Pval имеет непрерывное

равномерное распределение на отрезке [0; 1].

• Это означает, что в любом одиночном эксперименте при

справедливости гипотезы H0 мы можем получить любое P-

значение, как очень малое, близкое к нулю, так и очень

большое, близкое к единице.

22

Page 23: Syndrome of statistical leniency ppt

Незначимое Р-значение не означает, что верна Н0

• Это и есть теоретическое обоснование известных

утверждений, присутствующих во многих

руководствах, о том, что

• на основании наблюдаемого P-значения нельзя

принять нулевую гипотезу, когда Pval > α, т.е.

когда P-значение не преодолевает уровень

значимости α, который выбирается заранее в

качестве порогового (критического).

23

Page 24: Syndrome of statistical leniency ppt

Выбор порога для P-значения, и возможен ли он?

• Когда наблюдаемое P-значение мало, то у

исследователя зарождается сомнение:

действительно ли верна гипотеза H0, и он считает

себя в праве пойти на риск и принять решение

отклонить эту гипотезу. отклонить эту гипотезу.

• Однако важно понимать, что такое решение

является внестатистическим, ибо нет никаких

вероятностно-статистических или иных

теоретических соображений, какое значение Pval

следует считать настолько малым, чтобы смело

отвергнуть H0.

24

Page 25: Syndrome of statistical leniency ppt

Акт интеллектуальной смелости

• Всякий раз, принимая то или иное решение, мы

осуществляем акт интеллектуальной

смелости.

• На практике решение отклонить или принять

H0 непременно зависит от обстоятельств.

• Исследователь в каждой конкретной ситуации

обязан сам делать этот выбор и осознавать

возможные последствия и не забывать об

ответственности за принимаемые решения.

25

Page 26: Syndrome of statistical leniency ppt

Гипноз цифр 0,05 и 95%

• Наиболее часто в качестве критического порога

используется уровень значимости α = 0,05, и

статистический анализ в конечном итоге сводится к

сравнению наблюдаемого значения Pval с этим α, и

конечные результаты обычно представляются в виде

неравенств: неравенств:

• Pval > 0,05 или Pval < 0,05.

• К сожалениею, такое представление результатов анализа

до сих пор нередко встречается в публикациях, несмотря

на то, что в учебных руководствах и инструкциях для

авторов давно рекомендуется представлять конкретно

наблюдаемые значения Pval.

26

Page 27: Syndrome of statistical leniency ppt

Гипноз цифр 0,05 и 95% и статистическая

снисходительность

• Преодоление этого порогового уровня (Pval < 0,05) всего лишь

в одной выборке часто считается достаточным для вывода о

статистической значимости наблюдаемого эффекта.

• В последнем случае часто употребляется даже более сильное

утверждение: «эффект достоверен».

• Наряду с пороговым значением 0,05 для уровня значимости,

повсеместно (за редчайшими исключениями) используется

уровень (вероятность) доверия 0,95 и строятся 95%-е

интервалы доверия (доверительные интервалы).

• Более строго их следует называть «интервалами накрытия»

оцениваемого (неизвестного) параметра.

27

Page 28: Syndrome of statistical leniency ppt

Глотов Н.В., Животовский Л.А., Хованов Н.В., Хромов-Борисов Н.Н.

Биометрия, Л.: Изд-во ЛГУ, 1982. – 264 с.

• Выбор уровня значимости

определяется важностью

биологических выводов, которые

должен сделать экспериментатор.

• В настоящее время многие

биометрики склоняются к биометрики склоняются к

следующему правилу:

• а) если P > 0,05, то принимается

нулевая гипотеза;

• б) если P < 0,01, то нулевая гипотеза

отклоняется и принимается

конкурирующая;

• в) если 0,01 < P < 0,05, то результат

считается неопределенным.

28

Page 29: Syndrome of statistical leniency ppt

Курьез

• На выбор Фишером порогов для уровня значимости повлияли и

психологические причины.

• М. Кендалл вспоминал, что Фишер составил таблицы критических

значений (для уровней значимости 0,05; 0,02 и 0,01) из соображений

компактности и удобства пользования, а также с целью избежать

проблемы авторства с Карлом Пирсоном, с которым у него были

принципиальные разногласия.принципиальные разногласия.

• Цит. по: Dallal G.E. The Little Handbook of Statistical Practice. Why

P=0.05? http://www.jerrydallal.com/LHSP/p05.htm

• Кроме того, Фишер ориентировался на свой личный ограниченный

опыт статистического анализа результатов опытов, проводившихся с

сельскохозяйственными растениями на Ротамстедской

сельскохозяйственной станции.

• Фактически у него почти не было опыта анализа данных из других

областей экспериментальной науки, например, в медицине.

29

Page 30: Syndrome of statistical leniency ppt

Sir Ronald Aylmer Fisher

17 Feb 1890 - 29 July 1962

30

Page 31: Syndrome of statistical leniency ppt

Karl Pearson

27 March 1857 – 27 April 1936

31

Page 32: Syndrome of statistical leniency ppt

Андрей Николаевич Колмогоров

12 (25) апреля 1903 -20 октября 1987

• Пророк в

своем своем

отечестве

32

Page 33: Syndrome of statistical leniency ppt

912 стр.

33

Page 34: Syndrome of statistical leniency ppt

Вероятность и математическая

статистика. Энциклопедия• Издательство Большая Российская энциклопедия. 2003г. 912 стр.

ISBN 5-7107-7433-2. Тираж 10000 экз.

• Большинство статей сопровождается библиографией наиболее

важных работ по данной проблеме.

• Названия статей даны также в переводе на английский язык.

• Вторая часть - "Хрестоматия по теории вероятностей и • Вторая часть - "Хрестоматия по теории вероятностей и

математической статистике" содержит статьи, написанные для

отечественных энциклопедий прошлого, а также материалы

энциклопедического характера, опубликованные ранее в других

сочинениях.

• Особого внимания заслуживают не потерявшие своей актуальности

работы А.Н.Колмогорова.

34

Page 35: Syndrome of statistical leniency ppt

Колмогоров, 1951

• Более полувека тому назад (в 1951г.) А.Н. Колмогоров

отмечал:

• «При практическом употреблении вычисленных

значений вероятности мы неизбежно приходим к

вопросу о том, какими (сколь малыми) значениями вопросу о том, какими (сколь малыми) значениями

вероятностей мы можем пренебречь.

• На практике этот вопрос решается каждый раз по-

разному, в зависимости от того, насколько велика

необходимость быстрого перехода от накопления

надежных данных к их действительному

употреблению».

35

Page 36: Syndrome of statistical leniency ppt

Колмогоров, 1951

• «В спокойной обстановке научных исследований

принято пренебрегать лишь вероятностью в

0,003 (эта норма связана с так называемым

правилом трех сигма), а иногда требовать и еще

большего приближения вероятности отсутствия большего приближения вероятности отсутствия

ошибки к единице.

• В математической статистике вероятность,

которой решено пренебрегать в данном

исследовании, называют уровнем значимости».

36

Page 37: Syndrome of statistical leniency ppt

Колмогоров, 1951

• «Хотя в статистике обычно рекомендуют

пользоваться уровнями значимости от 0,05 при

предварительных ориентировочных исследованиях и

до 0,001 при окончательных серьезных выводах, часто

достижима значительно большая достоверность

[статистическая значимость – НХ] вероятностных

выводов. выводов.

• Например, основные выводы статистической физики

основаны на пренебрежении лишь вероятности

порядка меньшего 0, 000 000 000 1 (<10-10)».

• Воспроизведено в: Колмогоров А. Н. Вероятность / Вероятность и

математическая статистика. Энциклопедия / Гл. ред.

Ю. В. Прохоров. — М.: Изд-во «Большая Российская Энциклопедия»,

1999. – c. 97.

37

Page 38: Syndrome of statistical leniency ppt

Колмогоров, 1956

• Несколько позднее (в 1956 г.) Колмогоров повторил:

• «Вероятности, которыми принято пренебрегать в

различных практических приложениях, различны.

• Иногда в научных исследованиях ограничиваются

статистическими приемами, рассчитанными исходя статистическими приемами, рассчитанными исходя

из пренебрежения вероятностями в 0,05.

• Но это следует делать лишь в случаях, когда

собирание более обширного материала очень

затруднительно».

38

Page 39: Syndrome of statistical leniency ppt

Колмогоров, 1956

• «Если норма в 0,05 для серьезных научных исследований явно

недостаточна, то вероятностью ошибки в 0,001 или 0,003

по большей части принято пренебрегать даже в столь

академических и обстоятельных исследованиях, как

обработка астрономических наблюдений.

• Впрочем, иногда научные выводы, основанные на

применении вероятностных закономерностей, обладают и применении вероятностных закономерностей, обладают и

значительно большей достоверностью [статистической

значимостью – НХ] (то есть построены на пренебрежении

значительно меньшими вероятностями)».

• Воспроизведено в: Колмогоров А.Н. Теория вероятностей /

Вероятность и математическая статистика. Энциклопедия / Гл.

ред. Ю. В. Прохоров. — М.: Изд-во «Большая Российская

Энциклопедия», 1999. – c. 874.

39

Page 40: Syndrome of statistical leniency ppt

• В наши дни Колмогорову вторят зарубежные авторы:

• «P-значение близкое к 0,05 не является сильным

свидетельством (доказательством) против нулевой

гипотезы.

• Сильными свидетельствами против Н0 следует • Сильными свидетельствами против Н0 следует

признавать значения P < 0,001».

• Sterne J.A.C., Davey Smith G. Sifting the evidence – what’s

wrong with significance tests? // BMJ, 2001. - Vol. 322. - P.

227-231.

40

Page 41: Syndrome of statistical leniency ppt

• При бурлящей в наше время «золотой лихорадке» вокруг изучения

генетических предрасположенностей к общим болезням, т.е. поиска

связей («ассоциаций») между генетическим полиморфизмом и

заболеваниями рекомендуется ориентироваться на еще более

низкие пороговые значения уровня значимости:

• «Вместо повсеместно используемого порогового (критического) • «Вместо повсеместно используемого порогового (критического)

уровня значимости 0,05 в качестве такового мы должны

использовать значение порядка 5××××10-5.

• При таком уровне значимости потребуется обследовать две

группы здоровых и больных по 5000 человек в каждой».

• Colhoun H. M., McKeigue P. M. , Davey Smith G. Problems of reporting

genetic associations with complex outcomes. Lancet, 2003. - Vol. 361. -

№ 9360. – P. 865-872.

41

Page 42: Syndrome of statistical leniency ppt

• Таким образом, явно не следует слепо применять

инструментарий процедур проверки значимости

нулевой гипотезы и основывать свои выводы

исключительно на получаемых Р-значениях.

• Осмысленные выводы должны основываться на • Осмысленные выводы должны основываться на

разумном взвешивании Р-значений и на использовании

дополнительной информации о других не менее важных

показателях, таких как мощность, размер эффекта,

количество наблюдений, о результатах прешествующих

работ, предсказаниях действующей теории и т.п.

42

Page 43: Syndrome of statistical leniency ppt

Гибкие Р-значения

• Сам Фишер подчеркивал, что:

• «В действительности ни один исследователь не пользуется

фиксированным уровнем значимости с которым из года в

год и при любых обстоятельствах он отвергает нулевые

гипотезы.

• Он больше доверяет своему уму и каждый конкретный

случай рассматривает в свете совокупности имеющихся

доказательств и своих идей и представлений».

• Fisher R. A. Statistical Methods and Scientific Inference.

Edinburgh: Oliver & Boyd. 1956.

• Такой подход иногда интепретируют как призыв использовать

«гибкие» Р-значения.

43

Page 44: Syndrome of statistical leniency ppt

Не «достоверный», но всего лишь

«статистически значимый»

• Надо стараться избегать слова «достоверность», ибо в русском

языке оно означает подлинный, несомненно верный, не

вызывающий сомнения.

• В теории вероятностей достоверное событие – событие с

вероятностью, равной 1.

• Если вдуматься, нередко встречающееся в биомедицинской • Если вдуматься, нередко встречающееся в биомедицинской

литературе словосочетание «статистическая достоверность» есть

оксюморон – сочетание несочетаемого.

• Всестороннее обсуждение этого вопроса см. в:

• Зорин Н.А. О неправильном употреблении термина

«достоверность» в российских научных психиатрических

и общемедицинских статьях. 2000.

http://www.biometrica.tomsk.ru/let1.htm

44

Page 45: Syndrome of statistical leniency ppt

Ритуал проверки нулевых гипотез

• 1. Формулируется нулевая гипотеза о «равенстве нулю

разности между средними значениями» или о

«равенстве нулю коэффициента корреляции».

• 2. Альтернативная гипотеза не конкретизируется.

• 3. Для отклонения нулевой гипотезы по умолчанию

используется уровень значимости 5%.используется уровень значимости 5%.

• 4. Если эффект (отклонение от нулевого значения)

статистически значим, то принимается альтернативная

гипотеза.

• 5. Результат сообщается в виде неравенства p < 0,05, p <

0,01 или p < 0,001 (как ближайшее к полученному p-

значению).

Page 46: Syndrome of statistical leniency ppt

Доверяя, повторяй

• Повторение исследования является решающим

(ключевым) аспектом научного метода.

• Один эксперимент, как бы хорошо он ни был

спланирован, не может обеспечить

неопровержимое доказательство правильности

теории или эффективности вмешательства

(воздействия).

• Ein Versuch kein Versuch.

46

Page 47: Syndrome of statistical leniency ppt

Культ изолированного исследования

• Руководства по статистическим методам

сосредоточиваются зачастую на том, как анализировать

одиночный набор данных, пытаясь во что бы то ни стало

ответить на сакраментальный вопрос:

• «Является ли результат значимым?»,• «Является ли результат значимым?»,

• а не на том, как интерпретировать много наборов

данных, как их обобщить и ответить на вопрос:

• «Является ли результат фактом?».

• В статистических руководствах и статьях преобладает

«культ изолированного исследования».

47

Page 48: Syndrome of statistical leniency ppt

Доверяя, повторяй

• Часто считается, что если получен «статистически

значимый» результат, то это исключает

необходимость повторить исследование.

• Повторность часто рассматривается как нечто

суетное и бесполезное.

• На самом же деле,

• «Проверка нулевой гипотезы есть метод

обнаружения маловероятных событий,

которые заслуживают дальнейшего изучения»

(Fisher).

48

Page 49: Syndrome of statistical leniency ppt

Джон Уайлдер Тьюки (John Wilder Tukey, 16.04.1915 — 26.07.2000)

• Исследования должны

быть как минимум

двухэтапными.

• Первый этап – разведочное

исследование.исследование.

• Второй этап – проверочное

(порождающее гипотезы)

исследование.

• Оно планируется на основе

результатов разведочного

иследования.

49

Page 50: Syndrome of statistical leniency ppt

Воспроизводимость и предсказательная способность

P-значений и доверительных интервалов (n = 32)

Использована программа “ESCI PPS p intervals”

http://www.latrobe.edu.au/psy/esci/. Cumming G. Replication and p intervals:

p values predict the future only vaguely, but confidence intervals do much

better // Persp. Psychol. Sci., 2008. - Vol. 3. – P. 286-300.

50

Page 51: Syndrome of statistical leniency ppt

Воспроизводимость и предсказательная способность

P-значений и доверительных интервалов (n = 32)

Использована программа “ESCI PPS p intervals”

http://www.latrobe.edu.au/psy/esci/. Cumming G. Replication and p intervals:

p values predict the future only vaguely, but confidence intervals do much

better // Persp. Psychol. Sci., 2008. - Vol. 3. – P. 286-300. 51

Page 52: Syndrome of statistical leniency ppt

Стандартизированный размер эффекта

MMd 21

−=

pooleds

MMd 21

−=

Page 53: Syndrome of statistical leniency ppt

Интерпретация размера эффекта по Хопкинсу (Hopkins)

http://www.sportsci.org/resource/stats/

Размер эффекта, ES Градация эффекта

0 – 0,2 Ничтожный

0,2 – 0,6 Малый (слабый)

0,6 – 1,2 Умеренный0,6 – 1,2 Умеренный

1,2 – 2,0 Большой (сильный)

2,0 – 4,0 Очень большой

4,0 - ∞∞∞∞ Абсолютный

Page 54: Syndrome of statistical leniency ppt

• Относительные меры эффекта OR, RR, RRR

часто приводят к впечатляющим цифрам,

даже когда абсолютные эффекты

воздействия оказываются малымивоздействия оказываются малыми

• Примеры:

• 1. р1=0,6; р2=0,1; RRR=83%; ARR=0,5; NNT=2

• 2. p1=0,06; p2=0,01; RRR=83%; но ARR=0,05

и NNT=20

54

Page 55: Syndrome of statistical leniency ppt

Словесная шкала для размеров эффекта

Мера эффекта Градация

эффектаr d ES RR OR LR NNT

0 0 0 1 1 1 ∞ ничтожный

0,1 0,1 0,2 1,2 1,5 2-5 5 слабый

0,5 0,5 1,2 3,0 9,0 5-10 2 сильный

0,9 0,9 4,0 19 360 >10 очень

сильный

1,0 1,0 ∞ ∞ ∞ ∞ 1 абсолютный

Page 56: Syndrome of statistical leniency ppt

Программа LePrephttp://www.univ-rouen.fr/LMRS/Persopage/Lecoutre/PAC.htm

56

Page 57: Syndrome of statistical leniency ppt

Воспроизводимость и предсказание, LePrephttp://www.univ-rouen.fr/LMRS/Persopage/Lecoutre/ErisA.html

57

Page 58: Syndrome of statistical leniency ppt

LePrep, предсказание результата

последующего повторного эксперимента

58

Page 59: Syndrome of statistical leniency ppt

10-кратное увеличение объема выборки

59

Page 60: Syndrome of statistical leniency ppt

Jeffery S., Saggar Malik A.K., CrosbY A., BlanD M., Eastwood J.B., Amoah-Danquah J., Acheampong J.W., Plange-Rhule J.

A dominant relationship between the ACE D allele and serum ACE levels in a Ghanaian population

J. Med. Genet. 1999;36:869-870

Table 1 Serum ACE in U/l for each ACE genotype

ACE genotype

II ID DD

24 26 48 82 60 50 21 23

27 48 62 42 56 20 43 35

42 31 47 74 57 37 33 8

42 15 35 45 57 24 46 60

19 31 25 25 24 53 89 31

36 43 55 98 62 83 70

60

36 43 55 98 62 83 70

25 44 28 62 27 50 125

26 61 52 82 21 20 69

33 52 56 71 21 65

74 62 68 33 35 77

32 38 97 34 90 65

44 37 32 37 117 82

30 39 36 35 100 38

29 132 103 77 41 38

Mean

(SD)

34.5 (13.6) 51.3 (23.8) 53.3 (29.5)

Median

(range)

31 (19-74) 47.5 (15-132) 46 (8-125)

Page 61: Syndrome of statistical leniency ppt

Программа Instat+http://www.rdg.ac.uk/ssc/software/instat/instat.html

61

Page 62: Syndrome of statistical leniency ppt

Инсерционно-делеционный диморфизм в гене ACE

и активность АПФ, программа Instat+

http://www.rdg.ac.uk/ssc/software/instat/instat.html

Page 63: Syndrome of statistical leniency ppt

63

95%-е ПИ и ДИ для активности АПФ

Page 64: Syndrome of statistical leniency ppt

http://smed.ru/guides/363/?q=%E0%ED%E3%E8%EE&search_type=tree#article

Эталонные (референсные) значения

Возраст Активность, Ед/л

< 12 9,4 – 37

13 – 16 9 – 33,4

Взрослые 6,1 – 26,6Взрослые 6,1 – 26,6

64

У здоровых индивидуумов в норме уровень концентрации ACE между индивидуумами может колебаться в 5 раз, а внутрииндивидуальная вариабельность намного ниже.http://medbiol.ru/medbiol/ace/00008b43.htm

Page 65: Syndrome of statistical leniency ppt

Калибровка P-значений

• Как уже было сказано, Р-значение не может быть

вероятностью нулевой гипотезы P(H0).

• Но именно вероятность нулевой гипотезы, очевидно, должна

интересовать исследователя более всего.

• К сожалению традиционная частотническая статистика не • К сожалению традиционная частотническая статистика не

способно вычислять эту веротяность.

• Это может делать бейзовская статистика.

• Уже относительно давно статистики-бейзовцы предложили

калибровать Р-значения относительно вероятности P(H0).

• В простейшем варианте удается оценить не P(H0), а лишь ее

нижнюю границу (минимально достижимое значение) P(H0).

65

Page 66: Syndrome of statistical leniency ppt

Калибровка p-значения

• Vovk V. G.

• A logic of probability, with application to the foundations of statistics

• Journal of the Royal Statistical Society. Series B (Methodological),

• Vol. 55, No. 2 (1993), pp. 317-351.

( ) ( )

• - нижняя граница для вероятности нулевой гипотезы H0

( ) ( )ppDHP pln

ln −≥ +11

0

66

Page 67: Syndrome of statistical leniency ppt

Калибровка p-значения

• Sellke T., Bayarri M.J., Berger J.O.

• Calibration of p Values for Testing Precise Null Hypotheses

• The American Statistician, Vol. 55, No. 1. (2001), pp. 62-71.

• При

ep 1<

( )1

0

11

−+≥

ppeDHP

ln

ep 1<

67

Page 68: Syndrome of statistical leniency ppt

«Цена» Р-значения

P-значение

Нижняя граница

для вероятности

нулевой гипотезы

P(H0)

Верхняя граница

для вероятности

воспроизведения

Рrepr

0,05 > 30% < 50%0,05 > 30% < 50%

0,01 > 10% < 75%

0,001 > 2% < 90%Для наглядности значения в таблице округлены до первой значащей цифры. Более точно значения для P(H0) (сверху вниз) равны 29%, 11% и 1,8%.

68

Page 69: Syndrome of statistical leniency ppt

Значение и назначение

P-значения

69

Page 70: Syndrome of statistical leniency ppt

Заключение

• Надо перестать судорожно цепляться за уровень

значимости α = 0,05 (а, скоре всего, и за α = 0,01)

и некритично объявлять случаи его преодоления

(Pval < 0,05) статистически значимыми (или даже

«достоверными») событиями. «достоверными») событиями.

• Если мы сконцентрируемся на преодолении

уровня α = 0,001, т.е. будем считать

статистически значимыми Pval < 0,001, то в итоге

сможем съэкономить массу времени и средств.

70

Page 71: Syndrome of statistical leniency ppt

Статистическая значимость и

размер эффекта

• Эффект (различие, связь, риск, польза,

ассоциация и т. п.) может быть статистически

значимым, но его практическая (например,

клиническая) ценность может оказаться

ничтожной.ничтожной.

• «Статистически значимый» не означает

«значительный», «практически важный»,

«ценный».

71

Page 72: Syndrome of statistical leniency ppt

Излечися сам

• Единственный способ излечиться от

синдрома статистической

снисходительности

• – это многократно повторять • – это многократно повторять

эксперименты и изучать

воспроизводимость наблюдаемых

эффектов, которые при Pval < 0,05 слишком

часто могут оказаться ложными.

72

Page 73: Syndrome of statistical leniency ppt

Повторение – мать познания

• Повторение составляет суть науки:

• «ученый должен всегда задумываться о том,

что произойдет, если он или другой ученый

повторят его эксперимент» (Guttman, 1977).

• «Ученые разработали метод определения

надежности (валидности) своих результатов.

• Они научились задавать вопрос:

воспроизводимы ли они?» (Scherr, 1983).

73

Page 74: Syndrome of statistical leniency ppt

Михаил Ефимович Лобашев (11.11.1907 – 04.01.1971)

• Можете заниматься в

науке чем угодно,

только не забывайте о

последствиях и об

ответственности.ответственности.

74

Page 75: Syndrome of statistical leniency ppt

Предсказательная способность и

экономическая эффективность

клинико-генетической

паспортизации

75

Page 76: Syndrome of statistical leniency ppt

• Решающими показателями качества

любого метода диагностики являются не

отношения шансов (OR) или отношения

рисков (RR), рисков (RR),

• но предсказательные вероятности

(прогностические ценности)

положительного и отрицательного

результатов диагноза: PPV и NPV.

76

Page 77: Syndrome of statistical leniency ppt

Рекомендации• Khoury M.J., McBride C.M., Schully S.D., Ioannidis J.P.A., Feero W.G.,

Janssens A.C.J.W., Gwinn M., Simons-Morton D.G., Bernhardt J.M., Cargill

M., Chanock S.J., Church G.M., Coates R.J., Collins F.S., Croyle R.T., Davis

B.R., Downing G.J., DuRoss A., Friedman S., Gail M.H., Ginsburg G.S., Green

R.C., Greene M.H., Greenland P., Gulcher J.R., Hsu A., Hudson K.L., Kardia

S.L.R., Kimmel P.L., Lauer M.S., Miller A.M., Offit K., Ransohoff D.F., Roberts

J.S., Rasooly R.S., Stefansson K., Terry S.F., Teutsch S.M., Trepanier A., J.S., Rasooly R.S., Stefansson K., Terry S.F., Teutsch S.M., Trepanier A.,

Wanke K.L., Witte J.S., Xu J.

• The Scientific Foundation for Personal Genomics: Recommendations

from a National Institutes of Health–Centers for Disease Control and

Prevention Multidisciplinary Workshop

• Genet. Med. 2009:11(8):559 –567

77

Page 78: Syndrome of statistical leniency ppt

Использование генетических ассоциаций для

оценки риска и предсказания болезни

• Даже если генетическая ассоциация оказывается

статистически высоко значимой, то непременно

встает вопрос, насколько полезной будет эта

информация для оценки риска и предсказания

болезни?болезни?

• Необходимо измерять чувствительность,

специфичность, ценность положительного

предсказания (PPV) и ценность отрицательного

предсказания (NPV).

78

Page 79: Syndrome of statistical leniency ppt

Теорема Бейза в действии

79

Page 80: Syndrome of statistical leniency ppt

БОГО

• Мможно предложить называть

многофакторные болезни

• болезнями с ограниченной генетической

обусловленностью –обусловленностью –

• БОГО

80

Page 81: Syndrome of statistical leniency ppt

• Пусть распространенность болезни с ограниченной генетической

обусловленностью (БОГО) в некоторой популяции равна

• P(D+) = 1%.

• Допустим, что у больных доля носителей генотипа (аллели,

гаплотипа) g1, предрасполагающего к данной БОГО, равна

• P(g1|D+) = 20%

• и она в 2 раза выше, чем у индивидуумов без этой БОГО: • и она в 2 раза выше, чем у индивидуумов без этой БОГО:

• P(g1|D-) = 10%.

• Этому соответствуют значения

• RR = 2,

• OR = 4,4

• и разности рисков

• RD = 10%.

81

Page 82: Syndrome of statistical leniency ppt

• По формуле Бейза вероятность БОГО у носителя генотипа g1

примерно в 2 раза превышает ее распространенность:

• PPV1 = P(D+|g1) = 1,98%.

• Вряд ли на основе столь малого значения можно делать выводы о

наличии или развитии данной БОГО у конкретного индивидуума.

• Допустим теперь, что есть еще другой предрасполагающий к данной

БОГО генотип g с такими же характеристиками. БОГО генотип g2 с такими же характеристиками.

• Вероятность БОГО у носителей обоих генотипов совместно (g1 и g2)

возрастает по сравнению с носителями каждого из них по

отдельности (g1 или g2):

• PPV1,2 = P(D+|g1,g2) = 3,9%.

• Очевидно, что чем больше в генотипе предрасполагающих аллелей,

тем выше вероятность возникновения или развития данной БОГО у

его носителей.

82

Page 83: Syndrome of statistical leniency ppt

• Однако доля носителей таких генотипов в популяции снижается

экспоненциально, и уже для 6-и маркеров составляет 1 на миллион

при PPV1,…,6 = P(D+|g1,…, g6) = 39%, которая всего в 10 раз выше, чем

для пары генотипов.

• Для носителей одновременно 9-и маркеров вероятность БЭНП

достигает 91%, а у носителей 10-и таких маркеров – 95%. достигает 91%, а у носителей 10-и таких маркеров – 95%.

• Но обнаружить таких индивидуумов практически невозможно: их

доли в популяции составляют 10-9 и 10-10.

• Фактически это будет один человек на Земле.

83

Page 84: Syndrome of statistical leniency ppt

Предсказательная ценность нескольких независимых

предрасполагающих генетических маркеров

Число

предрасполагающих

локусов в генотипе

PPV

Доля носителей

предрасполагающего

генотипа G+ в популяции

1 0,020 0,1

2 0,039 0,01

3 0,075 0,001

4 0,14 0,0001

5 0,24 10-5

6 0,39 10-6

7 0,71 10-7

8 0,84 10-8

9 0,91 10-9

10 0,95 10-10

84

Page 85: Syndrome of statistical leniency ppt

Экономическая

эффективность клинико-

генетической паспортизации

85

Page 86: Syndrome of statistical leniency ppt

Rembold C.M. Number needed to screen: development of a statistic for

disease screening. BMJ – 1998. – Vol. 317. – P. 307–312.

• Полезным и наглядным показателем

эффективности и продуктивности

генотипирования является NNG (Number Needed

to be Genotyped) – количество подлежащих

генотипировнию:генотипировнию:

86

Page 87: Syndrome of statistical leniency ppt

Экономическая эффективность генотипирования

БОГО

• Пусть распространенность болезни с ограниченной генетической

обусловленнностью (БОГО) в некоторой популяции равна

• P(D+) = 1%.

• Допустим, что разность рисков RD = 0,1.

• Тогда

• NNG = 1/(0,1 ×××× 0,01) = 1000.• NNG = 1/(0,1 ×××× 0,01) = 1000.

• Это означает, что надо генотипировать примерно 1000 человек,

чтобы этим методом выявить на одного больного человека больше,

чем эталонным (стандартным) методом.

• Пусть цена одного анализа составляет 100 у.е.

• Тогда для выявления одного больного надо затратить примерно 100

тыс. у.е.

• При генотипировании по k маркерам затраты возрастут в k раз.

87

Page 88: Syndrome of statistical leniency ppt

Массовый маммографический

скрининг

• Emily Banks, Gillian Reeves, Valerie Beral, Diana Bull, Barbara Crossley,

Moya Simmonds, Elizabeth Hilton, Stephen Bailey, Nigel Barrett, Peter

Briers, Ruth English, Alan Jackson, Elizabeth Kutt, Janet Lavelle, Linda

Rockall, Matthew G Wallis, Mary Wilson and Julietta Patnick

• Influence of personal characteristics of individual women on sensitivity

and specificity of mammography in the Million Women Study: cohort

study

• BMJ 2004;329;477

Page 89: Syndrome of statistical leniency ppt

Маммографическая процедура

Page 90: Syndrome of statistical leniency ppt

Так выглядит рак молочной железы на рентгеновском

снимке (белое, яркое пятно с нечеткими краями)

http://www.breast-cancer.ru/diagnosis/mammogram.html

Page 91: Syndrome of statistical leniency ppt

AtteStathttp://attestatsoft.com/download.htm

Маммо-

графия

Рак молочной

железы

Всего

есть нет

• Критерий хи-квадрат:

• χχχχ2 = 14119,4; P = 10-300

• Распространенность

(вычисленная):

• Prev = 0,0059 ≈ 0,6%+ 629 3 885 4 514

− 97 117 744 117 841

Всего 726 121 629 122 355

• Prev = 0,0059 ≈ 0,6%

• Чувствительность:

• Sen = 0,820,870,91

• Специфичность:

• Spe = 0,9660,9680,970

Page 92: Syndrome of statistical leniency ppt

Проверьте свою интуицию

• Допустим, что у женщины (не дай бог)

маммография дала положительный

результат.

• Как Вы думаете, какова вероятность того,

что этой женщины действительно рак

молочной железы?

Page 93: Syndrome of statistical leniency ppt

PPV и NPV - предсказательные способности

положительного и отрицательного результатов

• Прогностичность

положительного

результата:

• PPV = a/(a + b) =

• Прогностичность

отрицательного

результата:

• NPV = d/(c + d) =

• = 629 : 4514 =

• = 0,14

• PPV = 0,120,140,16 ≈ 14%

• = 117744 : 117841 =

• = 0,9992

• NPV = 0,99890,99920,9994

Page 94: Syndrome of statistical leniency ppt

PPVNPV.xlswww.cardiff.ac.uk/medic/aboutus/departments/

primarycareandpublichealth/resources/PPVNPV.xls

Page 95: Syndrome of statistical leniency ppt

Utility of the apolipoprotein E genotype in the

diagnosis of Alzheimer’s disease

• Mayeux R., Saunders A.M., Shea S., Mirra S., Evans D., Roses A.D.,

Hyman B.T., Crain B., Tang M., Phelps C.H.

N. Engl. J. Med. 1998; 338:506-511.• N. Engl. J. Med. 1998; 338:506-511.

Page 96: Syndrome of statistical leniency ppt

APPENDIX

• В исследовании принимали участие также следующие исследователи и Центры по болезни

Альцгеймера:

• Baylor College of Medicine: S. Appel, R. Doody, J. Kirkpatrick, J. Li; Case Western Reserve University: P.

Whitehouse, D. Geldmacher, J. Stuckey; Columbia University: M. Shelanski, J. Goldman, B. Tycko; Duke

University Medical Center: M. Pericak-Vance, C. Hulette; Emory University: M. Gearing, H. Kim; Harvard

Medical School: J. Growdon, D. Reardon, T. Hedley-Whyte; Indiana University: B. Ghetti, M. Farlow, H.

Hendrie, F. Unverzagt; Johns Hopkins University: D. Price, C. Kawas; Mayo Clinic: R. Petersen, S. Waring,

J. Parisi, S. Thibodeau; Mount Sinai School of Medicine: K. Davis, D. Marin, H. Haroutunian, D.

Greenberg; New York University: S. Ferris, B. Quinn, B. Reisberg, M. de Leon; Oregon Health Sciences Greenberg; New York University: S. Ferris, B. Quinn, B. Reisberg, M. de Leon; Oregon Health Sciences

University: J. Kaye, G. Murdoch, M. Ball; Rush–Presbyterian–St. Luke’s: D. Bennett, E. Cochran; University

of California–Davis: W. Jagust, B. Reed, W. Ellis; University of California–Los Angeles: H. Vinters, J.

Cummings; University of California–San Diego: L. Thal, R. Katzman, D. Galasko, M. Sundsmo; University

of Kansas: W. Koller, K. Lyons; University of Kentucky: W. Markesbery, D. Wekstein, M. Kindy; University

of Michigan: S. Gilman, N. Foster, R. Albin, A. Sima, J. Fink; University of Pennsylvania: J. Trojanowski, C.

Clark; University of Pittsburgh: S. DeKosky, M. Kamboh, R. Ferrell; University of Rochester: P. Coleman,

D. Ryan; University of California–Irvine: C. Finch, J. Buckwalter, C. Miller; University of Texas

Southwestern Medical Center: R. Rosenberg, C. White III, M. Weiner; University of Washington–Seattle:

M. Raskind, E. Peskind, J. Leverenz, D. Nochlin; Washington University Medical Center: J. Morris, E.

Grant, A. Goate.

Page 97: Syndrome of statistical leniency ppt

Соответствие между наличием аллели APOE*ε4 и

патологическим диагнозом болезни Альцгеймера у 2188

пациентов с деменцией (приобретенным слабоумием)

Генотип по гену APOE

Патологический диагноз

Болезнь Альцгеймера Другие причины

слабоумия

Количество больных

Наличие одной или обеих

аллелей ε4

1142 133

аллелей ε4

Отсутствие аллеи ε4 628 285

Всего 1770 418

Чувствительность

диагностики БА по

наличию аллели APOE*ε4

1142:1770≈65%

0,620,650,67

Специфичность

диагностики БА по

наличию аллели APOE*ε4

285:418≈68%

0,620,680,74

Page 98: Syndrome of statistical leniency ppt

PPVNPV.xlswww.cardiff.ac.uk/medic/aboutus/departments/

primarycareandpublichealth/resources/PPVNPV.xls

Page 99: Syndrome of statistical leniency ppt

Ощутите разницу

Маммография APOE

Page 100: Syndrome of statistical leniency ppt

Von Stein P., Lofberg R., Kuznetsov N.V., Gielen A.W., Persson J.-O.,

Sundberg R., Hellstrom K., Eriksson A., Befrits R., Ost A., Von Stein O.D.

Multigene analysis can discriminate between ulcerative colitis, Crohn’s

disease, and irritable bowel syndrome. Gastroenterol. 2008; 134:1869–1881

100

Анализ дифференциальной экспрессии генов, специфичных для болезни Крона, может оказаться быстрым и надежным методом диагностики.

Page 101: Syndrome of statistical leniency ppt

ПСА

Уровень

ПСА, нг/мл

Случай Контроль

≤ 4,0 221 1439

4,1 – 9,9 926 233

10,0 – 19,9 654 3810,0 – 19,9 654 38

20,0 – 49,9 457 14

50,0 – 99,9 229 2

≥ 100 317 1

AUC = 0,900,920,93

Prev = 8% = 0,08

101

Page 102: Syndrome of statistical leniency ppt

Kraft P., Wacholder S., Cornelis M.C., Hu F.B., Hayes R.B., Thomas G., Hoover R.,

David J. Hunter D.J., Chanock S. Beyond odds ratios — communicating disease risk

based on genetic profiles. Nature Rev. Genetics Vol. 10, 2009, 264-269.

Сильная статистич-еская связь между генотипом и болезнью не может может служить показателем предсказа-тельной ценности.

AUC = 0,60 и AUC = 0,57

102

Page 103: Syndrome of statistical leniency ppt

Huett A., Xavier R.J. Neither hide nor hair: the difficulty of identifying useful

disease biomarkers. Gastroenterology Vol. 134, No. 7, p. 2164-2168.

Идеализиро-ванная схема диагностики в постгеномную

103

постгеномную эру

Page 104: Syndrome of statistical leniency ppt

Фармакогенетика

• Lenzini P., Wadelius M., Kimmel S., Anderson J.L., Jorgensen

A.L., Pirmohamed M., Caldwell M.D., Limdi N., Burmester

J.K., Dowd M.B., Angchaisuksiri P., Bass A.R., Chen J.,

Eriksson N., Rane A., Lindh J.D., Carlquist J.F., Horne B.D.,

Grice G., Milligan P.E., Eby C., Shin J., Kim H., Kurnik D., Stein Grice G., Milligan P.E., Eby C., Shin J., Kim H., Kurnik D., Stein

C.M., McMillin G., Pendleton R.C., Berg R.L., Deloukas P.,

Gage B.F.

• Integration of genetic, clinical, and INR data to refine

warfarin dosing.

• Clin. Pharmacol. Ther. Volume 87, No 5, 2010, 572-578.

104

Page 105: Syndrome of statistical leniency ppt

Индивидуальный подбор доз фарфарина

• Фармакогенетическая поддерживающая доза (mg/week) =

• EXP [3,10894 − 0,00767 ×××× age − 0,51611 ×××× ln(INR) − 0,23032 ×××× VKORC1-

1639 G>A − 0,14745 ×××× CYP2C9*2 − 0,3077 ×××× CYP2C9*3 + 0,24597 ×××× BSA +

0,26729 ×××× Target INR − 0,09644 ×××× African origin − 0,2059 ×××× stroke −

0,11216 ×××× diabetes − 0,1035 ×××× amiodarone use − 0,19275 ×××× fluvastatin

use + 0,0169 ×××× dose−2 + 0,02018 ×××× dose−3 + 0,01065 ×××× dose−4].use + 0,0169 ×××× dose−2 + 0,02018 ×××× dose−3 + 0,01065 ×××× dose−4].

• Клиническая поддерживающая доза (mg/week) =

• EXP [2,81602 − 0,76679 ×××× ln(INR) − 0,0059 ×××× age + 0,27815 ×××× target INR −

0,16759 ×××× diabetes + 0,17675 ×××× BSA − 0,22844 ×××× stroke − 0,25487 ××××

fluvastatin use + 0,07123 ×××× African origin − 0,11137 ×××× amiodarone use +

0,03471 ×××× dose−2 + 0,03047 ×××× dose−3 + 0,01929 ×××× dose−4].

105

Page 106: Syndrome of statistical leniency ppt

106

Фармакогенетически предсказанные дозы варфарина

Клинически предсказанные дозы фарфарина

Page 107: Syndrome of statistical leniency ppt

Репрезентативность выборки

• Один из важнейших вопросов, решаемых

аналитической статистикой:

• Достаточно ли имеющихся статистических

данных для того, чтобы выводы,

сделанные на их основе, были точными и сделанные на их основе, были точными и

надежными?

• Другими словами, представительна ли

(репрезентативна ли) имеющаяся

выборка?

107

Page 108: Syndrome of statistical leniency ppt

Босс В. Лекции по математике. Т. 4: Вероятность,

информация, статистика. М.: КомКнига, 2005. – 216 с.

• Сколько лягушек

придется

перецеловать, пока не перецеловать, пока не

найдешь свою

принцессу ?

108

Page 109: Syndrome of statistical leniency ppt

Статистика с доверием

• Дает ли статистика нам право

доверять ей?

• Как проверить, является ли

игральная кость правильной?

109

Page 110: Syndrome of statistical leniency ppt

Имитация ЗБЧ, программа SUStats.jarhttp://www.jsc.nildram.co.uk/examples/sustats/SUStats.html

110

Page 111: Syndrome of statistical leniency ppt

Имитация ЗБЧ, программа SUStatshttp://www.jsc.nildram.co.uk/examples/sustats/SUStats.html

111

Page 112: Syndrome of statistical leniency ppt

Donahue M.P., Allen A.S., Genetic association studies in cardiology

Am. Heart J. 2005; 149:964- 70.

112

Page 113: Syndrome of statistical leniency ppt

Объемы выборок у Менделя и у его

последователей и опровергателей

Автор Желтые Зеленые Всего Согласие с 3 : 1

Pval BF01

Mendel 6022 2001 8003 1,0 82,4

Correns 1394 453 1847 0,66 35,7

Tschermak 3580 1190 4770 0,95 63,5

Bateson 11903 3903 15806 0,38 78,1Bateson 11903 3903 15806 0,38 78,1

Hurst 1310 445 1755 0,75 36,2

Lock 1438 514 1952 0,18 16,1

Darbishire 108866 36123 144989 0,45 264,3

Ермолаева 6206 2225 8431 0,0035 1,1

Всего 140699 46854 187553 0,86 392,5

Однород-

ность

Pval = 0,096;

BF01 = 2,7·109

113

Page 114: Syndrome of statistical leniency ppt

Статистика – способ мышления

• Две основные идеологии статистических рассуждений:

• Бейзовская (Бейзианская) и

• Частотническая (частотная)

• В частотнической идеологии выделяются два основных

течения:

• Фишера и • Фишера и

• Неймана-Пирсона

• Пользователи их не всегда различают, и отсюда

возникают серьезные недоразумения.

114

Page 115: Syndrome of statistical leniency ppt

Reverend Thomas Bayes [bɛi:z]) – Преподобный Томас Бейз

(Байес, Бейес) c. 1702 – 17.04.1761

115

Page 116: Syndrome of statistical leniency ppt

Проверьте свою интуицию

• Допустим, я уговорил Вас сыграть со мной в орлянку.

• Я подбрасываю монету, и каждый раз она выпадает

одной стороной – орлом.

• Вопрос 1:

• начиная с какого раза Вы заподозрите неладное? И • начиная с какого раза Вы заподозрите неладное? И

решите, что я везучий, или ловкач?

• Вопрос 2:

• начиная с какого раза Вы обвините меня в

жульничестве? И определенно решите, что моя монета

фальшивая – с обеих сторон у нее орел?

Page 117: Syndrome of statistical leniency ppt

Задача

• Я подбросил монету 10 раз, и все 10 раз монета выпала

вверх одной стороной (например, орлом).

• Вопрос:

• Что можно сказать обо мне или о монете:

• Можно ли признать монету правильной (идеальной)?• Можно ли признать монету правильной (идеальной)?

• Или монета фальшивая?

• Честный ли я, везучий ли я, или ловкач, или жулик?

• Если монета недоступна для непосредственного осмотра,

то задача неизбежно становится вероятностно-

статистической.

117

Page 118: Syndrome of statistical leniency ppt

Бейзовская логика - I

• Две модели:

• M1 – монета идеальная (правильная), т.е. параметр Модели 1:

• ϕϕϕϕ = Pr(орел) = 1/2.

• M – монета фальшивая – с обеих сторон • M2 – монета фальшивая – с обеих сторон орел, т.е. параметр Модели 2:

• ϕϕϕϕ = Pr(орел) = 1.

• Вопрос: какая из двух моделей более правдоподобна, если ϕϕϕϕнабл.= 10/10 = 1 ?

118

Page 119: Syndrome of statistical leniency ppt

Бейзовская логика – I (продолжение)

0009801024

1

2

1

10

1010

11,~Pr ≈=

=

== MP ϕϕϕϕ

110

1022

=

== MP ϕϕϕϕ~Pr

• Отношение правдоподобий (Бейзов множитель, Бейзов фактор)

• В 1024 раза более правдоподобно (вероятно, реально) получить

наблюдаемый результат (10 орлов подряд), если верна Модель 2

• (ϕϕϕϕ = 1), нежели если верна Модель 1 (ϕϕϕϕ = 1/2).

10

102410241

1

1

2

21===

P

PLR

119

Page 120: Syndrome of statistical leniency ppt

Бейзовская логика - II

• Модель 3: неопределенная:

• Принцип недостаточного основания (Лаплас): вероятностная

переменная (доля орлов в выборке) распределена равномерно

на отрезке от 0 до 1:

2

1≠ϕ

1110~

ϕ~

[ ]( )10;~~ ∈ϕϕϕϕϕϕϕϕ Uni

• В 93 раза более правдоподобно получить наблюдаемый результат

• при условии, что (Модель 3) нежели при (Модель 1).

091011

1

1

1

10

10

33,~Pr ≈=

+=

==n

MP ϕϕϕϕ

9311

1024

10241

111

1

3

31≈===

P

PLR

2

1≠ϕ

2

1=ϕ

120

Page 121: Syndrome of statistical leniency ppt

Бейзовская логика - III

• Сравнение Модели 2 и Модели 3:

11111

1

3

2

23===

P

PLR

• В 11 раз более правдоподобно получить

наблюдаемый результат (n =10, y = 10) при

условии, что ϕϕϕϕ = 1 (Модель 2) нежели при

(Модель 3).

121

[ ]( )10,~~ ∈ϕϕ Uni

1113

P

Page 122: Syndrome of statistical leniency ppt

Интерпретация убедительности Бейзова фактора по Джеффризу

http://en.wikipedia.org/wiki/Bayes_factor

BF01 Свидетельство в пользу модели

M1 против модели M0

< 1:100 Убедительное

1:100 – 1:30 Очень сильное

1:30 – 1:10 Сильное

1:10 – 1:3 Существенное

1:3 – 1:1 Не заслуживает внимания1:3 – 1:1 Не заслуживает внимания

BF01 Свидетельство в пользу модели

M0 против модели M1

1:1 – 3:1 Не заслуживает внимания

3:1 – 10:1 Существенное

10:1 – 30:1 Сильное

30:1 – 100:1 Очень сильное

>100:1 Убедительное

Page 123: Syndrome of statistical leniency ppt

Интерпретация убедительности Бейзова фактора

по Элстону и Джонсону (Elston, Johnson, 2008)

BF01

Свидетельство

в пользу модели M1

против модели M0

< 1 Отрицательное (в пользу M0)

2 Вряд ли заслуживает внимания2 Вряд ли заслуживает внимания

6 Существенное

20 Довольно сильное

60 Очень сильное

100 Убедительное

Page 124: Syndrome of statistical leniency ppt

Интерпретация убедительности Бейзова

фактора по Ройаллу (Royall)

BF01 как свидетельство

Уровень

свидетельстваВ пользу M0

против M1

В пользу M1

против M0

1 ≤ BF < 8 1/8 < BF ≤ 1 Слабое

8 ≤ BF < 32 1/32 < BF ≤ 1/8 Умеренное

≥ 32 < 1/32 Сильное

Page 125: Syndrome of statistical leniency ppt

Интерпретация убедительности Бейзова

фактора по Кассу-Рафтери (Kass, Raftery)

BF01

Свидетельство

в пользу модели M1

против модели M0

> 1:1 Отрицательное (в пользу M0)> 1:1 Отрицательное (в пользу M0)

От 1:1 до 1:3 Не заслуживает внимания

От 1:3 до 1:20 Умеренное

От 1:20 до 1:150 Значительное

< 1:150 Очень убедительное

Page 126: Syndrome of statistical leniency ppt

Интерпретация убедительности Бейзова

фактора по Джекману (Simon Jackman)

BF01

Свидетельство

в пользу модели M0

против модели M1

< 1 Отрицательное (в пользу M1)< 1 Отрицательное (в пользу M1)

1 - 3 Не заслуживает внимания

3 -12 Положительное

12 – 150 Сильное

> 150 Очень сильное

Page 127: Syndrome of statistical leniency ppt

Ng P.C., Murray S.S., Levy S., Venter J.C. An agenda for personalized

medicine. Nature Vol. 461, 2009, p. 724-726.

• Всего лишь 2/3

показателей

(предикторов)

относительного риска

качественно качественно

согласуются между

23andMe и Navigenics

• для 5-и

индивидуумов.

127

Page 128: Syndrome of statistical leniency ppt

Подготовиться к Олимпиаде в Сочи российским

спортсменам могут помочь генетические паспорта.http://www.gzt.ru/print/298187.html

• Очевидно, что если повсеместно начать

тестировать российских школьников,

выбирающих тот или иной вид спорта, и

изначально иметь представление об их изначально иметь представление об их

потенциале, то число будущих

олимпийских чемпионов увеличится на

порядок.

128

Page 129: Syndrome of statistical leniency ppt

«Они знают, что могут умереть...»http://www.sovsekretno.ru/magazines/article/2347

• – У человека могут быть отличные «гены спорта», но если он

психологически неустойчив, стабильных результатов не добьется, –

замечает сотрудник лаборатории Сергей Хальчицкий.

• – Недавно, к примеру, обследовали талантливого лыжника-

двоеборца (гонки и трамплин).

• Генетический набор – ну просто олимпийского чемпиона. • Генетический набор – ну просто олимпийского чемпиона.

• Проанализировали характер выступлений: нестабильные.

• Занялись семейной родословной: родители злоупотребляют

алкоголем.

• Это отразилось на его генах: человек психологически неустойчив.

• К сожалению, многие родители, настроенные сделать из ребенка

чемпиона, свято верят: в спорте главное – воля, а не генетика (Ирина

Астратенкова).

129

Page 130: Syndrome of statistical leniency ppt

Евгений Константинович Гинтер,

академик РАМН, ГУ МГНЦ РАМН

130

Page 131: Syndrome of statistical leniency ppt

Евгений Гинтер: «Генетический паспорт – это профанация»

«АиФ Здоровье», № 3 от 15 января 2009

http://www.aif.ru/health/article/23908

• Генетические паспорта в таком виде, в каком они

существуют сегодня, не нужны абсолютно.

• И в нашем центре мы этим не занимаемся.

• Сейчас во всем мире занимаются этим только частные

коммерческие структуры. коммерческие структуры.

• И если уж совсем откровенно, думаю, ни в одной такой

структуре ни одного грамотного,

• квалифицированного

• врача-генетика нет, а если и есть,

• то он занимается профанацией.

131

Page 132: Syndrome of statistical leniency ppt

• Скажу больше, генетический паспорт в том виде, в котором

его сейчас выдают коммерческие структуры, может принести

существенный вред.

• Человеку говорят, что у него есть предрасположенность к сахарному

диабету или к ишемической болезни сердца.

• И что дальше? • И что дальше?

• Ничего, кроме банальных советов вести здоровый образ жизни, не

курить, делать физкультуру, не есть слишком жирную пищу, дать

ему не смогут.

• Но эти рекомендации, известные с доисторических времен, хороши

для любого, даже на сто процентов здорового человека.

• Зачем же запугивать людей, вгонять их в депрессию?

132

Page 133: Syndrome of statistical leniency ppt

Николай Казимирович Янковский, член-корр. РАН, директор Института общей генетики

133

Page 134: Syndrome of statistical leniency ppt

Николай Казимирович Янковский

Итоги, № 14 (721) 5 апреля 2010 года. С. 50-51.

• Вред, нанесенный проверкой на всякий

случай, скорее навредит здоровью

общества, чем поможет.

• Даже зная всю структуру генома • Даже зная всю структуру генома

конкретного организма, мы не сможем

сказать, заболеет человек

[например, гипертонией или

диабетом] наверняка или нет.

134

Page 135: Syndrome of statistical leniency ppt

Соблазны

• Ламаркизм

• Генетицизм – генетический детерминизм

• Евгенизм

• Лысенкоизм• Лысенкоизм

• Коммерциализм –

• «генетизация» медицины по сути

становится синонимом

коммерциализации

Page 136: Syndrome of statistical leniency ppt

Спасибо за внимание!

Слайды доступны для всех

Никита Николаевич Хромов-БорисовКафедра медицинской информатикиКафедра медицинской информатики

СПбГМУ им. акад. И.П. Павлова

[email protected]

(812) 234-18-40

8-952-204-89-49

136