Парадокс Берксона

  • Разделы:

    Парадокс Берксона или ошибка Берксона — это вывод в условной вероятности и статистике, который является контр-интуитивным для некоторых людей, и таким образом может быть описан, как парадокс. Он является усложняющим фактором, появляющимся в статистических проверках соотношений.

    Это результат того, что два независимых события становятся условно зависимыми в условиях того, что по крайней мере одно из них происходит. Формула:

    если 0 < P(A) < 1 и 0 < P(B) < 1,
    и P(A|B) = P(A), т.е. они независимы,
    тогда P(A|B,C) < P(A|C) где C = A∪B (т.е. A или B).

    Он часто описывается в области медицинской статистики или биостатистики, как оригинальное определение проблемы, поставленной Дж. Берксоном.

    Например, предположим, что у меня есть 1000 почтовых марок, из которых 300 красивых и 100 редких, причём 30 и красивы, и редки. 10% изо всех марок редки и 10% изо всех красивых марок тоже редки, поэтому красивость ничего мне не говорит об их редкости. Я выбираю все 370 марок, которые красивы или редки для просмотра. Примерно около 27% марок при просмотре редки, но до сих пор только 10% из красивых марок редки. Если я буду рассматривать только те марки, которые я просматриваю, то увижу ложное отрицательное отношение между красивостью и редкостью, как результат моей предвзятости выбора.

    Ссылки

    • Berkson, J. (1946) «Limitations of the application of fourfold tables to hospital data». Biometrics Bulletin, 2(3), 47-53.

    Замечания по ссылкам

    Ссылка Berkson (1946) приводимая выше часто цитируется некорректно в литературе как Berkson, J. (1949) Biological Bulletin 2, 47-53.

    Biological Bulletin, основанный в 19 веке, не публикует статистические статьи. Корректная ссылка на биостатистический журнал Biometrics Bulletin, который был основан в 1945 году и переименован в Biometrics в 1947 году.