Шрифт:
Интервал:
Закладка:
Дело в том, что Монти не мог открыть дверь 1 после того, как вы ее выбрали, но мог открыть дверь 2. Поскольку этого не произошло, вероятность, что он открыл дверь 3 по необходимости, повышается. Таким образом, мы получаем больше подтверждений того, что автомобиль находится за дверью 2. Это общая тема байесовского анализа: любая гипотеза, выдержавшая какую-то проверку на достоверность, становится вероятнее. Чем больше угроза достоверности, тем выше вероятность после ее преодоления. Вероятность двери 2 могла быть опровергнута (т. е. Монти мог ее открыть), а двери 1 — нет. Таким образом, дверь 2 становится более вероятным местом. Вероятность того, что машина находится за дверью 1, остается.
Для сравнения на рис. 33 представлена диаграмма причинности для альтернативной игры с ведущим Хонти Моллом, который выбирает не ту дверь, что вы, но в остальном делает это наугад. На этой диаграмме все еще есть стрелка, указывающая от вашей двери к открытой двери, потому что он не может выбрать ту же самую. Но стрелка от местоположения машины к открытой двери будет удалена, потому что ведущему неважно, где находится машина. На этой диаграмме открытая дверь никак не влияет на ситуацию: ваша дверь и расположение машины были независимы с самого начала и останутся независимыми, когда мы увидим, что за дверью Хонти. Итак, в телеигре с Хонти Моллом вероятность обнаружить машину за вашей дверью и за другой дверью абсолютно одинакова, что показано в рис. 40.
Рис. 33. Диаграмма причинности для шоу Хонти Молла
С байесовской точки зрения разница между этими двумя играми состоит в том, что в шоу Хонти Молла дверь 1 может быть показана как неверный выбор. Монти Холл мог открыть дверь 3 и показать машину, что доказало бы вашу неправоту. Поскольку ваша дверь и дверь 2 могли быть обозначены как неверные, вероятность для них остается одинаковой.
Хотя это чисто качественный анализ, его можно сделать количественным, использовав правило Байеса или рассматривая диаграммы как простые байесовские сети. Поступая так, мы помещаем эту задачу в общие рамки, которые использовались в подобных случаях. Нам не нужно изобретать метод для решения головоломки; распространение убеждений, описанное в главе 3, даст правильный ответ, а именно P (дверь 2) = для шоу Монти Холла и P (дверь 2) = ½ для шоу Хонти Молла.
Заметьте, что на деле я предложил два объяснения для парадокса Монти Холла. В первом ложная зависимость между вашей дверью и местонахождением автомобиля объясняется с помощью причинно-следственных связей. Во втором используется байесовский подход, чтобы выяснить, почему в «Заключим сделку» повышается вероятность двери 2. Оба объяснения имеют ценность. Байесовский подход объясняет само явление, но не показывает, почему мы воспринимаем его так парадоксально. На мой взгляд, без ответа на этот вопрос нельзя полностью разрешить парадокс. Почему читатели колонки вос Савант были так уверены, что она ошибалась? Ведь это были не только люди, безосновательно убежденные в своей правоте. Пал Эрдёш, один из выдающихся математиков современности, тоже не мог согласиться с ее решением, пока его не подтвердила компьютерная симуляция. О каких недостатках в нашем интуитивном видении мира говорит эта ситуация?
«Наши мозги не слишком приспособлены для решения задач о вероятности, поэтому ошибки в этой ситуации меня не удивляют», — сказал Перси Диаконис, специалист по статистике из Стэнфордского университета в интервью «Нью-Йорк таймс» в 1991 году. Справедливо, только этим дело не ограничивается. Наши мозги действительно не приспособлены для решения задач о вероятности, однако приспособлены для решения задач о причинно-следственных связях. И эта предрасположенность порождает систематические ошибки в оценке вероятностей — такие же, как в случае с оптическими иллюзиями. Поскольку между «моей дверью» и «расположением автомобиля» нет причинно-следственных связей, нам чрезвычайно трудно понять, что здесь существует вероятностная ассоциация. Наши мозги не готовы принимать беспричинную корреляцию, и, чтобы видеть ситуации, где она возможна, требуется специальная подготовка — на примерах вроде парадокса Монти Холла или тех, что мы обсуждали в главе 3. Как только мы «перезарядим» мозги и начнем узнавать коллайдеры, такие парадоксы перестанут сбивать нас с толку.
И снова об «ошибке коллайдера»: парадокс Берксона
В 1946 году Джозеф Берксон, биостатистик из клиники Мэйо, указал на интересную особенность, которую выявили наблюдения в условиях больницы: даже если два заболевания не связаны друг с другом у населения в целом, они могут показаться связанными у пациентов.
Чтобы понять суть этого наблюдения, давайте начнем с диаграммы причинности (рис. 34). Также полезно подумать об экстремальном варианте: ни болезнь 1, ни болезнь 2 обычно недостаточно серьезны, чтобы привести к госпитализации, но их сочетания достаточно. В этом случае мы ожидаем, что болезнь 1 будет сильно коррелировать с болезнью 2 у госпитализированных людей.
Рис. 34. Диаграмма причинности для парадокса Берксона
Исследуя пациентов в больнице, мы учитываем только госпитализированных людей. Как мы знаем, ограничив себя коллайдером, мы создаем ложную связь между болезнью 1 и болезнью 2. Во многих предыдущих примерах ассоциация была отрицательной из-за эффекта поверхностного объяснения, но здесь она положительна, потому что для госпитализации требуются оба заболевания (не только одно).
Однако эпидемиологи долгое время отказывались верить в такую возможность. Они игнорировали ее до 1979 года, когда Дэвид Сакетт из Университета Макмастера, эксперт по всевозможным статистическим ошибкам, представил убедительные доказательства того, что парадокс Берксона реален. В одном примере (табл. 7) он изучил две группы заболеваний: респираторные и костные. Около 7,5 % людей в общей популяции страдают заболеваниями костей, и этот процент не зависит от того, есть ли у них респираторные заболевания. Но для госпитализированных людей с респираторными заболеваниями частота заболеваний костей возрастает до 25 %! Сакетт назвал это явление систематической ошибкой при поступлении в больницу, или систематической ошибкой Берксона.
Таблица 7. Данные Сакетта, иллюстрирующие парадокс Берксона
Сакетт признает, что мы не вправе окончательно приписать этот эффект систематической ошибке Берксона, потому что возможны вмешивающиеся факторы. Споры в том или ином виде продолжаются до сих пор. Однако, в отличие от 1946 и 1979 годов, сегодня эпидемиологи понимают причинно-следственные диаграммы и знают, какие систематические ошибки они демонстрируют. Сегодня обсуждаются более тонкие моменты: насколько велика может быть ошибка и достаточно ли она масштабна, чтобы быть замеченной на диаграммах причинности с большим количеством переменных. Это прогресс!
Корреляции,