Шрифт:
Интервал:
Закладка:
Замечание Сэвиджа в конце цитаты особенно проницательно: он понимает, что принцип верного дела экстралогический. Более того, если интерпретировать его верно, окажется, что он основан на причинно-следственной, а не классической логике. Кроме того, он говорит, что «не знает иного… принципа, который». Очевидно, что он говорил о нем со многими людьми, и они нашли подобное рассуждение очень убедительным.
Чтобы связать принцип верного дела у Сэвиджа с обсуждением выше, предположим, что на самом деле выбор стоит между двумя объектами недвижимости — A и B. Если победит демократ, у бизнесмена есть 5 %-ный шанс заработать доллар на объекте A и 8 %-ный шанс заработать доллар на объекте B. Таким образом, B предпочтительнее A. Если выиграет республиканец, у него есть 30 %-ный шанс заработать доллар на объекте A и 40 %-ный шанс заработать доллар на объекте B. И снова В оказывается предпочтительнее А. Согласно принципу верного дела, ему точно нужно купить объект B. Но наблюдательные читатели заметят, что числовые величины здесь такие же, как и в истории Симпсона, а значит, покупка объекта B может оказаться поспешным решением.
Более того, аргумент, приведенный выше, содержит очевидный недостаток. Если решение бизнесмена купить недвижимость способно повлиять на исход выборов (например, если за его действиями следили СМИ), то покупка недвижимости А окажется в его интересах. А вред от избрания не того президента перевесит любую финансовую выгоду от сделки, когда президент уже будет выбран.
Чтобы принцип верного дела проявил себя, мы должны утвердиться в том, что решение бизнесмена не повлияет на исход выборов. Если бизнесмен уверен, что его решение не окажет воздействия на вероятность победы демократов или республиканцев, он может спокойно покупать недвижимость В.
Обратите внимание, что отсутствующий ингредиент (который Сэвидж не указал явно) — предположение о причине. Правильная версия его принципа будет выглядеть так: действие, которое, по нашему предположению, повышает вероятность некоего результата и в том случае, если событие С произошло, и в том случае, если оно не произошло, повысит его вероятность также и в случае, когда мы не знаем, произошло ли С… при условии, что само действие не изменит вероятность C. В частности, не существует такого понятия, как «хорошее / хорошее / плохое» лекарство. Этот исправленный вариант принципа Сэвиджа не вытекает из классической логики: чтобы доказать его, понадобится причинное исчисление с привлечением оператора do. Наша сильная интуитивная убежденность в невероятности такого лекарства предполагает, что люди (а также машины, запрограммированные на подражание человеческим мыслям) используют что-то вроде do-исчисления для направления интуиции.
В соответствии с исправленным принципом, одно из следующих трех утверждений должно быть ложным: препарат D повышает вероятность сердечного приступа у мужчин и женщин; препарат D снижает вероятность сердечного приступа у населения в целом; препарат не меняет количество мужчин и женщин. Поскольку крайне маловероятно, что лекарство может изменить пол пациента, одно из первых двух утверждений должно быть ложным.
Какое же? Не стоит искать подсказок в табл. 7. Чтобы ответить на этот вопрос, нужно рассмотреть не только данные, но и как они были получены. Как всегда, обсудить этот процесс без диаграммы причинности просто невозможно.
Диаграмма на рис. 44 учитывает важную информацию: препарат не влияет на пол пациента; пол влияет на риск сердечного приступа (у мужчин риск выше); пациент решил принять лекарство D или отказался от него. В этом эксперименте женщины явно предпочитали принимать D, а мужчины чаще от него отказывались. Таким образом, пол — осложняющая переменная, влияющая и на лекарство, и на сердечный приступ. Чтобы объективно оценить, как лекарство влияет на сердечный приступ, нужно сделать поправку на конфаундер. Для этого надо рассмотреть данные по мужчинам и женщинам отдельно, а затем — взяв среднее значение:
Рис. 42. Диаграмма причинности для примера с парадоксом Симпсона
В группе женщин сердечный приступ случился у 5,0 % не принимавших лекарство D и у 7,5 % принимавших лекарство.
В группе мужчин сердечный приступ случился у 30 % принимавших лекарство D и у 40 % принимавших лекарство.
В среднем (поскольку мужчины и женщины встречаются одинаково часто) сердечный приступ случился у 17,50 % не принимавших лекарство D (среднее между 5 и 30) и у 23,75 % принимавших лекарство (среднее между 7,5 и 40).
Это четкий и недвусмысленный ответ, который мы искали. Лекарство D нельзя назвать «плохим / плохим / хорошим» — оно «плохое / плохое / плохое» — для мужчин, женщин и людей в целом.
Я не хочу, чтобы из этого примера у вас создалось впечатление, что агрегировать данные всегда неверно, а разделять их всегда верно. Все зависит от процесса, который произвел данные. В парадоксе Монти Холла мы увидели, что, изменив правила игры, мы также изменили ее исход. Тот же принцип работает и здесь. Я использую другую историю, чтобы продемонстрировать, когда объединение данных окажется уместным. Хотя данные будут абсолютно такими же, роль скрытой третьей переменной изменится, и то же произойдет с результатом.
Давайте начнем с предположения о том, что лекарство В снижает артериальное давление (АД), повышение которого, как известно, может привести к сердечному приступу. Естественно, исследователи лекарства В хотели увидеть, не понизит ли оно риск сердечного приступа, поэтому они измеряли артериальное давление пациентов после приема лекарства, а не только фиксировали, был ли у них сердечный приступ.
Табл. 9 показывает данные из исследования лекарства В. Она вам знакома: в ней те же показатели, что и в табл. 7. Тем не менее вывод будет абсолютно противоположным.
Таблица 9. Вымышленные данные для примера с артериальным давлением
Как видите, прием лекарства В оказал эффект: в экспериментальной группе давление понизилось у вдвое большего числа человек (у 40 из 60 по сравнению с 20 из 60 в контрольной группе). Другими словами, оно сделало в точности то, что должно делать лекарство против сердечного приступа. Оно вывело людей из категории высокого риска в категорию более низкого риска. Этот фактор перевешивает все остальное, и мы можем прийти к обоснованному выводу