Шрифт:
Интервал:
Закладка:
Какой же из них верен? Ни тот ни другой! Обе группы исследователей спутали процедуру и смысл. Процедура здесь математическая: смысл каузальный. На самом деле проблема еще глубже: исследователи, занимающиеся регрессионным анализом, никогда не рассматривали смысл непрямого воздействия за рамками пузыря линейных моделей. Единственным значением понятия непрямого воздействия был результат алгебраической процедуры (перемножить путевые коэффициенты). Когда эту процедуру у них отобрали, их стало носить ветром, как лодку без якоря.
Один из читателей моей книги «Причинность» в своем письме ко мне прекрасно описывает это чувство растерянности. Мелани Уолл (Колумбийский университет) в свое время преподавала курс математического моделирования биостатистикам и медикам. Однажды она, как обычно, объясняла студентам, как вычислять непрямое воздействие, перемножая прямые путевые коэффициенты. Некий студент спросил ее, что именно имеется в виду под непрямым воздействием. «Я ответила ему то, что отвечала всегда, что непрямое воздействие — это воздействие, которое изменение в X производит на Y через его взаимоотношения с опосредующей переменной Z», — написала мне Уолл. Однако студент оказался очень настойчивым. Он вспомнил, как преподаватель объяснял прямое воздействие как воздействие, которое остается, если мы будем поддерживать опосредующую переменную на постоянном уровне, и спросил: «Тогда что мы удерживаем на постоянном уровне, когда говорим о непрямом воздействии?»
Уолл не знала, что сказать. «Я не уверена, что у меня сейчас есть хороший ответ на этот вопрос, — ответила она. — Как насчет того, что я выясню, что смогу, и сообщу вам?»
Это было в октябре 2001 года, всего через четыре месяца после того, как я представил статью по каузальному опосредованию на конференции «Неопределенность в искусственном интеллекте» в Сиэтле. Стоит ли говорить, что мне очень хотелось поразить Мелани своим свежим решением ее задачи, и я написал ей то же, что пишу здесь сейчас для вас: «Непрямое воздействие X на Y — это изменение в Y, которое мы наблюдаем, если удерживаем X на постоянном уровне и в то же время изменяем M до такого уровня, который M приняло бы при изменении X на единицу».
Я не уверен, что Мелани впечатлилась моим ответом, но ее любознательный студент заставил меня серьезно задуматься о том, как прогрессирует наука в наши времена. Вот сейчас, думал я, прошло 40 лет с тех пор, как Блалок и Дункан ввели путевой анализ в общественные науки. Десятки учебников и сотни научных публикаций по прямым и непрямым воздействиям выходят из печати каждый год, некоторые из них — с заголовками-оксюморонами вроде «Регрессионный подход к опосредованию». Каждое поколение передает следующему из рук в руки мудрость о том, что непрямое воздействие — это всего лишь произведение двух других воздействий, или же разница между суммарным и прямым воздействиями. Никто не осмеливается задать простой вопрос: но что это самое непрямое воздействие означает? Чтобы задать его, вдребезги разбив нашу веру в пророческую роль научного консенсуса, понадобился невинный студент с беззастенчивым нахальством мальчишки из андерсеновского «Нового платья короля».
Знакомьтесь с «если бы»
Далее я расскажу вам историю своего собственного обращения, потому что достаточно долго мне не давал покоя тот же самый вопрос, который озадачил студента Мелани Уолл.
В главе 4 я писал о Джейми Робинсе, пионере статистики и эпидемиологии в Гарвардском университете, который вместе с Сандером Гренландом из Калифорнийского университета в Лос-Анджелесе ввел широкое употребление графических моделей в современной эпидемиологии. Мы сотрудничали несколько лет, с 1993 по 1995 год, и он навел меня на мысли о проблеме последовательных схем интервенции, что было одним из его главных научных интересов.
За много лет до этого Робинса, как эксперта по производственному здравоохранению и безопасности, попросили выступить в суде с мнением о вероятности того, что воздействие химических веществ на рабочем месте привело к смерти рабочего. Робинс был обескуражен, обнаружив, что в статистике и эпидемиологии совершенно нет инструментов для ответов на подобные вопросы. Это по-прежнему была эра почти полного табу на причинность в статистике. Говорить о ней дозволялось только в случае рандомизированных контролируемых исследований, а по этическим соображениям провести подобный эксперимент на людях, чтобы выяснить последствия воздействия формальдегида, было совершенно невозможно.
Обычно рабочие на фабрике подвергаются воздействию токсичных веществ не однократно, а в течение долгого времени. По этой причине Робинс стал интересоваться всеми случаями, когда уровень воздействия химических веществ менялся с течением времени. Иногда такие воздействия бывают и благотворными, например, при СПИДе препараты применяются в течение многих лет, при этом схемы лечения меняются в зависимости от того, как на них реагирует уровень гликопротеина CD4 у пациента. Как вычленить каузальное воздействие курса лечения, если он состоит из множества стадий и промежуточные переменные (которые используются в качестве контроля) зависят от более ранних стадий лечения? Эти вопросы определили направление карьеры Робинса.
После того как Джейми прилетал ко мне в Калифорнию, услышав о «задаче на салфетке» (см. главу 7), он активно заинтересовался перспективами применения графических методов к последовательным схемам лечения, которые были его коньком. Вместе мы выработали последовательный критерий черного хода для оценки каузального воздействия подобных терапевтических курсов. Это сотрудничество научило меня нескольким важным вещам. В частности, оно показало мне, что анализировать два действия иногда проще, чем одно, потому что каждое действие соответствует стиранию стрелки на графе и таким образом делает его более разреженным.
Наш критерий черного хода работал с длительным курсом лечения, состоящим из произвольно большого числа do-операций. Но даже две операции — это уже интересная математика, в том числе контролируемое прямое воздействие, которое состоит из одного действия, которое «играет» значением экспериментального воздействия, в то время как другое действие удерживает опосредующую переменную на постоянном уровне. Что еще важнее, идея определения прямых воздействий в терминах do-операций освободила их из тюрьмы линейных моделей и укоренила в каузальном исчислении. Но по-настоящему я заинтересовался опосредованием только позднее, когда обнаружил, что люди по-прежнему совершают ошибки в самых элементарных вещах, например как в упомянутом выше Заблуждении Опосредования. Меня также огорчало то, что основанное на действии определение прямого воздействия не расширялось на непрямое воздействие. Как сказал студент Мелани Уолл, у нас нет переменной или набора переменных, интервенция по которым могла бы заблокировать прямой путь и оставить непрямой путь действующим. По этой причине непрямое воздействие казалось мне плодом воображения, лишенным независимого значения и только напоминающим нам, что суммарное воздействие может отличаться от прямого воздействия. Я даже писал об этом в таких выражениях в первом издании (2000) своей книги «Причинность». Это