Шрифт:
Интервал:
Закладка:
Сейчас, глядя в прошлое, я понимаю, что был ослеплен успехом do-исчисления, благодаря которому я уверился в том, что единственный способ заблокировать каузальный путь — это взять переменную и придать ей определенное постоянное значение. Это не так: если у меня есть каузальная модель, я могу манипулировать ей по-разному, творчески, решая, какая переменная «слушает» какую, когда и как. В частности, я могу зафиксировать главную переменную на постоянном уровне, чтобы подавить ее прямое воздействие, и гипотетически, но одновременно с этим стимулировать главную переменную, чтобы передать ее воздействие через опосредующую переменную. Это позволит мне выставить переменную экспериментального воздействия (т. е. котят) на ноль и выставить опосредующую переменную на тот уровень, который был бы у нее, если бы уровень переменной котята был равен единице. Моя модель процесса, порождающего данные, затем сообщит мне, как подсчитать общее воздействие расщепленной интервенции.
Я в долгу перед одним из читателей первого издания Жаком Хагенаарсом (автором книги «Качественные продольные данные») за совет не оставлять надежду на непрямое воздействие. «Многие эксперты в области общественных наук согласны с наблюдаемым на входе и выходе, разногласия как раз в том, каков механизм», — написал он мне. Но я почти два года не мог сдвинуться с места из-за дилеммы, о которой написал в последнем разделе «Как можно заблокировать прямое воздействие?».
Все эти вопросы пришли к неожиданному разрешению, близкому к божественному откровению, когда я прочел юридическое определение дискриминации, которое я цитировал в этой главе ранее: «… если бы нанимаемый был другой расы… а все остальное было бы точно таким же». Вот она — суть проблемы! Это игра «в понарошку». Мы поступаем с каждым индивидуумом по ее или его заслугам, и мы сохраняем все характеристики этого индивидуума на том уровне, на котором они были до изменения в экспериментальной переменной.
Как это разрешает нашу дилемму? Это означает, в первую очередь, что нам придется заново дать определения как прямого, так и непрямого воздействий. Для прямого воздействия мы позволяем опосредующей переменной принять то значение, которое она имела бы — для каждого индивидуума — в отсутствие экспериментального воздействия, и фиксируем ее в этой точке. Теперь мы «играем» экспериментальной переменной и отмечаем разницу. Эта процедура отличается от контролируемого прямого воздействия, описанного ранее, где опосредующая переменная фиксируется на одном и том же уровне для всех. Поскольку мы позволяем опосредующей переменной принимать ее естественные, «натуральные» значения, я называю это натуральным прямым воздействием. Аналогично, для натурального непрямого воздействия я сначала исключаю действие экспериментальной переменной для всех и каждого, а затем позволяю опосредующей переменной принять для каждого индивидуума то значение, которое она бы приобрела в присутствии экспериментального воздействия. В конце я опять отмечаю наблюдаемые различия.
Я не знаю, помогло бы законодательное определение дискриминации вам либо кому-либо еще пойти тем же путем, что и я. Однако к 2000 году я уже владел контрфактивным языком, как своим родным. Научившись читать контрфактивные высказывания в каузальных моделях, я понял, что это всего лишь количественные данные, которые подсчитываются с помощью невинных операций с уравнениями или диаграммами. Они как таковые оказались готовы к заключению в математическую формулу. Все, что мне понадобилось, — это ухватить «если бы».
В одну секунду я понял, что каждое прямое и непрямое воздействие можно перевести на язык контрфактивных выражений. Как только я понял, как это делается, выведение формулы для оценки натуральных прямых и непрямых воздействий из данных и определения легитимности этой процедуры получилось по щелчку пальцев. Что важно, эта формула не строит предположений о специфике функциональной формы отношений между Х, М и Y. Нам удалось сбежать из Линейной Страны Чудес.
Новое правило я назвал Формулой Опосредования, хотя на самом деле формул две: одна для натурального прямого воздействия, другая для натурального непрямого воздействия. При условии некоторых вполне прозрачных допущений, эксплицитно выраженных в графе, она рассказывает, как их оценить из имеющихся данных. Например, в ситуации, подобной воспроизведенной на рис. 56, где между переменными нет осложнителей, а М — опосредующая переменная между экспериментальной переменной Х и результатом Y:
НПВ= ∑m (P(M = m|P = 1) — P(M = m|X = 0)) * P(Y = 1 |X = 0, M = m). (9.5)
Трактовка этой формулы весьма познавательна. Выражение в скобках означает воздействие Х на М, а следующее за ним выражение — воздействие М на Y (когда Х = 0). Таким образом, она отражает происхождение идеи произведения коэффициентов, выраженной в виде произведения двух нелинейных воздействий. Обратите внимание также на то, что, в отличие от уравнения (9.3), уравнение (9.5) не содержит нижних индексов и do-операторов и, следовательно, оценивается из данных первого уровня причинности.
Неважно, кто вы — ученый в лаборатории или ребенок на велосипеде, вас всегда будет радовать тот факт, что сегодня вы научились чему-то, чего не умели вчера. И именно эту радость я ощущал, когда Формула Опосредования впервые появилась на бумаге. Мне теперь с первого взгляда было видно все о прямых и непрямых воздействиях: что нужно, чтобы увеличить или уменьшить их, когда их оценивают из данных, полученных в результате наблюдений или интервенций, и когда мы можем заявить, что опосредующая переменная «виновна» в передаче наблюдаемых изменений к итоговой переменной. Отношения между причиной и следствием бывают линейными или нелинейными, численными или логическими. Ранее каждый из этих случаев приходилось рассматривать отдельно, если, конечно, о них упоминали вообще. Теперь единая формула годится для любого из них.
Если у нас есть верные данные и верная модель, мы способны определить, виновен ли наниматель в дискриминации или какие осложнители удержат нас от этого вывода. По данным Барбары Бёркс мы оценим, какая часть ай-кью ребенка определяется наследственностью, а какая — воспитанием. Мы даже высчитаем процент общего воздействия, объясняемый опосредованием, и процент, определяемый опосредованием, — две взаимодополняющие концепции, которые в линейных моделях сливаются в одну.
После того как мне удалось записать контрфактивное определение прямых и непрямых воздействий, я узнал, что я не первым пришел к этой идее. Робинс и Гренланд побывали там до меня, еще в 1992 году. Но их статья описывает концепцию натурального воздействия словами, не сводя их к математической формуле. Что важнее, они отнеслись к идее натуральных воздействий в целом пессимистически и постулировали, что такие воздействия нельзя оценить даже по экспериментальным исследованиям и уж точно не по исследованиям, основанным на наблюдениях. Это утверждение удержало других исследователей от изучения потенциала натуральных воздействий. Сложно сказать, смогли