Шрифт:
Интервал:
Закладка:
P(Y|do(X)) = ∑Z P(Z = Z,X) ∑Z P(Y|X = X,Z = Z) P(X = X). (2)
Читателям со вкусом к математике будет интересно сравнить эту формулу с формулой для поправки черного хода, которая записывается так:
P(Y|do(X)) = ∑Z P(Y|X, Z = Z) P(Z = Z). (3)
Даже для читателей, совсем не владеющих математическим языком, можно сделать несколько интересных замечаний об уравнении (2). Первое и самое важное: в нем нигде нет переменной U (ген курильщика). Весь ее смысл как раз в этом. Мы успешно сняли осложнения по U, не обладая никакими данными по ней. Для любого статистика поколения Фишера это выглядело бы как самое настоящее чудо. Во-вторых, в самом начале, во введении, я рассказывал про эстиманд как способ вычислить интересующую нас величину в рамках данного вопроса. Уравнения (2) и (3) — самые сложные и интересные эстиманды в этой книге. Левая сторона представляет вопрос «Каково воздействие X на Y?» Правая сторона — это эстиманд, способ ответа на заданный вопрос. Обратите внимание, что эстиманд не содержит никаких do, только see, представленные вертикальными чертами, и это означает, что его можно рассчитать по имеющимся данным.
К этому моменту, я уверен, многие читатели гадают, насколько этот вымышленный сценарий близок к реальности. Неужели жаркий спор о курении и раке разрешился благодаря одной работе на основе наблюдений и одной каузальной диаграмме? Если мы предположим, что рис. 41 точно отражает причинностный механизм возникновения рака, ответом будет абсолютное «да». Однако то, насколько наши допущения справедливы для реального мира, требует дополнительного обсуждения.
Дэвид Фридман, мой старый друг, занимающийся статистикой в Калифорнийском университете в Беркли, серьезно раскритиковал меня по этому вопросу. Он утверждает, что модель на рис. 41 нереалистична по трем причинам. Во-первых, если ген курильщика» существует, он должен влиять и на то, как тело избавляется от чужеродных веществ в легких, и, таким образом, люди с этим геном будут более склонны к возникновению отложений смол, а люди, лишенные его, — более устойчивы к нему. Поэтому он бы нарисовал стрелку от гена курильщика к смоле, и в этом случае формула парадного входа окажется непригодной. Фридман считает также маловероятным, чтобы курение влияло на возникновение рака только через отложения смол. С уверенностью можно предположить и другие механизмы: не исключено, что курение ведет к хроническому воспалению, которое, в свою очередь, способствует развитию рака. Наконец, говорит он, отложения смол в легких живого человека все равно нельзя измерить со сколь-либо приемлемой точностью, поэтому предложенную мной работу на основе наблюдений не провести в реальном мире.
Я не возражаю против критики Фридмана в этом конкретном примере. Я не специалист по раку, и мне всегда придется оставлять на усмотрение эксперта в данном вопросе, насколько подобная диаграмма адекватно отражает процессы, происходящие в реальном мире. На самом деле одно из самых значительных достижений метода каузальных диаграмм в том, что они делают допущения прозрачными и открытыми для обсуждения экспертами и политиками.
Тем не менее цель моего примера была не в том, чтобы предложить новый механизм для воздействия курения на организм, а в том, чтобы продемонстрировать, как математика в определенной ситуации способна устранить воздействие конфаундеров, даже если данных по самому конфаундеру нет. Подобную ситуацию легко распознать. В ситуациях, когда каузальное воздействие X на Y осложняется одним набором переменных (С) и опосредуется другим (М) (рис. 42) и, более того, опосредующие переменные защищены, как щитом, от воздействий C, вы всегда можете оценить воздействие X, пользуясь наблюдаемыми данными. Узнав об этом факте, ученым было бы разумно, столкнувшись с неустранимыми конфаундерами, искать защищенные медиаторы. Как говорил Луи Пастер, «удача сопутствует подготовленному уму».
К счастью, достоинства поправок парадного входа не остались не оцененными. В 2014 году Адам Глинн и Константин Кашин, оба политологи из Гарварда (Глинн впоследствии перешел в Университет Эмори), написали получившую премию работу, которую следовало бы сделать обязательным чтением для всех ученых, занимающихся исчислениями в области общественных наук. Они применили новый метод к массиву данных, ранее тщательно изученных представителями общественных наук, — исследованию по Закону о партнерстве в области профессиональной подготовки (Job Training Partnership Act; JTPA), которое проводилось с 1987 по 1989 год. По результатам JTPA 1982 года, Департамент труда создал программу профессиональной подготовки, которая, помимо других целей, снабжала участников профессиональными навыками, навыками поиска работы и опытом работы. Она собирала данные о людях, подававших заявки для участия в этой программе, тех, кто реально пользовались ее услугами, и об их доходах за последующие 18 месяцев. Следует обратить внимание, что в исследование входили и РКИ, и данные, полученные в результате наблюдений, в которых люди делали выбор самостоятельно.
Рис. 42. Базовые условия для применения критерия парадного входа
Глинн и Кашин не рисовали каузальных диаграмм, но, судя по описанию их исследования, я бы нарисовал ее так, как на рис. 43. Переменная записавшиеся сообщает, зарегистрировался ли испытуемый для участия в программе или нет; переменная посещавшие сообщает, посещали ли записавшиеся занятия на самом деле. Очевидно, что программа могла повлиять на доходы только в том случае, если пользователь действительно посещал занятия, поэтому отсутствие прямой стрелки от записавшихся к доходам легко понять.
Глинн и Кашин не стали вдаваться в природу осложнителей, но я просуммировал их в переменной мотивация. Ясно, что человек, испытывающий сильную мотивацию увеличить свои доходы, с большей вероятностью запишется на курсы. Этот же человек с большей вероятностью увеличит свой заработок через 18 месяцев, вне зависимости от того, посещал ли он курсы. Цель исследования, конечно, — отделить влияние этого осложняющего фактора и найти, насколько велика помощь непосредственно от курсов.
Рис. 43. Каузальная диаграмма для исследования JTPA
Сравнивая рис. 42 и 43, мы увидим, что критерий парадного входа был бы здесь применим, если бы не было стрелки от мотивации к посещавшим — щита, упомянутого выше. Во многих случаях мы оправдываем отсутствие такой стрелки. Например, если бы услуги программы осуществлялись только в назначенное время и люди не укладывались в него только по уважительным причинам, не связанным с мотивацией (скажем, забастовка водителей общественного транспорта или сломанная нога), мы могли бы стереть эту стрелку и