Шрифт:
Интервал:
Закладка:
Но главное допущение, которое неизменно должны делать все, кто использует потенциальные результаты, называется игнорируемостью. Это более технический аспект, но он является критически важной частью всей операции, поскольку аналогичен условию обмениваемости у Джейми Робинса и Сандера Гренланда, которое обсуждается в главе 4. «Игнорируемость» выражает то же требование в терминах переменной потенциального результата YX Она требует, чтобы YX не зависел от фактически полученного лечения, т. е. X, с учетом значений определенного набора конфаундеров (или конфаундеров Z. Прежде чем исследовать ее интерпретацию, мы должны признать, что любое допущение, выраженное как условная независимость, наследует широкий набор знакомых математических механизмов, разработанных статистиками для обычных (не контрфактивных) переменных. Например, статистики обычно используют правила для определения, когда одна условная независимость следует из другой. К чести Рубина, он признал, что перевод причинного понятия неосложненности в синтаксис теории вероятностей имеет смысл, пусть и на контрфактивных переменных. Допущение игнорируемости делает причинную модель Рубина действительной моделью. Табл. 12 сама по себе не является моделью, поскольку не содержит допущений о мире.
К сожалению, я еще не нашел ни одного человека, который мог бы объяснить, что такое игнорируемость на языке, на котором говорят те, кому необходимо сделать это допущение или оценить его правдоподобие для конкретной задачи. Вот до чего удалось додуматься мне. Определение пациентов в экспериментальную или контрольную группы игнорируется, если в любой страте осложнителя Z пациенты, у которых может быть один потенциальный результат — YX = y, могут оказаться в экспериментальной или контрольной группе с той же вероятностью, что и пациенты, у которых может быть другой потенциальный результат — YX = Y¢. Это определение вполне оправданно, если у вас есть функция вероятности. Но как биолог или экономист, обладающий только научными знаниями, должен оценить, правда это или нет? И как ученый оценит, сохраняется ли игнорируемость для любого из примеров, обсуждаемых в этой книге?
Чтобы понять, в чем здесь сложность, попробуем применить это объяснение к нашему примеру. Чтобы определить, является ли ED игнорируемым (при условии EX), мы должны оценить, будут ли сотрудники с одной потенциальной зарплатой, скажем S1 = s, иметь одинаковый уровень образования с той же вероятностью, что и сотрудники с другой потенциальной зарплатой, предположим S1 = s¢. Если вы думаете, что это похоже на замкнутый круг, я могу только согласиться! Мы хотим определить потенциальную зарплату Элис, но, еще не начав — еще не получив намека на ответ, — должны размышлять о том, зависит ли результат от ED или нет в каждой страте EX. Это настоящий когнитивный кошмар!
Как оказалось, ED в нашем примере нельзя игнорировать по отношению к S, обусловленной EX, и поэтому метод сопоставления (приравнивание Берта к Кэролайн) даст неправильный ответ. Фактически оценки для них должны отличаться на сумму S1 (Берт) — S1 (Кэролайн) = $5 000 (читатель теперь выведет это из чисел в табл. 12 и трехэтапной процедуры). Теперь я покажу, что благодаря диаграмме причинности студент мог сразу увидеть, что ED нельзя игнорировать и пытаться искать здесь соответствие. При отсутствии диаграммы у студента возникнет соблазн предположить, что игнорируемость сохраняется по умолчанию, и он попадет в эту ловушку. (Это не безосновательные подозрения. Я позаимствовал идею для примера из статьи в «Юридическом журнале Гарвардского университета», где история была, по сути, такой же, как на рис. 53 и автор действительно использовал сопоставление.)
Вот как целесообразно использовать причинно-следственную диаграмму для проверки (условной) игнорируемости. Чтобы определить, является ли X игнорируемым относительно результата Y, обусловленного набором совпадающих переменных Z, нам надо лишь убедиться, что Z блокирует все обходные пути между X и Y и ни один член Z не является потомком X. Это так просто! В нашем примере предлагаемая совпадающая переменная (стаж) блокирует все лазейки (потому что их нет), но не проходит тест, так как является потомком образования. Следовательно, ED нельзя игнорировать, а EX нельзя использовать для сопоставления. Никакой сложной умственной гимнастики не требуется, достаточно взглянуть на схему. От исследователя вообще не требуется мысленно оценивать, насколько вероятен потенциальный результат того или иного лечения.
К сожалению, Рубин не рассматривает диаграммы причинности как средство, которое помогает сделать причинно-следственные выводы. Следовательно, те, кто последует его советам, не смогут проверить игнорируемость вот так. Им придется либо заняться сложной умственной гимнастикой, чтобы убедиться в верности допущения, либо просто принять его как «черный ящик». И действительно, видный исследователь потенциальных результатов Маршалл Джоффе писал в 2010 году, что допущения об игнорируемости обычно делают потому, что они оправдывают использование доступных статистических методов, а не потому, что искренне в них верят.
С прозрачностью тесно связано понятие проверяемости, которое неоднократно упоминалось в этой книге. Модель, представленная как диаграмма причинности, легко тестируется на совместимость с данными, тогда как модель, представленная на языке потенциальных результатов, лишена этой возможности. Проверка проходит так: всякий раз, когда все пути между X и Y на диаграмме блокируются набором узлов Z, в данных X и Y должны быть независимыми при условии Z. Это свойство d-сепарации, упомянутой в главе 7, которое позволяет нам отклонять модель всякий раз, когда независимость не проявляется в данных. Напротив, если одна и та же модель выражается на языке потенциальных результатов (т. е. в виде набора утверждений об игнорируемости), нам не хватает математического аппарата, чтобы выявить независимость, которую влечет за собой эта модель, и исследователям не удастся подвергнуть ее проверке. Трудно понять, как исследователям потенциальных результатов удавалось мириться с этим недостатком, не сопротивляясь. У меня есть единственное объяснение: их так долго держали в стороне от графических инструментов, что они забыли, что каузальные модели могут и должны быть проверены.
Теперь я должен применить те же стандарты прозрачности к себе и расказать немного больше о допущениях, воплощенных в структурной модели причинности.
Помните историю Авраама, которую я упоминал выше? Первой реакцией библейского героя на известие о неминуемом разрушении Содома были поиски зависимости «доза — реакция», или функции-ответа, связывающей порочность города с его наказанием. Это был здравый научный инстинкт, но, подозреваю, мало кто из нас был бы достаточно спокоен, чтобы отреагировать таким образом.
Функция-ответ — ключевая составляющая, которая позволяет СМП обрабатывать контрфактивы. Она подразумевается в парадигме потенциальных результатов у Рубина, но является основным отличием СМП от байесовских сетей, включая каузальные байесовские сети. В вероятностной байесовской сети стрелки к Y означают, что вероятность Y