Шрифт:
Интервал:
Закладка:
Теперь, через 90 лет, мы можем воспользоваться оператором do, чтобы ответить на вопросы, которые Фишер хотел, но не мог задать. Давайте взглянем с каузальной точки зрения, каким образом рандомизация позволяет нам задать «джинну» правильный вопрос.
Начнем, как обычно, с каузальной диаграммы. Модель 1, показанная на рис. 24, показывает, как урожайность каждого участка определяется при нормальных условиях, когда фермер решает, как удобрять тот или иной участок, руководствуясь предвзятостью или прихотью. Вопрос, который он хочет задать джинну по имени Природа, таков: «Какова будет урожайность при однородном применении удобрения 1 (в сравнении с удобрением 2) на всем поле?». Или в терминах оператора do: каково P (урожай do (удобрение = 1))?
Рис. 24. Модель 1: неправильно контролируемое исследование
Если фермер ставит эксперимент наивно, например применяя удобрение 1 на верхней части поля, а удобрение 2 на нижней, то в качестве вмешивающейся переменной у него, вероятно, окажется дренированность. Если в один год он применит удобрение 1, а на другой — удобрение 2, то вмешивающейся переменной окажется погода. В любом случае сравнение окажется необъективным.
То, что хотел бы знать фермер, описывается моделью 2, когда все участки получают одно и то же удобрение (рис. 25). Как объяснялось в главе 1, действие оператора do — стереть все стрелки, идущие к «удобрению», и придать этой переменной определенное значение, положим удобрение = 1.
Рис. 25. То, что мы хотели бы знать
Наконец, давайте посмотрим, как все будет выглядеть после применения рандомизации. Теперь на некоторых участках поля будет do (удобрение = 1), а на других do (удобрение = 2), но выбор — какое воздействие будет оказано и на какой участок — окажется случайным. Эта ситуация описывается моделью 3 на рис. 26, в которой значение переменной удобрение назначается рандомизирующим устройством, например колодой карт, как у Фишера.
Рис. 26. Модель 3: ситуация, симулированная рандомизированным контролируемым опытом
Обратите внимание, что все стрелки, направленные к переменной удобрение, теперь исчезли, отражая предположение, что фермер в своем выборе удобрения на участке руководствуется только выпавшими картами. Не менее важно и то, что от переменной карта к переменной урожайность нет стрелки, потому что растения не знают, что на карте (в случае растений это надежное допущение, но если рандомизированный опыт ставится на людях, об этом стоит подумать). Таким образом, модель 3 описывает ситуацию, в которой отношения между переменными удобрение и урожайность не осложнены (т. е. у них нет никакой общей причины). Это значит, что в ситуации на рис. 26 наблюдение удобрение = 1 — это то же самое, что и интервенция удобрение = 1.
Это подводит нас к ключевому выводу: рандомизация — это способ симулировать модель 2. Она убирает все имевшиеся конфаундеры, не внося новых. В этом источник ее силы: в ней нет ничего таинственного или мистического. Это всего лишь, как выразилась Джоан Фишер Бокс, «искусный допрос Природы». Эксперимент, однако, утратил бы свою объективность, если бы экспериментатор назначал бы удобрения по своему выбору или если бы растения на участке «знали», какая карта им выпала. Вот почему клинические исследования с участием людей приходится организовывать с большим вниманием к тому, чтобы информация о выборе была сокрыта от глаз как испытуемых, так и экспериментаторов (эта процедура называется двойным слепым исследованием).
Я добавлю к этому второй итоговый вывод: есть и другие способы симулировать ситуацию модели 2. Один из них состоит в том, чтобы выявить все конфаундеры, измерить их и внести по ним поправки. Однако рандомизация обладает одним огромным преимуществом: она обрывает все входящие каузальные связи к исследуемой переменной, включая те, о которых мы не знаем, и те, которые не в состоянии измерить (см. факторы «Другое» на рис. 24–26).
Напротив, в нерандомизированном эксперименте исследователь должен полагаться на свое знание предмета. Если он уверен, что его каузальная модель учитывает достаточное число факторов, устраняющих вмешивающиеся переменные, и по ним собрано достаточно данных, тогда возможно оценить влияние удобрения на урожайность объективно. Однако всегда сохраняется опасность, что какая-то вмешивающаяся переменная осталась неучтенной и оценка окажется неточной.
При прочих равных рандомизированные контролируемые испытания по-прежнему предпочтительнее для научных работ, предполагающих наблюдение, точно так же, как сети безопасности рекомендуются для канатоходцев. Однако не все аналогии идеальны. В некоторых случаях интервенция неосуществима физически (например, в исследованиях о влиянии тучности на сердечные заболевания не получится рандомно назначить, кому из испытуемых быть тучным, а кому нет). В других интервенция неэтична (изучая влияние курения, мы не имеем права случайным образом назначить испытуемых, которые будут курить 10 лет). Кроме того, у нас могут возникнуть сложности с набором испытуемых для тестирования заведомо неприятных процедур, и добровольцы, которые в результате рискнут участвовать в эксперименте, не будут представлять собой репрезентативную выборку всей популяции в целом. К счастью, оператор do позволяет нам адекватным с точки зрения науки образом выявлять каузальные воздействия в неэкспериментальных научных работах, что бросает вызов традиционному главенству РКИ. Как обсуждалось выше в примере с ходьбой, подобные каузальные оценки, полученные из обзорных работ, целесообразно назвать условной причинностью, т. е. причинностью, условно возможной при наборе предположений, отраженных в нашей каузальной диаграмме. Важно, что мы не относимся к таким исследованиям как к гражданам второго сорта; у них есть то преимущество, что они проводятся в естественных условиях, на целевой аудитории, а не в искусственной среде лаборатории и они по-своему «чисты» — у них нет никаких проблем ни с этикой, ни с осуществимостью.
Теперь, когда мы понимаем, что принципиальный смысл РКИ в том, чтобы избавиться от осложнителей, давайте посмотрим и на другие методы, данные нам Революцией Причинности. История начинается со статьи 1984 года, написанной двумя моими давними коллегами, в которой было положено начало переоценке представлений о том, что такое конфаундеры.
Новая парадигма конфаундеров
«Хотя проблема конфаундеров, или вмешивающихся переменных, общепризнанно считается одной из центральных в эпидемиологических исследованиях, обзор литературы обнаруживает заметную непоследовательность в определении