Шрифт:
Интервал:
Закладка:
Но самое интересное возражение Карлина — как раз то, которое он считал важнейшим: «Наконец, с наибольшим успехом исследователь может выбрать подход, не предполагающий модели вообще, приводящий к пониманию данных интерактивно, используя ряд отображений, индексов и контрастов. Этот подход подчеркивает концепцию надежности данных в интерпретации результатов». В одном этом коротком отрывке Карлин выражает, сколь мало изменилось со времен Пирсона и насколько влиятельной его идеология оставалась даже в 1983 году. Он говорит, что в самих данных уже заключена вся научная мудрость; их нужно только уметь умаслить и сделать им массаж (с помощью отображений, индексов и противопоставлений), и они сами выронят жемчуг мудрости вам в руки. Нашим аналитикам нет нужды принимать во внимание процессы, которые привели к появлению этих данных. У нас все получится ровно так же, и даже лучше с подходом, «не предполагающим никакой модели вообще». Если бы Пирсон жил сегодня, в эпоху больших данных, он сказал бы ровно это: все ответы уже содержатся в самих данных. Конечно, утверждения Карлина нарушают все, о чем мы говорили в первой главе. Чтобы говорить о причинности, нам требуется ментальная модель реального мира. «Безмодельный подход» может привести нас на первую ступень Лестницы Причинности, но никак не дальше.
Райт, надо отдать ему должное, прекрасно понимал, как велики ставки, и написал недвусмысленно: «Заявляя, что подход, не предполагающий модели вообще — наилучшая альтернатива… Карлин с соавторами хотят не просто изменить метод путевого анализа, но лишить его цели и оценки относительной важности различных причин. Этот анализ невозможен без модели. Они предлагают тем, кому хочется провести такую оценку, подавить свое желание и заняться чем-нибудь другим».
Райт понимал, что защищает саму суть научного подхода и интерпретации данных. Сегодня я бы дал энтузиастам больших данных, избегающим моделей, тот же совет. Конечно, замечательно попытаться выудить всю информацию, которую данные способны нам сообщить, но надо понимать, насколько далеко это позволит нам уйти. А уйти оно позволит не дальше первой ступени Лестницы Причинности и никогда не сможет дать ответ даже на такой простой вопрос: какова относительная важность различных действующих факторов?
E pur si muove!
От объективности к субъективности: мост, переброшенный Байесом
Еще одна тема из отповеди Райта может намекнуть на другое обстоятельство, по которой статистики сопротивлялись причинности. Он многократно утверждает, что не хотел бы, чтобы путевой анализ стал «стереотипным». Буквально по Райту: «Нестереотипный подход путевого анализа принципиально отличается от стереотипных моделей описания, созданных для того, чтобы избегать малейших отклонений от полной объективности».
Что он имеет в виду? Во-первых, то, что путевой анализ должен быть основан на личном понимании причинно-следственных процессов, отраженных в каузальных диаграммах. Он не может быть редуцирован до механических процедур вроде тех, что описываются в справочниках по статистике. Для Райта рисование путевой диаграммы — не упражнение в статистике; это упражнение в генетике, экономике, психологии или любой другой области, экспертом в которой является ученый.
Во-вторых, Райт прослеживает связь очарования «безмодельных» методов с их объективностью. Для статистики объективность действительно была святым Граалем с самого первого дня, или же с 15 марта 1834 года, когда было основано Лондонское статистическое общество. В его уставе сказано, что данные во всех случаях имеют приоритет над мнениями и интерпретациями. Данные объективны — мнения субъективны. Эта парадигма возникла задолго до Пирсона. Борьба за объективность — принцип выведения умозаключений только на основе данных и экспериментов — была важнейшим моментом в том, как наука определяла сама себя со времен Галилея.
В отличие от корреляций и большинства других инструментов общепринятой статистики, каузальный анализ требует от пользователя субъективной заинтересованности. Ему потребуется нарисовать каузальную диаграмму, отражающую его качественные представления, или, скорее, консенсусные представления исследователей в его области науки, о топологии происходящих в данном случае каузальных процессов. Он должен забыть о многовековой догме объективности для ее же пользы. Там, где дело касается причинности, одно зерно разумной субъективности говорит нам больше о реальном мире, нежели любые объемы объективности.
Абзацем выше я сказал, что «большинство» инструментов статистики стремится к полной объективности. Для этого правила, однако, есть одно серьезное исключение. Область статистики, именуемая байесовой статистикой, за последние примерно 50 лет достигла значительной популярности. Когда-то ее едва ли не проклинали, но теперь это нечто совершенно общепринятое, и на конференции по статистике за все время работы уже не услышать ни одного спора между «байесианцами» и «частотниками», хотя в 1960-х и 1970-х они гремели.
Прототип байесовского анализа таков: предварительные представления + новые данные = пересмотренные представления. Представьте, что вы подбросили монету десять раз, и девять из них она выпадала орлом. Ваша уверенность в том, что монета не фальшивая, поколеблена, но насколько? Традиционный статистик скажет: «При отсутствии дополнительных данных я предположил бы, что эта монета с грузом, и я поставлю девять против одного, что в следующий подброс она выпадет орлом». Байесовский статистик возразит: «Подождите. Мы должны учесть уже имеющиеся данные о происхождении монеты». Откуда она взялась: из сдачи в гастрономе или из кармана мошенника? Если это обычный гривенник, то выпадение девяти орлов подряд не должно вызывать у нас настолько сильных подозрений. И наоборот, если мы уже подозревали, что с монетой что-то не так, мы заключим с большей уверенностью, что девять орлов — это серьезное нарушение случайного распределения.
Байесова статистика дает нам объективный способ объединить результаты наблюдений с нашими предварительными знаниями (или субъективными представлениями), чтобы получить пересмотренные представления и, следовательно, пересмотренные предсказания о том, как поведет себя монета при следующем подбрасывании. Однако чего частотники не могли простить, так это того, что байесианцы позволили мнению, в виде субъективной вероятности, проникнуть в стерильное царство статистики. Признания большинства удалось заслужить только очень постепенно, когда байесовский анализ проявил себя как превосходный инструмент для решения множества задач, таких разных, как предсказание погоды и отслеживание вражеских подводных лодок. Вдобавок во множестве случаев можно доказать, что влияние предварительных представлений тает с ростом массива данных, так что в конце остается чисто объективный вывод.
К сожалению, то, что общепринятая статистика смирилась с байесовской субъективностью, никак не повлияло на ее