Шрифт:
Интервал:
Закладка:
Апостериорная вероятность зависит не только от эмпирических данных, которые вы получаете, но и от априорной вероятности. Циник, который начал с априорной вероятности теорий black, fair и red, равной 1/3, отреагирует на пять красных ячеек подряд апостериорной оценкой, согласно которой вероятность истинности теории red равна 65 %. Доверчивый человек, который начинает с присвоения теории red вероятности всего 1 %, даст ей шанс быть истинной всего 2,5 % даже после того, как шарик выпадет на красное пять раз подряд.
В байесовской системе степень вашей уверенности в чем-то после получения эмпирических данных зависит не только от того, о чем говорят эти данные, но и от того, в какой степени вы были уверены в этом в самом начале.
Это может показаться настораживающим. Разве наука не должна быть объективной? Вам хотелось бы заявить, что ваши убеждения основаны на одних только фактах, а не на каких-то априорных предубеждениях, с которыми вы вошли в эту дверь. Но давайте посмотрим правде в глаза: на самом деле ни у кого убеждения не формируются таким способом. Если в результате эксперимента получены статистически значимые доказательства, что новая модификация существующего лекарственного препарата замедляет развитие некоторых разновидностей рака, скорее всего вы будете достаточно уверены в эффективности нового препарата. Но, если вы получите те же результаты, поместив пациентов в пластиковую модель Стоунхенджа, разве примете вы, пусть даже неохотно, вывод, что это древнее сооружение действительно фокусирует энергию колебаний Земли на организме человека и останавливает развитие опухоли? Нет, не примете, потому что это полная чушь. Вы подумаете, что, по всей видимости, Стоунхенджу просто повезло. У вас разные априорные оценки этих двух теорий, поэтому в итоге вы по-разному интерпретируете эмпирические данные, несмотря на то что в численном выражении они одинаковы.
То же самое можно сказать об алгоритме поиска террористов, применяемом в Facebook, и о вашем соседе по дому. Присутствие соседа в списке потенциальных террористов действительно наводит на мысль, что он может им быть. Но ваша априорная вероятность истинности этой гипотезы должна быть крайне малой, поскольку большинство людей не являются террористами. Следовательно, несмотря на факт включения соседа в список, ваша апостериорная вероятность остается такой же малой, и вы не беспокоитесь по этому поводу – во всяком случае, не должны беспокоиться.
Полагаться исключительно на проверку значимости нулевой гипотезы – это значило бы поступать совершенно не по-байесовски: строго говоря, такой подход предлагает нам относиться к лекарству от рака и к пластиковому Стоунхенджу с одинаковым уважением. Можно ли считать это ударом по взглядам Фишера на статистику? Напротив. Когда Фишер говорит, что «ни у одного ученого нет фиксированного уровня значимости, в соответствии с которым он из года в год, при любых обстоятельствах отбрасывает гипотезы; скорее, он осмысливает каждую конкретную гипотезу в свете имеющихся доказательств и идей», он имеет в виду, что к научному выводу нельзя (или как минимум не следует) подходить сугубо механически; необходимо учитывать также сформировавшиеся ранее идеи и убеждения.
Впрочем, Фишер не был специалистом по байесовской статистике. В наши дни это словосочетание относится к целой совокупности практик и систем взглядов в статистике (когда-то не очень популярных, но сейчас довольно распространенных), которым свойственно общее расположение к аргументации, основанной на теореме Байеса, однако это не просто вопрос принятия во внимание как прежних убеждений, так и новых эмпирических данных. Байесов подход получил наибольшее распространение в различных видах вывода (например, в случае обучения вычислительных машин способности учиться на основе большого объема информации, полученной от человека), плохо сочетающихся с вопросами «да или нет», на решение которых был рассчитан подход Фишера. В действительности специалисты по байесовской статистике зачастую вообще не думают о нулевой гипотезе. Вместо того чтобы задавать вопрос: «Оказывает ли новый лекарственный препарат какое-либо воздействие?» – они могут больше интересоваться наиболее вероятным предположением прогностической модели, описывающей воздействие разных доз препарата на разные группы людей. А когда эти специалисты действительно говорят о гипотезах, они относительно свободно говорят о вероятности того, что гипотеза (скажем, новый препарат лучше существующего) истинна. Фишер не испытывал такой непринужденности в отношении вероятности истинности гипотез. Он считал, что язык вероятности используется должным образом только в ситуации, в которой имеет место некий реальный случайный процесс.
Теперь мы прибыли на берег огромного моря философских проблем, в которое погрузим только один-два пальца, не больше.
Когда мы называем теорему Байеса теоремой, это предполагает, что речь идет о непререкаемых истинах, подтвержденных математическим доказательством. Это и верно и нет. Все сводится к трудному вопросу о том, что мы имеем в виду, когда говорим «вероятность». Когда мы говорим, что вероятность истинности теории red составляет 5 %, мы можем иметь в виду, что на самом деле существует огромное множество колес рулетки, в котором одна из двадцати рулеток сделана так, что шарик выпадает на красное в трех из пяти случаев, а также что любое колесо рулетки, с которым мы сталкиваемся, наугад выбрано из общего множества колес. Если мы имеем в виду именно это, тогда теорема Байеса – очевидный факт, подобный закону больших чисел, о котором шла речь в предыдущей главе. Эта теорема гласит, что в большом интервале времени при условиях, которые мы сформулировали в примере, 12 % колес рулетки, выдающих последовательность RRRRR, – это рулетки, отдающие предпочтение красным ячейкам.
Но на самом деле речь идет не об этом. Когда мы утверждаем, что вероятность истинности теории red составляет 5 %, мы говорим не о глобальном распределении работающих колес рулетки с систематической ошибкой (откуда нам знать об этом?), а скорее, о собственном психическом состоянии. Пять процентов – это степень нашей уверенности в том, что колесо рулетки, с которым мы имеем дело, смещено в сторону красных ячеек.
Кстати, Фишер полностью отказался принять такой подход. Он безжалостно раскритиковал книгу Джона Мейнарда Кейнса Treatise on Probability («Трактат о вероятности»), в которой говорится, что вероятность «измеряет “степень разумной убежденности”, которая приписывается теореме в свете представленных доказательств». Мнение Фишера об этой точке зрения прекрасно подытожено в заключительных строках: «Если студенты, изучающие математику в нашей стране, приняли бы изложенные в последнем разделе книги господина Кейнса взгляды как нечто непререкаемое, это оттолкнуло бы их от одной из самых перспективных областей прикладной математики, вызвав у некоторых отвращение, а большинство оставив в неведении»{148}.
Те, кто готов принять понимание вероятности как степень уверенности, могут рассматривать теорему Байеса не как обычное математическое уравнение, а как своего рода совет, представленный в численном виде. Эта теорема предоставляет в наше распоряжение правило (по поводу которого мы сами решаем, придерживаться его или нет) относительно того, как следует корректировать степень своей уверенности в чем-то в свете новых наблюдений. В новой, более общей форме такая трактовка вероятности стала темой еще более ожесточенных дискуссий. Есть самые непреклонные сторонники байесовской теории, считающие, что все наши убеждения должны быть сформированы посредством строгих байесовских вычислений или как минимум настолько строгих, насколько их способно сделать такими наше ограниченное познание. Другие считают правило Байеса неопределенным качественным ориентиром.