Шрифт:
Интервал:
Закладка:
Более того, субъективная компонента в каузальной информации далеко не всегда уменьшается со временем, даже с ростом объема данных. Два человека, у которых два разных взгляда на причинность одного явления, могут анализировать один и тот же набор данных и никогда не прийти к общему результату, как бы велик объем данных ни был. А это пугающая перспектива для адвокатов научной объективности, и она объясняет их отказ принять неизбежность необходимости полагаться на субъективную каузальную информацию.
Положительная сторона этой проблемы в том, что причинностное умозаключение объективно в одном принципиально важном смысле: если двое ученых согласны в своих предположениях, оно позволяет со 100 %-ной объективностью интерпретировать новую входящую информацию (данные). В этом оно совпадает с байесовским умозаключением.
Так что пытливый читатель, вероятно, не удивится тому, что я пришел к теории причинности окольным путем, который начинался с байесовских вероятностей и затем шел через байесовские сети. Эту историю я расскажу в следующей главе.
Глава 3. От доказательств к причинам. Преподобный Байес знакомится с мистером Холмсом
Пойдут ли двое вместе, не сговорившись между собою? Ревет ли лев в лесу, когда нет перед ним добычи?
«Элементарно, Ватсон!» — так говорил Шерлок Холмс (по крайней мере, в кино), прежде чем изумить верного помощника характерным и подчеркнуто неэлементарным дедуктивным рассуждением. Но на деле Холмс занимался не просто дедукцией, которая ведет от гипотезы к заключению. Он прекрасно владел искусством индукции, которая работает в противоположном направлении — от улики к гипотезе.
Еще одна известная цитата описывает его образ действий: «Если исключить невозможное, то, что останется, и будет правдой, сколь бы невероятным оно ни казалось». Получив несколько гипотез методом индукции, Холмс затем отметал одну за другой, чтобы с помощью дедукции (исключения) найти верную. Хотя индукция и дедукция идут рука об руку, первая гораздо загадочнее. Этот факт и позволяет детективам вроде Шерлока Холмса оставаться в деле.
Однако в последние годы эксперты по искусственному интеллекту добились большого прогресса в автоматизации процесса умозаключений, ведущего от улик к гипотезам и подобным же образом — от следствий к причинам. Мне повезло участвовать в этом процессе на самых ранних стадиях: я разработал один из его базовых инструментов под названием «байесовские сети». Эта глава объясняет, что они собой представляют, рассматривает способы их применения сегодня и обсуждает окольные пути, по которым они привели меня к исследованию причинно-следственных связей.
Bonaparte — компьютер-детектив
17 июля 2014 года рейс MH17 авиакомпании «Малайзия эйрлайнс» вылетел из амстердамского аэропорта Схипхол в Куала-Лумпур. Увы, самолет не добрался до пункта назначения. Через три часа, когда самолет пролетал над Восточной Украиной, его сбили ракетой «земля — воздух» российского производства. Все 298 человек на борту, 283 пассажира и 15 членов экипажа, погибли в авиакатастрофе.
23 июля, когда в Нидерланды были доставлены первые погибшие, объявили днем государственного траура. Но для криминалистов из Нидерландского института судебной экспертизы в Гааге 23 июля стало точкой отсчета. В их задачи входило как можно скорее идентифицировать останки и доставить их близким для похорон. Время поджимало, потому что каждый день неизвестности приносил обездоленным семьям новую боль.
Криминалисты столкнулись со множеством препятствий. Тела были сильно обожжены, и многие хранились в формальдегиде, который разрушает ДНК. Кроме того, поскольку Восточная Украина оставалась территорией военных действий, место авиакатастрофы было доступно не всегда. Останки находили в течение десяти месяцев. К тому же криминалисты не располагали информацией о ДНК жертв по той простой причине, что погибшие не были преступниками. Поэтому приходилось полагаться на частичные совпадения с ДНК родственников.
К счастью, у голландских специалистов был мощный инструмент — новейшая программа под названием Bonaparte, предназначенная для идентификации жертв катастроф. Эта программа, которую разработали в середине 2000-х ученые из Университета Неймегена имени святого Радбода Утрехтского, использует байесовские сети, чтобы скомбинировать информацию о ДНК, взятую у нескольких членов семьи.
Отчасти благодаря скорости и точности Bonaparte голландские криминалисты смогли опознать останки 294 из 298 жертв к декабрю 2014 года. К 2016 году только две жертвы катастрофы (оба граждане Нидерландов) оставались пропавшими без вести.
Байесовские сети, инструмент для машинного рассуждения, лежащий в основе программы Bonaparte, влияет на нашу жизнь разными способами, о которых большинство людей не имеет представления. Они используются в программах распознавания речи, фильтрах для спама, прогнозах погоды, при оценке потенциальных нефтяных скважин и одобрении медицинских приборов в Управлении по санитарному надзору за пищевыми продуктами и медикаментами. Если вы играете в видеоигры на приставке XboX компании «Майкрософт», значит, байесовские сети оценивают ваш уровень. Если у вас есть мобильный телефон, то алгоритмы, которые используются, чтобы выбрать ваш исходящий вызов из тысяч других, кодируются с помощью алгоритма распространения доверия, разработанного для байесовских сетей. Винт Серф, главный пророк Интернета из еще одной небезызвестной компании — Google, — говорит об этом так: «Мы потребляем байесовские методы в огромных объемах».
В этой главе я расскажу историю байесовских сетей с их появления в XVIII веке до развития в 1980-х годах, а еще приведу больше примеров того, как они используются сегодня. Они связаны с диаграммами причинности очень простым способом: такая диаграмма — это байесовская сеть, в которой каждая стрелка обозначает прямое причинно-следственное отношение или, по крайней мере, его возможность в направлении этой стрелки. Не все байесовские сети имеют причинно-следственную природу — во многих случаях это не имеет значения. Однако, если вы когда-нибудь захотите задать вопрос второго или третьего уровня на Лестнице Причинности, вам необходимо будет нарисовать диаграмму, обратив самое пристальное внимание на причинно-следственные связи.
Преподобный Байес и проблема обратной вероятности
Томас Байес, в честь которого я назвал сети в 1985 году, даже и не мечтал, что формула, которую он вывел в 1750-х годах, однажды будет использоваться, чтобы идентифицировать жертв катастрофы. Его волновала исключительно вероятность двух событий, одно из которых (гипотеза) происходит после второго (подтвержденного факта). Тем не менее причинность весьма его волновала.