Шрифт:
Интервал:
Закладка:
Но почему же предсказания всех этих могучих медийных организаций со всеми инвестированными ими в технологию big data средствами оказались не лучше, если не хуже прогнозов 1948 года? На момент написания этой главы подробности еще неизвестны, но случившееся очень хорошо иллюстрирует ключевую проблему данного подхода: предсказания подобных систем основаны на предположении, что будущее событие воспроизведет статистику предыдущих событий, использованную для построения базы данных, и выведенных на ее основе корреляций. Сделанные такими системами предсказания могут быть точны только в том случае, если будущее событие происходит таким же образом, как предыдущие. Однако в изменчивых сложных динамических системах предсказания big data легко оказываются бессмысленными, если значения соответствующих переменных отличаются от значений в прошлом либо если эти переменные взаимодействуют совершенно иным образом. Как подсказывает опыт, человеческие сообщества полностью соответствуют определению изменчивых сложных систем, так что у нас мало оснований полагать, что следующие выборы пройдут так же, как предыдущие.
В США методология big data стала очень популярной, когда в 2011 году вышел чрезвычайно успешный фильм «Человек, который изменил все» (Moneyball) с Брэдом Питтом в главной роли, основанный на опубликованной в 2003 году книге Майкла Льюиса «MoneyBall. Как математика изменила самую популярную спортивную лигу в мире», повествующей о том, как с помощью нестандартного подхода тренер Билли Бин значительно повысил конкурентоспособность своей малобюджетной бейсбольной команды. Бин понимает, что для того, чтобы вывести Oakland Athletics в одну лигу с такими монстрами, как Yankees, Red Sox или моим фаворитом Phillies, он должен изменить стандартные методы подбора наиболее талантливых игроков, чтобы произвести сильнейший эффект за минимальные деньги. Для этого Билли Бин обращается к саберметрике — напоминающему big data подходу, разработанному статистиком и писателем Джорджем Уильямом Джемсом, много писавшем о бейсболе; метод основан на эмпирическом анализе бейсбольной статистики для выявления лучших игроков и формирования команды-победителя. Действуя вопреки советам опытных экспертов, Бин полагается на главные выводы саберметрики о том, что лучшим основанием для подбора игроков, способных составить хорошую команду, является статистика столкновений.
Вышло так, что под руководством Бина и при помощи его саберметрического подхода Oakland Athletics в последующие годы (2002 и 2003) дошла до серии финальных игр. Вскоре после этого стратегию Бина начали перенимать и другие команды. Можно только вообразить, сколько денег (вероятно, сотни миллионов долларов) было направлено на реализацию этой стратегии с тех пор, как команды высшей лиги США решили, что в XXI веке эта игра будет подчиняться статистике.
Забавно, что в этой истории часто не учитывают тот факт, что в бейсболе, как в любом спорте, важна не только сила защиты. В первую очередь ключевым игроком для победы является питчер[17], и, как упоминалось в статье в Guardian, в 2017 году, в том сезоне в составе Oakland Athletics почти каждый день играли великолепные питчеры. Защита, разумеется, тоже имеет значение, так же как и тактика, сообразительность и взаимопонимание игроков. Более того, кроме игровых качеств есть еще много других человеческих факторов, которые определяют, сможет ли сформированная из талантливых игроков команда стать командой чемпионского уровня. Я упоминаю об этом, поскольку проверке реальной причинной связи между саберметрическими параметрами и выигрышем в лиге чемпионов, являющимся, по моему наивному мнению, заветной целью любой команды (хотя некоторые владельцы команд заботятся только о том, чтобы сделать деньги), было уделено слишком мало внимания.
В конечном итоге команда Oakland Athletics хорошо выступала против мощных соперников, однако ничего не выиграла. Также не выиграли и другие команды, потратившие много денег на переход к этой методологии. Правда, команда New York Mets, руководство которой десятью годами позднее адаптировало подход Бина, все же победила в Мировой серии 2015 года. Однако нет реальных научных доказательств того, что эта или другая Мировая серия была выиграна благодаря саберметрике. Опять-таки кажется, что «неизбежность» скорее возникала как абстракция, как дань моде в умах тех, кто поклоняется методологии big data, нежели как вывод из фактических данных, доказывавших реальное явление.
Если выборы и бейсбол — достаточно сложные процессы для симуляции и предсказаний, еще больше сложностей возникает при анализе динамики мозга с 86 миллиардами нейронов. Очевидно, что при симуляции целого мозга животного, функционирование которого требует тонкого взаимодействия миллиардов нейронов и множество уровней организации, вероятность отклонения симуляции от реальности чрезвычайно велика.
Математический аспект в симуляции активности мозга тоже проблематичен. Первая проблема касается вычислимости. Вычислимость определяет, существует ли способ превратить математическую формулу в эффективный алгоритм, который можно заложить в цифровую машину. Вычислимость связана с возможностью получения буквенно-цифрового конструкта, а не с какими-либо физическими свойствами системы. И здесь мы упираемся в стенку: поскольку большинство математических описаний природных явлений не могут быть сведены к алгоритмам, их считают невычислимыми функциями. В частности, не существует общей процедуры, позволяющей систематически налаживать цифровой компьютер: не существует алгоритмического выражения для функции F, которая могла бы заранее выявить какую-то будущую неполадку, способную помешать работе компьютера. Что бы мы ни делали, машина всегда будет совершать неожиданные ошибки, которые нельзя предсказать при производстве компьютера и разработке программного обеспечения. Поэтому такая функция F классифицируется в качестве невычислимой функции. И в таком качестве она не удовлетворяет тезису Чёрча — Тьюринга, определяющему тип функций, которые можно симулировать на машине Тьюринга.
Также хорошо известно, что не существует такой вещи, как универсальная антивирусная программа. Причина в том, что функция F, результат которой — все программы, не содержащие вирус, также является невычислимой. Тот же тип рассуждений показывает, почему для цифровых машин не существует ни универсальных систем кодирования, ни алгоритмических процедур для установления того, являются ли динамические системы хаотическими или нет.
То же самое касается живого мозга: он генерирует поведение, которое можно полностью описать только с помощью невычислимых функций. Поскольку машина Тьюринга не справляется с такими функциями, нет возможности точно симулировать их на цифровом компьютере.
Представленные выше примеры — лишь небольшая выборка, отражающая распространенность невычислимых функций в математическом описании природных явлений. Все эти примеры являются следствиями или вариантами знаменитой проблемы остановки, одна из версий которой известна как десятая проблема Давида Гильберта. Проблема остановки касается существования общего алгоритма, позволяющего предсказать, зависнет ли компьютерная программа в какой-то момент или будет продолжать работать. Алан Тьюринг показал, что такого алгоритма не существует. С тех пор проблема остановки Гильберта стала типичной моделью невычислимой функции.