Шрифт:
Интервал:
Закладка:
Очевидно, что игроки с фиксированным расположением должны быть принуждаемы к сотрудничеству самими обстоятельствами расположения, которые диктуют им необходимость постоянных контактов с одними и теми же игроками. Круговые турниры, где каждый встречается с каждым, можно рассматривать как аналог непрерывной миграции. Главной проблемой путешествующих людей является то, что у них мало возможностей для установления истинно доверительных отношений с попутчиками. Над ними не довлеет «тень будущего», недостаточно длинная и накрывающая только постоянных соседей.
Возможности применения «Дилеммы заключенного» к проблемам формирования границ между государствами первым начал рассматривать Аксельрод в начале 1980-х годов. Он предложил модель, где каждый игрок в исходном состоянии занимает одну клетку на доске типа шахматной (или одну ячейку на регулярной решетке) и взаимодействует лишь с четырьмя ближайшими соседями. После каждого раунда, включающего игры со всеми соседями, игроки «эволюционировали» — меняли свои стратегии на более успешные, исходя из лучшего результата среди соседей.
Вначале Аксельрод хотел применить эту плоскостную модель для изучения конкретных ситуаций, связанных с распределением стратегий. Подход позволяет визуально моделировать процессы захвата, обороны, образования границ и т.д., что представлялось интересным и наглядным. Аксельроду удалось показать, что при некоторых значениях размера выигрыша даже один обманщик способен распространить свое влияние на все сообщество TFT-игроков, т.е. навязать всем игрокам новый тип стратегий, основанных на обмане. Интересно, что образующиеся при этом колонии обманщиков имеют правильную и довольно сложную геометрическую форму, напоминающую снежинки (рис. 18.3).
Используя различные комбинации стратегий, можно было бы построить огромное количество разнообразных колоний, но Аксельрод выбрал иной подход. Он просто распределил случайным образом 252 игрока (каждые четыре со своей стратегией, итого 63 разных стратегии) на решетке размером 14х18, дал им возможность взаимодействовать с четырьмя ближайшими соседями, а затем проследил эволюцию всей системы. В процессе игры все «противные», склонные к обману стратегии постепенно погибали, а решетка оказывалась заполненной несколькими типами игроков с «приятными» стратегиями. При этом устанавливалось равновесие: поскольку все игроки сотрудничают друг с другом, никто не выигрывает и не проигрывает, и границы сохраняются.
Интересно, что стратегия TFT (номер 1) не является доминирующей на решетке, хотя именно она выходила победительницей при организации турниров по круговой системе. Этот факт можно считать твердо установленным, поскольку игра проводилась многократно (с различным исходным распределением игроков), и во всех случаях возникали значительные территории, занятые другими стратегиями (одно из таких распределений приведено на рис. 18.4). В игре на плоскости выживали и менее успешные стратегии, занимавшие в круговом турнире низкие места, что объясняется удачным начальным распределением, когда в ближайшие соседи к ним попадают менее эффективные игроки. Для объяснения низкого результата игроков со стратегией TFT стоит напомнить, что она побеждает в круговом турнире по общему числу очков, а в конкретных ситуациях не выглядит агрессивной и напористой, по сути, стратегия TFT не стремится захватывать территории, уже занятые «приятными» стратегиями, а лишь вытесняет обманщиков.
Разумеется, результаты можно интерпретировать как еще одно доказательство отсутствия «абсолютно» победной стратегии в играх такого типа, которые в данном случае можно считать аналогией отношений между нациями. Более того, конечное распределение всегда зависит от исходного, случайного распределения положений игроков, что вновь напоминает нам о ситуациях, когда история процесса сама является фактором развития.
В 1992 году Мартин Новак и Роберт Мэй из Оксфордского университета придумали еще один, более простой вариант пространственной игры, связанной с сотрудничеством игроков. В их модели было только два типа игроков: беспринципные обманщики и убежденные кооператоры. Но игрок мог менять свою «ориентацию», если это сулило ему выгоду. Игра проводилась на квадратной решетке, каждый игрок мог взаимодействовать с восемью ближайшими соседями — к четырем соседям по граням ячейки добавлялись четыре на вершинах. Игрок менял стратегию в соответствии с наилучшими результатами, достигнутыми собой и этими соседями, то есть становился кооператором или обманщиком, подчиняясь ближайшему окружению. В некотором смысле эта картина напоминает описанную в главе 5 решеточную модель Изинга взаимодействующих частиц в статистической физике, способных находиться в двух энергетических состояниях.
Характер игры, естественно, во многом зависит от размера выигрыша, т.е. от вознаграждения, которое игрок имеет шанс получить при правильном выборе между сотрудничеством или обманом ожиданий партнера. Незначительность выигрыша при обмане по сравнению с сотрудничеством способствует сотрудничеству, но и в этом случае остается определенная группа обманщиков, покрывающая сетью всю решетку (рис. 18.5, а). При значительном выигрыше обман становится основной стратегией игры, хотя и в этом случае на решетке возникают и исчезают островки территорий, образованных сотрудничающими игроками (рис. 18.5, б). Доля кооператоров при этом быстро достигает постоянного среднего значения, не зависящего от исходных условий и конфигурации, что подтверждает мысль, что в обществе всегда найдется небольшая часть неукротимых и неугомонных кооператоров, способных функционировать даже в условиях крайнего эгоизма окружающих. Таким образом, общая картина остается довольно сложной: кооператоры и обманщики вовсе не уничтожают друг друга, а продолжают сосуществовать в системе сколь угодно долго, образуя паттерны, которые различаются в деталях, но имеют вполне предсказуемые усредненные характеристики.
Рис. 18.5. Состояния, описывающие эволюцию системы из безусловных кооператоров (черные точки) и безусловных обманщиков (серые точки), очень сильно зависят от размера выигрыша при обмане по сравнению с сотрудничеством. При малом выигрыше доминирует сотрудничество (а). (Здесь белые точки соответствуют «перебежчикам» из кооператоров в обманщики в последнем раунде, т. е. эти точки указывают направления смещения границ.) При увеличении выигрыша при обмане картина меняется, и обманщики начинают доминировать, хотя островки кооператоров возникают и исчезают по всей решетке (б). Одинокий обманщик может эксплуатировать целое сообщество кооператоров, постепенно создавая сообщество обманщиков. В силу взаимного отталкивания обманщики не могут образовывать целостные структуры, а создают лишь разреженный узор (в)