Шрифт:
Интервал:
Закладка:
Глава 11. Суперсемейка (2006–2009)
С самого начала существования Netflix было важно, чтобы каждый фильм казался привлекательным. Эта мудрость, переданная Рэндольфом из его «Библии прямых рассылок», имела решающее значение для выживания компании, когда вселенная DVD была новой, а выбор фильмов скудным и, как правило, это было что-то старое и непонятное.
То, что подписчикам помогали находить фильмы, которые им полюбились – а не просто понравились, – гарантировало, что они снова обращались к каталогу, чтобы найти скрытые сокровища, ежемесячно платили за услуги и рассказывали о них другим. Их самый привлекательный алгоритм Cinematch работал как проводник, ведя подписчиков самыми удивительными и неожиданными путями по огромному каталогу. Почти 70 % наименований появились в «очередях» подписчиков в результате рекомендаций алгоритма Cinematch. Механизм рекомендаций был настолько убедительный, что Netflix использовала его, чтобы прогнозировать и контролировать свои потребности в инвентарных запасах – он помогал выравнивать резкий спрос на новые релизы и направлять подписчиков к более старым фильмам с лучшими экономическими показателями проката. Первые несколько лет очаровавшее подписчиков путешествие по неизведанному каталогу было изюминкой Netflix, но во время мучительной войны с Blockbuster у нее появился потенциал изменить правила игры.
Сначала функция Cinematch сортировала и представляла списки фильмов, которые пользователи, вероятнее всего, оценят высоко, основываясь на том, как они оценили другие фильмы в прошлом, а также тематические списки, созданные редакторами контента Netlflix. Чем больше фильмов оценивали подписчики, тем более точной становилась система. По мере усовершенствования функциональности сайта Cinematch предоставляла только те фильмы, которые, скорее всего, очень понравятся подписчику; и это означало, что каждый раз, посещая сайт, подписчик видел совершенно иной сайт. Наряду с программным обеспечением, созданным Amazon, Cinematch представлял собой самую лучшую в мире систему коллаборативной фильтрации.
На протяжении многих лет для улучшения алгоритма Хастингс пополнял ряды программистов математиками и сам активно с ним возился. Идея свести человеческое поведение и вкусы к набору уравнений восхищала его: возможно ли это – описать подобный хаос при помощи чисел?
Позднее он расскажет, как одержимость алгоритмом подбора забирала все его свободное время, как он провел Рождество, запершись со своим ноутбуком в лыжном домике в Парк-Сити, работая над Cinematch, в то время как его жена Пэтти жаловалась на то, что он не уделяет внимания своим детям и портит им отпуск.
К 2006 году Хастингс и его команда выжали максимум из своего подхода. Брать чужаков казалось бессмысленным – он уже нанял лучших из лучших. Точно так же, как его прадед, создавший лабораторию в Таксидо Парк, чтобы привлечь лучших ученых мира к величайшим тайнам физики того времени, Хастингс решил провести научный конкурс с наградой в 1 млн долларов, чтобы стимулировать прорыв в алгоритмах, которые управляли Cinematch. При помощи ультрасовременного оборудования, роскошного помещения и щедрого жалованья Альфред Лумис заманил всемирно известных ученых в свою физическую лабораторию. Хастингс привлечет на свой конкурс специалистов по машинному языку, предложив такой большой набор данных из реального мира, какого сообщество еще никогда не видело.
Ученые из лаборатории Лумиса стремились совершить прорыв в радиолокации и делении атома, который изменил бы ход Второй мировой войны; Хастингс надеялся, что результаты соревнования Netflix Prize появятся достаточно быстро, чтобы положить конец войне с Blockbuster. Ему нравилась концепция премии по типу Longitude Prize размером в 20 000 фунтов, которую в 1714 году британское правительство присудило создателям метода измерения долготы в море, или приза в 10 млн долларов Ansari X Prize, присужденного в 2004 году создателям первого гражданского космического корабля многократного использования.
Главный денежный приз в размере 1 млн долларов получит первая команда, которая улучшит возможности алгоритма Cinematch предсказывать поведение потребителей на 10 %, кроме того, каждый год проведения конкурса лидерам будет выплачиваться «Приз Прогресса» в размере 50 000 долларов. В этом конкурсе смогут принять участие все желающие, вне зависимости от полученного образования, из любых стран, с которыми Соединенные Штаты могут легально вести бизнес. Netflix предоставит базу данных из 100 млн отрейтингованных подписчиками фильмов (данные подписчиков будут обезличены), чтобы участники могли проверить свои уравнения на реальной базе данных. Netflix будет фиксировать прогресс команд на доске в открытом доступе. Право обладания алгоритмом останется за победителем, но ему нужно будет предоставить компании лицензию на его использование.
Улучшение на 10 % было эквивалентно последовательному прогнозированию рейтингов фильмов от подписчиков в пределах от 1/2 до 3/4 звезды по пятизвездочной системе Netflix. Задача проведения конкурса была возложена на Джеймса Беннета, вице-президента отдела разработки рекомендательного механизма, и на Стэна Ланнинга, бывшего инженера из Pure Atria, который вместе с Хастингсом усовершенствовал Cinematch и руководил системой рейтингов фильмов.
Ланнинг, гениальный лысый мужчина с длинной седой бородой, делил свою темную офисную пещеру с кучей компьютерных мониторов и пластиковым скелетом в натуральную величину верхом на «кузнечике» Pogo Stick в углу.
Стив Свейзи и Кен Росс подкинули историю о премии Netflix в New York Times и были удивлены, когда в день проведения конкурса, 2 октября 2006 года, она появилась на первой полосе. Американская и международная пресса широко осветили эту историю, и до конца дня на участие в конкурсе зарегистрировалось более 5000 команд и индивидуальных участников. Для Свейзи, чья продуктивность рабочего дня была неразрывно связана с тональностью освещения Netflix в прессе, реакция СМИ на объявление была такой же волнующей, как просмотр результатов выборов со знанием того, что твой кандидат выиграл с огромным отрывом. Позже Свейзи сравнил премию с комбинацией конных скачек, чемпионата мира по крикету и Суперкубка для гиков.
В следующие три года на участие в конкурсе с призом в 1 млн долларов зарегистрировалось более 40 000 команд из 186 стран, привлеченных самым большим набором данных из когда-либо выпущенных и дружеской обстановкой соревнования в целом. С момента, когда они начали публиковать прогресс своих разработок на специальной онлайн-доске лидеров, поддерживаемой Netflix, в режиме реального времени и рассказывать о своем прогрессе в дискуссионных группах, ученые, математики и заинтересованные любители стали медленно создавать с нуля самый точный в мире механизм рекомендаций.
Среди них была команда специалистов по статистике, которая искала новые способы предсказать человеческое поведение.
Лаборатория Shannon компании AT&T располагается в тихой долине посреди зеленых полей, граничащих с большими пышными деревьями в районе Флорхем-Парк,