Шрифт:
Интервал:
Закладка:
Поскольку сегодня шпионская слежка за вами официально признается основным видом деятельности информационной экономики, любая попытка избежать этой слежки, например использование плагинов типа Ghostery [10], будет казаться покушением на саму идею интернета [11].
То, что кажется магией использования сетевых данных, находит разное применение в бизнесе и науке. Для работы с большими массивами данных в обеих этих сферах все чаще применяются почти неотличимые друг от друга инструменты, но действуют они по разным правилам. В науке важнее всего точность и контроль измерений. В бизнесе и культуре они в целом не столь важны.
Ученые используют новые технологии, чтобы изучить природу во всех подробностях, которые прежде были недоступны, но их так много, что без мощных компьютеров и цифровых сетей не стоит даже пытаться их изучить. Например, геномика – это раздел биологии, но она в то же время является и разделом информатики. Это же можно сказать и о дисциплинах на стыке материаловедения и энергетики.
В науке появление новых источников массивов данных означает тщательную работу исследователей, независимо от доступности технологии[50]. В медицине новые массивы данных регулярно меняют наши передовые гипотезы о лечении тех или иных заболеваний. И все же на появление новых способов лечения уходят годы. В науке большие массивы данных – словно магия, но она дается нам нелегко. Мы сражаемся с ней и ожидаем, что в начале останемся в дураках. Инструменты тщательной работы с большими массивами данных все еще активно дорабатываются.
Ни один ученый не считает большие массивы данных волшебной палочкой-выручалочкой. И подтверждений этому хватает. Самый яркий пример – медицина. Она совершенствуется, но катастрофически медленными темпами. Прогнозы погоды стали точнее по сравнению с прошлым, и их точность продолжает расти. Со спутников поступает информация, которую раньше не было возможности использовать в компьютерных моделях, способных обрабатывать большие объемы данных. В результате получаются более точные прогнозы погоды на следующую неделю и даже на весь следующий год. И все же погода преподносит сюрпризы. Большие массивы данных постепенно расширяют наши возможности по мере работы с ними, но не делают нас всеведущими. Гонка за статистическим результатом, который постоянно улучшается, но никогда не достигнет совершенства, лежит в основе современной облачной вычислительной среды. Большие массивы данных необходимо осваивать, чтобы они приносили пользу. Это не автоматический рог изобилия и не альтернатива человеческой проницательности.
Распространение вспышки гриппа можно отследить через интернет быстрее, чем с помощью традиционных медицинских систем [12]. В ходе исследовательского проекта Google обнаружилось, что вспышки гриппа можно эффективно отслеживать, отмечая соответствующую статистику поисковых запросов по географическим регионам. Если в каком-либо регионе внезапно повышается количество поисковых запросов о симптомах гриппа, вероятно, там началась вспышка заболевания. Этот сигнал можно наблюдать даже до того, как пойдет первая волна обращений к врачам.
ПОСКОЛЬКУ СЕГОДНЯ ШПИОНСКАЯ СЛЕЖКА ЗА ВАМИ ОФИЦИАЛЬНО ПРИЗНАЕТСЯ ОСНОВНЫМ ВИДОМ ДЕЯТЕЛЬНОСТИ ИНФОРМАЦИОННОЙ ЭКОНОМИКИ, ЛЮБАЯ ПОПЫТКА ИЗБЕЖАТЬ ЭТОЙ СЛЕЖКИ, НАПРИМЕР ИСПОЛЬЗОВАНИЕ ПЛАГИНОВ ТИПА GHOSTERY, БУДЕТ КАЗАТЬСЯ ПОКУШЕНИЕМ НА САМУ ИДЕЮ ИНТЕРНЕТА. последовательность и изменить стимулы, движущие вперед науку и коммерцию.
Яркий пример из недавнего прошлого – зарождение чтения мыслей. В самом начале века сообщалось о ряде все более впечатляющих экспериментов, связанных с «чтением мозга». Например, человек мог попытаться контролировать руку робота, и при этом можно было напрямую измерить показатели его мозговой активности. Но будет ли возможно посредством чтения мыслей измерить, что человек видит или представляет себе? Именно это больше подходит под определение «чтения мыслей».
Результаты начали появляться в начале 2010-х. Психолог Джек Галлант и другие исследователи из Калифорнийского университета в Беркли сообщили, что им почти удалось отследить, куда направлен взгляд человека, всего лишь проанализировав мозговую деятельность подопытного. Благодаря этому сложилось впечатление, что компьютеры стали медиумами. Но именно изучение проблем, связанных с использованием больших массивов научных данных, лучше всего поможет понять, как получается этот результат.
В ходе эксперимента Галланта на основании того, что видел человек, ученые проводили вычисления и создавали фильм. Показатели активности мозга они измеряли при помощи ФМРТ[51]. Изображения расплывались и выглядели странно, но действительно во многом совпадали с тем, что видел человек.
Работало это примерно так: каждому участнику эксперимента показывали несколько видеороликов. Их картины активности мозга каждый раз записывались. Затем подопытный смотрел новый ролик, который раньше не видел, и картины активности снова записывались. Затем эти ролики в нужной пропорции смешивались, в зависимости от того, насколько картина активности мозга каждого из подопытных для нового ролика совпадала с картиной для каждого из роликов, показанных в начале. Когда набиралось достаточно роликов, просмотренных до этого один за другим, при их объединении получался новый разнородный видеоматериал, непохожий на то, что раньше смотрел участник эксперимента.
Этот выдающийся результат был чрезвычайно важен, но это лишь первый этап научного исследования. Он не объяснял, как мозг кодирует визуальные воспоминания. Но действительно важно то, что ученым удалось измерить показатели активности мозга, которые соответствовали определенному типу визуального восприятия. Более того, подобные техники работают и со звуком, и с текстом, и с другими видами действий и переживаний. Эра высокотехнологичного чтения мыслей началась.
Джек Галлант первым отметил, что каким бы впечатляющим ни было их достижение, это не конец, а только начало. Есть надежда, что полный цикл научного осмысления пополнится новыми теориями и догадками.