chitay-knigi.com » Разная литература » Миры, которые я вижу. Любопытство, исследования и открытия на заре ИИ - Fei-Fei Li

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 63 64 65 66 67 68 69 70 71 ... 95
Перейти на страницу:
ни нравилась стряпня Сильвио, подобные замысловатые ужины - рецепт домашнего напряжения. Я наблюдала за его выступлением еще минуту или две, прежде чем усмехнуться про себя.

"Что?" - спросил он.

"Знаешь, это забавно. Я сразу чувствую, когда наступает такой вечер. Когда я просто знаю, что нам придется держать маму подальше от кухни. Какое-то магическое расположение кастрюль, сковородок и суматохи говорит мне, что у тебя намечается что-то грандиозное, и я улавливаю это, как только прохожу мимо. Никаких сознательных мыслей - просто мгновенное осознание. Знаете, о чем это заставляет меня думать? О Джереми Вулфе".

Шевеление Сильвио на мгновение замедлилось. "Вульф... Вульф... О, ученый-когнитивист? Из Гарварда? Тот самый "суть", верно?"

"Хорошая память! Боже, он написал эту совершенно непонятную статью в каком-то журнале в 1998 году. Это даже не было исследованием. Просто статья о мнении. Но это была одна из самых влиятельных вещей, которые я прочитал в Калтехе. Легко. Я до сих пор об этом думаю".

Всемирно известный исследователь, интересующийся внутренним устройством зрительной памяти, Джереми Вулф считает нашу способность быстро осмысливать сцену захватывающей и посвятил большую часть своей работы ее пониманию. Статья 1998 года под названием "Визуальная память: Что вы знаете о том, что видели?" была написана почти разговорным тоном, но выводы в ней были весьма проницательными. По его словам, увиденное изображение побуждает наш мозг "запомнить суть сцены".

"Точно, точно. Помню, я подумал, что "суть" - забавное слово для такой статьи". Сильвио захихикал, раскладывая буррату, рукколу и помидоры и изредка поглядывая на дверь, чтобы убедиться, что она все еще закрыта.

"Отчасти поэтому я так ее любил", - ответил я. "Идеи были такими масштабными, но язык был совершенно простым".

Сильвио ненавидел, когда его отвлекали во время приготовления пищи. Я это знала, и он знал, что я это знаю. Но он тоже был неравнодушен к научным разговорам и давно усвоил, что, если я заведусь на подобную тему, ему лучше дать мне выговориться. Я слегка усмехнулся, понимая, что он, вероятно, напоминает себе обо всем этом, пока нарезает перец.

"Его идея, - добавил Сильвио, - заключалась в том, что наш первый взгляд на что-то - это все, что нужно, чтобы понять это, хотя бы на каком-то уровне, верно?"

"Верно. Это включает в себя основные вещи, такие как предметы, конечно. Мы умеем быстро находить "вещи". Но мы отлично умеем замечать, как они расположены и расставлены. Ну, знаете, углы, положения и прочее. Как мы это интерпретируем".

"Отношения между вещами".

"Да, именно так! Но самое удивительное, что мы делаем все это, не задумываясь. Это просто происходит, в мгновение ока, как у меня сегодня, когда я увидел, что ты готовишь..."

"Фей-Фей? Ты там?"

Это была моя мама. Мы с Сильвио посмотрели друг на друга, и наши глаза мгновенно расширились.

"Почему дверь закрыта?" - продолжала она.

"Сильвио был, э-э-э, там было много пара, и, э-э-э..."

"В этом нет никакого смысла!" - попытался прошептать он, ухмыляясь.

"Прекрати хихикать!" Я отстреливалась, наклоняясь к двери, чтобы выскользнуть, пытаясь и не пытаясь вести себя естественно, пока моя мать безучастно смотрела на меня.

Понятие "суть" осталось со мной надолго после прочтения книги Вулфа, вдохновив меня настолько, что я посвятил большую часть своего времени в Калтехе ее изучению. Работа не имела явных связей с информатикой или искусственным интеллектом, но напрямую затрагивала вопрос о том, что именно воспринимают люди, когда смотрят на реальный мир. Хотя Пьетро, Кристоф и я считали такое тонкое понимание далекой мечтой для компьютерного зрения, мы были убеждены, что путешествие может начаться только с лучшего понимания того, что делают люди, и придумали способ исследовать это. Наши результаты были опубликованы в 2007 году в журнале Journal of Vision, специализирующемся на неврологии.

В нашем эксперименте двадцати двум испытуемым была показана коллекция из девяноста фотографий, каждая из которых была сделана в течение короткой экспозиции от пятисот миллисекунд (полсекунды) до двадцати семи миллисекунд (примерно половина времени, в течение которого виден один кадр кинопленки). Фотографии были концептуально простыми, но детальными: повседневные сцены, включающие множество людей, событий и действий, в том числе в помещении и на улице, в естественном и искусственном окружении. Задача испытуемых состояла в том, чтобы описать увиденное - точнее, то, что они помнят, - как можно подробнее.

Как и все эксперименты, он начинался как азартная игра; половина удовольствия заключалась в том, что мы не знали, что именно мы обнаружим, если вообще что-то обнаружим. Но все окупилось, и я до сих пор восхищаюсь реакцией, которую мы получили. Например, когда одному испытуемому в течение пятисот миллисекунд показывали фотографию интерьера жилого дома викторианской эпохи, он написал:

Какая-то причудливая гостиная в стиле 1800-х годов с богато украшенными односпальными креслами и портретами на стене.

Всего за полсекунды они увидели достаточно, чтобы составить простое, но, по сути, идеальное описание сцены, включая разумные оценки века, характера настенных украшений и конструкции отдельных предметов мебели. Но даже в течение двадцати семи миллисекунд - примерно одной сороковой секунды, что, несомненно, достаточно мало для того, чтобы лишить объект почти всех возможностей для глубины и детализации, - подлинное осознание сохранялось:

Многого не было видно: в основном темнота и какие-то квадратные предметы, возможно, мебель.

"Может быть, мебель". Два слова, которые так много открывают. Удивительно, что даже за такой короткий промежуток времени можно зарегистрировать столь сложное понятие - не форму, не цвет, даже не какое-то природное явление, заложенное глубоко в наших генах, а нечто столь современное и произвольное, как мебель.

С ограничениями по времени или без них, но я нашел эту способность захватывающей. Фотографии могут быть неподвижными, но мы умеем извлекать застывшее в них движение, от грандиозного и масштабного до почти незаметного, и все это с впечатляющей точностью. Мы естественным образом учитываем угол наклона тел, рук и ног и мгновенно чувствуем, откуда они пришли и куда направляются; скорость и силу, вес и баланс, энергию и потенциал. Мы представляем себе обстоятельства, приведшие к моменту, запечатленному на снимке, и возможный результат, как, например, доли секунды, следующие за фотографией скейтбордиста, прыгающего с бордюра, или целая жизнь, следующая за изображением молодой пары, обменивающейся свадебными клятвами.

Даже о намерениях можно догадаться. Мы можем написать тома о напряжении, которое чувствуем в позе фигуры, о близости одного человека к другому или о такой простой вещи, как угол брови. Часто этого более чем достаточно, чтобы понять, на кого мы смотрим, как они относятся

1 ... 63 64 65 66 67 68 69 70 71 ... 95
Перейти на страницу:

Комментарии
Минимальная длина комментария - 25 символов.
Комментариев еще нет. Будьте первым.
Правообладателям Политика конфиденциальности