Шрифт:
Интервал:
Закладка:
По мере совершенствования систем распознавания речи расширяется их использование в самых разных областях, включая медицину, где ошибки могут обойтись очень дорого. В статье 2016 г. представлены результаты анализа случайной выборки, включающей сотню речевых команд, отданных врачами скорой помощи во время работы с пациентами. Оказалось, что 15 % команд были распознаны неверно, причем ошибки были очень серьезными, «способными привести к недоразумениям, в результате которых могли пострадать пациенты»[691]. К сожалению, авторы работы не привели данных в разбивке медиков по половому признаку, но данные, которыми мы располагаем, показывают, что при распознавании женских команд системы ошибаются чаще, чем при распознавании мужских[692]. Доктор наук Сайед Али, ведущий автор одного из исследований применения голосовых систем в медицине, отмечает, что «практические выводы» ученых таковы: женщинам, «видимо, придется прикладывать больше усилий», чем мужчинам, чтобы «системы [распознавания речевых команд] работали нормально»[693]. Рейчел Татман согласна с этим выводом: «Факт тот, что современные системы распознают мужские команды лучше, чем женские. Соответственно, женщинам труднее работать. Даже если для исправления ошибки требуется всего секунда, эти секунды складываются в дни и недели, которые нашим коллегам-мужчинам не приходится попусту тратить на возню с плохо работающей техникой».
Женщины всего мира, которых приводят в ярость несовершенные голосовые системы, радуйтесь! Том Шальк, вице-президент ATX – компании, поставляющей голосовые навигаторы для автомобилей, – предложил новаторское решение, способное устранить «многие недостатки, связанные с распознаванием женской речи»[694]. По его мнению, женщинам нужна всего лишь «тщательная подготовка» и, конечно, «готовность учиться». Вот только, сокрушается Том Шальк, такой готовности у них нет. Почему в Бангладеш упрямые матери семейств покупают неправильные плиты? Почему автоледи упорно покупают автомобили в напрасной надежде, что разработчики систем голосового управления сделают продукт, который будет их слушаться? Ведь совершенно ясно, что решать проблему должны не инженеры, не программисты, а сами женщины. Ну почему женщина не может быть больше похожа на мужчину?
Рейчел Татман отметает предположение, что проблема кроется в женской речи, а не в технологии, неспособной ее распознавать. Результаты исследований показывают, что «женская речь намного более разборчива, чем мужская»[695], – возможно, потому, что женщины, как правило, более протяжно произносят гласные[696] и говорят медленнее мужчин[697]. Мужчины, напротив, «чаще спотыкаются в разговоре, проглатывают гласные и произносят слова неправильно или небрежно»[698]. С учетом этого голосовые системы должны были бы лучше распознавать женские голоса – и действительно, Рейчел Татман пишет, что ей самой «доводилось обучать классификаторы[699] на записях женской речи, и они работали прекрасно, большое им спасибо».
Разумеется, виной всему вовсе не особенности женской речи. Виноват наш старый друг, дефицит гендерных данных. Голосовые технологии создаются на основе баз данных аудиофайлов с записями речи, так называемых речевых корпусов. И в этих базах данных преобладают записи мужской речи, во всяком случае, насколько мы можем судить, ведь в большинстве речевых корпусов записи не разбиты по половому признаку, что само по себе уже является пробелом в данных[700]. Когда Рейчел Татман сравнила доли записей мужской и женской речи в речевых корпусах, оказалось, что только в TIMIT («главном и наиболее известном речевом корпусе Консорциума лингвистических данных») данные разбиты по половому признаку. При этом на долю записей мужской речи приходилось 69 % общего количества записей. Но, вопреки выводам Рейчел Татман, найти записи женских голосов можно: как указано на сайте Британского национального корпуса[701], эта база данных является гендерно сбалансированной[702].
Речевые корпуса – не единственные базы данных, используемые для разработки алгоритмов, страдающих от «мужского перекоса». Корпуса текстов (включающие самые разные тексты – от романов до газетных статей и стандартных учебников) используются при разработке программ для переводов, сканирования резюме соискателей при приеме на работу и поиска в сети. Они тоже страдают от нехватки гендерных данных. Прошерстив Британский национальный корпус[703] (100 млн слов из различных текстов конца XX в.), я обнаружила, что местоимения мужского рода всегда выскакивают в результатах поиска почти вдвое чаще местоимений женского рода[704]. При этом соотношение местоимений мужского и женского рода в Корпусе современного американского английского языка, содержащем 520 млн слов, также составляет 2:1, хотя он включает более современные тексты (вплоть до 2015 г.)[705]. Алгоритмы, разрабатываемые на основе таких корпусов, страдающих от нехватки гендерных данных, создают впечатление, что в мире действительно преобладают мужчины.