Шрифт:
Закладка:
Приведенный пример – отнюдь не научная фантастика. Несколько исследовательских групп смогли доказать, что разработанный ими искусственный интеллект лучше справляется с выявлением рака груди, чем опытные врачи[371]. Кажется, для радиологов настают не лучшие времена.
Между тем в области машинного обучения уже существуют очень мощные алгоритмы, которые могут делать хорошие прогнозы на основе различных источников данных (изображений, текста и т. д.) по широкому спектру переменных. Поэтому внедрение машинного обучения в дополнение к привычным статистическим методам исследований может помочь психодиагностике совершить качественный скачок. Но хотелось бы проиллюстрировать не только потенциал, но и возможные опасности этого метода.
Как мы знаем, цифровые следы создаются не только при наборе текста на смартфоне или клавиатуре, но и когда наше лицо попадает в объектив камеры телефона. Например, многие из нас смотрят в камеру, чтобы разблокировать смартфон, ведь в последние годы благодаря использованию ИИ значительно усовершенствовалась система распознавания лиц. Но так ли это хорошо?
Три года назад в одной из американских научных статей утверждалось, что искусственный интеллект научился определять сексуальную ориентацию человека по чертам лица, таким как форма носа или челюсти. Если бы это действительно было так, то гомосексуальным мужчинам было бы смертельно опасно ехать в Саудовскую Аравию и приветливо улыбаться в камеру на иммиграционном контроле.
Если упрощать, Йилун Вонг и Михал Косински (да, снова он) позаимствовали для исследования сексуальной ориентации метод из моего примера со снимками компьютерной томографии[372]. Ученые предварительно отобрали 35 326 фотографий с сайтов знакомств, дополнили их указанными самими пользователями данными о половой принадлежности – своей и потенциального партнера. В ходе исследования Вонгу и Косински удалось добиться достаточно высокой точности: 81 % среди мужчин и 71 % среди женщин. Имеется в виду, что компьютеру удавалось достаточно точно определить сексуальную ориентацию, если ему предлагалось сопоставить снимки и отличить гетеросексуала от гомосексуала. Иными словами, ИИ классифицировал пользователей с точностью, значительно превышающей случайность; но это вовсе не означает, что компьютер справился бы с задачей так же хорошо, если бы не сопоставлял снимки двух категорий пользователей[373].
Это исследование взбудоражило ученых по всему миру. Йилун Вонг и Михал Косински в своей работе прямо указывают на опасность злоупотребления подобным алгоритмом, ведь на свое лицо, в отличие от лайков и иных цифровых следов, человек никак повлиять не может.
Но что нам дают результаты этого весьма неоднозначного исследования? Интересную трактовку можно найти в блоге Блеза Агуэры-и-Аркаса. Он отмечает, что лицо человека может быть подвержено влиянию «духа времени» или модных тенденций, что, в свою очередь, могло бы дать информацию о сексуальной ориентации в исследовании. Итак, действительно ли компьютер предсказывал сексуальную ориентацию человека, руководствуясь именно формой лица? Вот что Агуэра-и-Аркас пишет о составных (то есть усредненных) изображениях из работы Вонга и Косински: «Среднестатистическая гетеросексуальная женщина использует тени для век, а среднестатистическая лесбиянка – нет. На гомосексуальном мужчине четче видны очки, на гомосексуальной женщине – в меньшей степени, в то время как на гетеросексуальных мужчине и женщине очков не видно вообще. Может ли быть так, что искусственный интеллект (алгоритм) определяет сексуальную ориентацию не по форме лица, а, скорее, по шаблонам, связанным с внешностью, выражением лица и образом жизни?» Кстати, для лучшего понимания замечаний Агуэры-и-Аркаса советую лично взглянуть на усредненные изображения (см. ссылку или оригинал статьи)[374].
На самом деле проблема машинного обучения заключается в том, что мы не знаем, чему именно учится искусственный интеллект. Эту неопределенность можно в некоторой степени уменьшить, сузив фокус исследования до конкретных характеристик. Мы с моим коллегой Джоном Д. Элхаи из Университета Толедо (США) недавно размышляли о том, как теоретическая надстройка, важная в психологии, может быть учтена в исследовательских проектах с применением машинного обучения[375]. Одна из опций – предоставить компьютеру только те данные, которые теоретически могут обладать диагностической силой для определенного фенотипа (например, сексуальной ориентации). В этом случае при анализе можно было бы уделить больше внимания вышеупомянутым внешним атрибутам моды и времени. В начале 2021 года механизм из описанных выше исследований был перенесен в политическую сферу (что, в общем-то, неудивительно). Михал Косински[376] опубликовал еще одну работу, в которой показал, что по фотографиям с лицами можно с некоторой вероятностью определить не только сексуальную, но и политическую ориентацию человека, а точнее, склонность к либеральным или консервативным взглядам (см. рис. 5.1). Известно, что в США белые, пожилые и мужчины более склонны к консервативному мышлению[377]. Интересно, что даже после того, как Косински проконтролировал эти факторы в своем анализе, ИИ все равно смог сделать предсказания о политической ориентации с точностью более 50 % (от 65 до 71 % в зависимости от выборки). То есть даже если не смотреть на такие очевидные характеристики, как пол, возраст или этническая принадлежность, изображения лиц содержат информацию, которая позволяет верно определить политические взгляды. Но что это за информация? К примеру, Косински заметил, что люди с либеральными взглядами чаще смотрят прямо в камеру. Кроме того, у них чаще встречается удивленное и менее недовольное выражение лица. Обобщая результаты, я собрал информацию из статьи Косински и отобразил на диаграмме, сравнивающей, насколько хорошо ИИ («алгоритм») и живые люди могут определить по фото политические взгляды, сексуальную ориентацию или характер. В целом, люди справляются с задачей лишь чуть лучше, чем подброшенная монетка. ИИ работает с точностью выше 50 %, но тоже далек от идеального результата.
Рис. 5.1. Люди определяли политическую и сексуальную ориентацию, а также характер человека по фотографии с вероятностью чуть более 50 %. Точность прогноза заметно возрастает, если подключить машинное обучение (здесь – «алгоритм»). Цифры взяты из исследования Косински (2012; см. также примечание 31)
В завершение главы хотелось бы вспомнить простой принцип из информатики «Мусор на входе – мусор на выходе», иллюстрирующий ограничения, стоящие перед искусственным интеллектом (ИИ) в отношении оценки цифровых следов. Вообще, логично: если у вас плохие, «мусорные» данные, то и в результате ничего хорошего можно не ждать. Иными словами, минимальное требование для успешного применения ИИ – высокое качество данных. В примере с работой Йилуна Вонга и Михала Косински возникает закономерный вопрос: возможно ли вообще доказать, что фотографии лиц содержат какую-либо информацию о сексуальной ориентации их обладателей?
В целом, тема структуры данных