Нейросети ошибаются в распознавании женщин и темнокожих - Jivoy

Идентификация личности при помощи функции распознавания лиц приобретает всё большую популярность. Многие флагманские смартфоны и ноутбуки уже сейчас используют эту технологию. Мы как то обсуждали тему, в которой на полном серьезе говорилось, что уже можно достаточно точно и автоматически определять гомосексуалистов по фотографиям. Однако точность работы таких алгоритмов, как оказалось, еще требует существенной доработки.

Как недавно выяснилось, на результат работы программы распознавания личности, оказывает влияние цвет кожи и половая принадлежность пользователей.

Эксперт Джой Буоламвини из MIT Media Lab при Массачусетском технологическом институте провёл эксперимент, в ходе которого проверил правильность распознавания выборки из 1200 фотографий известных личностей, занятых в политике, из стран, где во власть активно привлекают женщин. Выбранные личности были продемонстрированы трём наиболее популярным алгоритмам по распознаванию лиц: Microsoft, IBM и Megvii из Китая. Системы, основанные на искусственном интеллекте, ошиблись при определении 0,8% мужчин и 7% женщин европеоидной расы. Среди чернокожих мужчин неправильно распознано 12% личностей, а у женщин негроидной расы отклонение достигло непозволительных 34,7%.

Однако в алгоритмах распознавания лиц не закладывается расовое или гендерное неравенство. Проблема заключается в базе, на которой проходит обучение искусственного интеллекта. Так, например, самая большая база фотографий, предлагаемая для обучения программам идентификации личности, содержит 75% изображений мужчин и на 80% из этих снимков запечатлены светлокожие люди. Также, оценив цвет кожи всех людей с фотоснимков, задействованных в эксперименте, по шкале оттенков кожи Фицпатрика, исследователи заметили, что чем темнее оттенок кожного покрова, тем сложнее ИИ справиться с распознанием.

Таким образом, производителям следует расширить кругозор своих нейросетей и предоставить им для изучения фотоматериалы людей из различных регионов Земли с учётом их расовых, этнических и половых различий.

Джой Буоламвини, ведущий автор исследования, впервые столкнулась с проблемой предвзятости алгоритмов несколько лет назад. Для своего аспирантского проекта она использовала коммерческую программу для распознавания лиц. Команда Джой была этнически и расово пестрой, в ходе работы оказалось, что алгоритм надежно работает только с ее единственным белым участником. Буоламвини, сама темнокожая, попыталась проанализировать собственные фото, и оказалось, что система либо вовсе не распознает ее лицо, либо неверно определяет пол.

Исторически, искусственные нейронные сети за свою уже более чем полувековую историю испытывали как периоды стремительных взлетов и повышенного внимания общества, так и сменявшие их периоды скепсиса и равнодушия. В хорошие времена ученым и инженерам кажется, что наконец-то найдена универсальная технология, способная заменить человека в любых когнитивных задачах. Как грибы после дождя, появляются различные новые модели нейронных сетей, между их авторами, профессиональными учеными-математиками, идут напряженные споры о большей или меньшей степени биологичности предложенных ими моделей. Профессиональные ученые-биологи наблюдают эти дискуссии со стороны, периодически срываясь и восклицая «Да такого же в реальной природе не бывает!» – и без особого эффекта, поскольку нейросетевики-математики слушают биологов, как правило, только тогда, когда факты биологов согласуются с их собственными теориями. Однако, с течением времени, постепенно накапливается пул задач, на которых нейронные сети работают откровенно плохо и энтузиазм людей остывает.

В наши дни нейронные сети снова в зените славы благодаря изобретению метода предобучения «без учителя» на основе Ограниченных Больцмановских Машин (Restricted Bolzmann Machines, RBM), что позволяет обучать глубокие нейронные сети (т.е. с экстра-большим, порядка десятков тысяч, количеством нейронов) и успехам глубоких нейронных сетей в практических задачах распознавания устной речи и изображений. К примеру, распознавание речи в Android реализовано именно на глубоких нейронных сетях. Как долго это продлится и насколько сильно глубокие нейронные сети оправдают возложенные на них ожидания – неизвестно.

Между тем, параллельно всем научным спорам, течениям и тенденциям, отчетливо выделяется сообщество пользователей нейронных сетей – инженеров-программистов-практиков, которых интересует прикладной аспект нейросетей, их способность обучаться на собранных данных и решать задачи распознавания. Со многими практическими задачами классификации и прогнозирования великолепно справляются хорошо проработанные, относительно небольшие модели многослойных персептронов (Multilayer Perceptron, MLP) и сети радиальных базисных функций (Radial Basis Function network, RBF). Эти нейронные сети многократно описаны, я бы посоветовать следующие книжки, в порядке моей личной симпатии к ним: Осовский, Бишоп, Хайкин; также есть хорошие курсы на Coursera и подобных ресурсах.

Однако, что касается общего подхода использования нейронных сетей на практике, он кардинально отличается от обычного детерминированного девелоперского подхода «запрограммировал, работает – значит, работает всегда». Нейронные сети по своей природе являются вероятностными моделями, и подход к ним должен быть совершенно иной. К сожалению, многие программисты-новички технологий машинного обучения вообще и нейронных сетей в частности делают системные ошибки при работе с ними, разочаровываются и забрасывают это дело. Идея написания настоящего трактата на Хабр возникла после общения с такими разочарованными пользователями нейронных сетей – отличными, опытными, уверенными в себе программистами.

https://masterok.livejournal.c...

ТОП ЗА 3 ДНЯ