Системы распознавания лиц «спасовали» перед большим объемом данных

4 1676

 

University of Washington

Программы по распознаванию лиц могут быть не так эффективны, как полагают их создатели. Несмотря на то, что успешность их работы оценивается с помощью баз данных, содержащих десятки тысяч фотографий, когда количество изображений превышает полмиллиона, все алгоритмы справляются с заданием значительно хуже. Исследование будет представлено на Конференции IEEE по компьютерному зрению и распознаванию образов на этой неделе.

Ученые из Вашингтонского университета провели соревнование под названием MegaFace Challenge и оценили работу систем распознавания лиц с помощью больших баз данных. Они начали свою работу с того, что взяли два существующих набора изображений — один из них состоял из фотографий знаменитостей, сделанных с разных ракурсов (100 тысяч изображений 530 знаменитостей), а другой — из фотографий людей разных возрастов (975 изображений 82 человек). Затем они добавили к этим наборам «отвлекающие» фотографии пользователей Flickr, на которых было запечатлено более 690 тысяч человек.

Авторы работы предложили участникам MegaFace Challenge скачать базы данных и посмотреть, насколько хорошо их алгоритмы смогут найти среди всех лиц два одинаковых. Также программы должны были обнаружить совпадения с загруженной фотографией в базе данных.

Оказалось, что абсолютно все алгоритмы хуже справляются с задачей, когда количество «отвлекающих» данных увеличивается. В тесте, где за основу была взята база изображений людей разных возрастов, лучше всего показал себя алгоритм Google FaceNet, чья точность распознавания лиц упала только до 75 процентов, когда в набор фотографий был добавлен миллион «отвлекающих» изображений. Другой тест успешнее всех прошел алгоритм российской команды из лаборатории NTechLab, ухудшив свой результат до 73 процентов.

 

Количество «отвлекающих» факторов начиналось с 10 и достигало миллиона

University of Washington

 

Точность распознавания лиц остальных программ упала значительно сильнее — в некоторых случаях до 33 процентов. Исследователи объясняют это тем, что наиболее эффективные алгоритмы были обучены с помощью большого объема данных (например, для обучения FaceNet использовалось более 500 миллионов фотографий 10 миллионов людей).

 

В конце лета команда ученых планирует создать базу данных, в которой будут собраны по несколько фотографий полумиллиона людей, для того, чтобы разработчики могли использовать ее в обучении своих программ. Это позволит проверить работу алгоритмов в более равных условиях, так как большинство компаний не имеет доступа к таким большим коллекциям изображений, как Google.

Кристина Уласович

Утренний прилет по Южмашу — это крайне изящное и деликатное «послание» не Киеву, хотя и ему отчасти тоже. Это сигнал и «партии эскалации», и Трампу, если он решит использовать ее «таранный» потенциал. (с)

Последние два моих поста (про украинские «Канны 3.0» и действия «партии эскалации») многим не понравились. Прежде всего, своей жесткостью и циничностью. Понимаю людей, но от своего стиля – жесткой дек...

"Можно разбить "Южмаш" сверху, а внизу будет все работать": Первое боевое применение межконтинентальной убийцы ПРО

Русские ударили по Украине ракетой-носителем ядерного оружия. Под раздачу попало легендарное космическое предприятие. НАТО пока переваривает новость. Подробности читайте в материале "Но...

"ШОУБИЗ ИМЕНИ ПУГАЧЁВОЙ" – ВСЁ? РУССКИЕ ПОСТАВИЛИ ЗВЁЗД ПЕРЕД НЕПРИЯТНЫМ ФАКТОМ

"Шоубиз имени Пугачёвой" – всё, заканчивается? Русские зрители поставили "звёзд" перед неприятным фактом: организаторы констатируют существенное снижение интереса к надоевшим артистам.В очередной раз ...

Обсудить
  • Даешь суперкомпьютер на каждый вокзал, дурью маяться
  • Читая между строк, понимаешь, что данные соцсетей используются где угодно и как угодно...
  • Приклей нос другой, и Вас не опознает бедная машинка. Пусть возят её учится по всему миру и по Евразес, Щанхайской и Бриксовой поверке, пусть дадут тренировку...
  • теперь везде буду приклеивать носы :) !!! Вообще опознание давно производится без фото....