Использование биометрии в нейросетях: как работает технология

2 1383

Мы продолжаем развивать актуальную тему использования биометрии в нейросетях. Сегодня поговорим, когда эта технология появилась, как получила свое развитие и почему к противникам биометрии действительно стоит прислушаться.

Что внутри сервисов, основанных на использовании биометрии и нейросетях?

У каждого сервиса распознавания внутри своя нейросеть. Развитие эти технологии распознавания получили не так уж давно. В 2012 году в Стэнфорде состоялся конкурс Imagenet для IT. Именно туда Джеффри Хинтон привез свою программу-аналитика изображений. Подождите, там задача была попроще: программам-конкурсантам нужно было отличить предметы одного рода от другого. Ну, автомобиль от собаки, например. Забавно, но именно это – начало истории. Хинтон со своей программой превзошел остальных: точность его продукта составила 85%. Секрет автора был в том, что он использовал нейросети в сочетании с геймерскими видеокартами. Это отличие позволило Хинтону сэкономить место: множество вычислений помещались на множество мелких процессоров в карте, в то время как другим авторам для алгоритмов требовались шкафы (реально). На самом деле Джеффри Хинтон и его коллеги (ученые, все же) и ранее описывали технологии глубинного обучения нейросетей, и работали над этим, но до того момента в эту сторону мало кто смотрел: не хватало мощности. Теперь же вопрос был решен.

Использование биометрии и нейросети: game-change

Очень упрощенно о том, как работают нейросети, чтобы распознать лицо. Для нейросети вся информация – это шум, среди которого она сама выбирает параметры, которые сравнивает: так называемые фичи. Фичи – это не черты лица, это результат их кодировки. Алгоритм кодирует черты лица, сверяется с библиотекой изображений и выдает результаты: вот самые похожие фото по степени соответствия коду. Каждая нейросеть создает свой ряд параметров, которые сравнивает позже с параметрами из базы данных. При этом порой даже программист не знает, какие именно. Итоговый алгоритм каждой сети индивидуален. Тех, кто выступает против биометрии, наверное, сейчас просто разорвало на части от того, как просто, оказывается, «своровать» данные тела.

Когда вы загружаете фото, сеть ищет в базе ближайший ряд чисел из уже сохраненных. При этом в качестве базы данных, на которую должна ориентироваться сеть, используются фото из публичного доступа: чаще всего из соцсетей. Например, идеально подходит «ВКонтакте», но есть свои недостатки: она, например, плохо различает людей азиатской внешности (но ею возможности не ограничены).

В целом, так работают все сервисы на нейросетях для поиска похожих предметов: и Shazam, и Google Images. Фишка с нейросетями в том, что они самостоятельны в обучении. Алгоритм ошибается, но на основе ошибок подкручивает методы и в итоге успешно учится: в конце концов, распознает нужную информацию и - успех! - отличает лица. Несколько похоже и на дипфейки, которые мы описывали ранее.

Технология уже здесь. Можно ли выступать против сбора биометрии или пока закон бессилен?

Автор неоднозначной рекламы сервиса FindFace Максим Перлин комментировал свое решение так: он предполагал, что девушек начнут травить. Правда, думал, что скорее тех, кто когда-либо был замешан в проституции. Кухаренко, как автор проекта, не очень позитивно воспринял идею с игрой на таких грязных подробностях частной жизни, но все же доверил рекламу именно Перлину, который был настолько одержим идеей сделать сервис «символом нового времени», что пошел этим путем. И вот как все развернулось… Максим Перлин уже после взрыва популярности программы говорил, что понимал, насколько это может быть ужасно, и девушек ему было реально жаль. Но виноватым себя или сервис в чем-либо он не считает. Очевидно, что большинство пострадавших скорее всего выступили бы против биометрии и нейросети, но их голос не был бы услышан.

К слову об ответственности и позиции социальных сетей. «ВКонтакте» несколько лет не обращала внимания на использование публичных фото пользователей сервисом Findсlone, несмотря на скандальные истории, однако потом вопрос законности все же возник. В 2019 году Саидов и Зданович общались с юристом сети по его инициативе. Юрист выступил с требованием удалить базу данных на том основании, что они принадлежат соцсети. Авторы сервиса распознавания, спросив об основаниях таких требований, внятного ответа так и не получили. Да его, собственно, их нет.

Создатели сервиса по этому поводу говорят о том, что и данных-то не копируют и, в целом, они по-своему правы: они лишь переводят визуал из публичного пространства в цифру. Технически здесь нет нарушений.

Findсlone от всего этого только выиграли: новости о неоднозначности сервиса привлекли к нему внимание, им стали пользоваться в Bellingcat, а потом и правоохранители. А потом просто пользователи для деанонимизации правоохранителей. И так далее.

А что делать-то?

Можете не пользоваться соцсетями, например. Что сложно в условиях уровня проникновения интернета, но можно. Правда, если вы уже разместили фото, то поздно. С другой стороны вы, как пользователь, конечно, можете изъять свое изображение из базы данных, об этом говорит и Кирилл Каплин из Findclone. Да, как и любые свои данные по заявлению. Один нюанс – уже поздно. Ваши данные уже везде и ими уже пользуются здесь и сейчас. А еще неплохо было бы учесть, что сервисов по распознаванию и поиску двойников масса, а базы у всех разные. А потом посчитать, сколько у вас аккаунтов и изображений в интернете. Все, что однажды оказалось в интернете, там остается.

Интересно, что именно российские разработчики чаще всего оказываются лидерами по технологии распознавания лиц. Среди остальных стран разве что Китай может составить конкуренцию. Это подтверждают и регулярные призовые места в конкурсе NIST. Это здорово, но знающие люди могли бы позаботиться и о правах пользователей, чтобы они не стали жертвами поневоле. Однако правила и здесь отстают от технологий и реальности, ибо все слишком динамично. По сей день нормативно-правовое поле не готово к тому, чтобы как-то защитить всю информацию, принадлежащую пользователю. Фото из социальных сетей очень условно (и не всегда) на практике относятся к персональным данным. Но и персональные данные защищены у нас недостаточно надежно, что же с этим делать? Нет четкого запрета делать то, что делают такие сервисы. Общедоступная информация может использоваться любыми лицами по их усмотрению при соблюдении закона.

Этот просветительский экскурс – еще один из множества повод задуматься о безопасности в сети и сменить беспечность на осознанность и бережливость по отношению к себе. 

Вот и осень пролетела...

Ватная пропаганда Ну что, осень завершилась. Можно подводить промежуточные итоги. Россия Реклама С российской экономикой всё хорошо. Уверенный рост, в третьем квартале 5,5% ВВП. В «П...

«Из уст Путина прозвучали очень веские слова»: в Польше наконец услышали правду о спецоперации

Конфликт на Украине в западных СМИ объясняется одномерно и вульгарно, пишет Myśl Polska. Именно поэтому речь Путина на Всемирном русском народном соборе замалчивают и искажают. В ней он объяснил, ...

Кого Запад назначил "ходоком" к Путину вместо Абрамовича. Встреча уже была
  • Andreas
  • Сегодня 10:15
  • В топе

Как только успехи российской армии стали очевидны, и впереди замаячили перспективы разгрома лиходеев, противник на том берегу океана тут же оживился. Появились от него первые ходоки, готовые взять...

Обсудить
  • "Этот просветительский экскурс – еще один из множества повод задуматься о безопасности в сети и сменить беспечность на осознанность и бережливость по отношению к себе" Это почти бессмысленный совет - не Вы сами, так Ваши знакомые уже давно разнесли по Сети всё о Вас: фотографии, личные данные, а у некоторых - и пароли на всё и вся. Нынешние правоохранительные системы в этом вопросе практически бессильны. Тут нужны серьёзные усилия госудраств - а им не до того: подумаешь, у людишек расползлись по Сети их данные Разумеется, - "и сам не плошай" никто не отменял. Но это не обеспечит решения проблемы.
  • "Секрет автора был в том, что он использовал нейросети в сочетании с геймерскими видеокартами.", - и тут мне поплохело. Ладно, если вся эта тема с "криптой", - вопрос государственный (а то и нескольких, т.к. их несколько), получить нахаляву вычислительные мощности и энергию, создать свою вычислительную систему, которая делает вид, что генерит какие-то пакеты данных ради самих пакетов данных, а лохи за это платят сами себе, играя на бирже, - это ещё полбеды. Беда будет, если это ИИ мафии, и вообще Беда-Беда, если это реально самостоятельный ИИ, детище того сумасшедшего ученого, который эту штуку выдумал: распределённая по планете сеть, которую люди содержат за свои деньги. Похоже на "Skynet", и он, судя по распространенности - вполне готов пережить ядерный апокалипсис.