Использование биометрии в нейросетях: как работает технология

2 1390

Мы продолжаем развивать актуальную тему использования биометрии в нейросетях. Сегодня поговорим, когда эта технология появилась, как получила свое развитие и почему к противникам биометрии действительно стоит прислушаться.

Что внутри сервисов, основанных на использовании биометрии и нейросетях?

У каждого сервиса распознавания внутри своя нейросеть. Развитие эти технологии распознавания получили не так уж давно. В 2012 году в Стэнфорде состоялся конкурс Imagenet для IT. Именно туда Джеффри Хинтон привез свою программу-аналитика изображений. Подождите, там задача была попроще: программам-конкурсантам нужно было отличить предметы одного рода от другого. Ну, автомобиль от собаки, например. Забавно, но именно это – начало истории. Хинтон со своей программой превзошел остальных: точность его продукта составила 85%. Секрет автора был в том, что он использовал нейросети в сочетании с геймерскими видеокартами. Это отличие позволило Хинтону сэкономить место: множество вычислений помещались на множество мелких процессоров в карте, в то время как другим авторам для алгоритмов требовались шкафы (реально). На самом деле Джеффри Хинтон и его коллеги (ученые, все же) и ранее описывали технологии глубинного обучения нейросетей, и работали над этим, но до того момента в эту сторону мало кто смотрел: не хватало мощности. Теперь же вопрос был решен.

Использование биометрии и нейросети: game-change

Очень упрощенно о том, как работают нейросети, чтобы распознать лицо. Для нейросети вся информация – это шум, среди которого она сама выбирает параметры, которые сравнивает: так называемые фичи. Фичи – это не черты лица, это результат их кодировки. Алгоритм кодирует черты лица, сверяется с библиотекой изображений и выдает результаты: вот самые похожие фото по степени соответствия коду. Каждая нейросеть создает свой ряд параметров, которые сравнивает позже с параметрами из базы данных. При этом порой даже программист не знает, какие именно. Итоговый алгоритм каждой сети индивидуален. Тех, кто выступает против биометрии, наверное, сейчас просто разорвало на части от того, как просто, оказывается, «своровать» данные тела.

Когда вы загружаете фото, сеть ищет в базе ближайший ряд чисел из уже сохраненных. При этом в качестве базы данных, на которую должна ориентироваться сеть, используются фото из публичного доступа: чаще всего из соцсетей. Например, идеально подходит «ВКонтакте», но есть свои недостатки: она, например, плохо различает людей азиатской внешности (но ею возможности не ограничены).

В целом, так работают все сервисы на нейросетях для поиска похожих предметов: и Shazam, и Google Images. Фишка с нейросетями в том, что они самостоятельны в обучении. Алгоритм ошибается, но на основе ошибок подкручивает методы и в итоге успешно учится: в конце концов, распознает нужную информацию и - успех! - отличает лица. Несколько похоже и на дипфейки, которые мы описывали ранее.

Технология уже здесь. Можно ли выступать против сбора биометрии или пока закон бессилен?

Автор неоднозначной рекламы сервиса FindFace Максим Перлин комментировал свое решение так: он предполагал, что девушек начнут травить. Правда, думал, что скорее тех, кто когда-либо был замешан в проституции. Кухаренко, как автор проекта, не очень позитивно воспринял идею с игрой на таких грязных подробностях частной жизни, но все же доверил рекламу именно Перлину, который был настолько одержим идеей сделать сервис «символом нового времени», что пошел этим путем. И вот как все развернулось… Максим Перлин уже после взрыва популярности программы говорил, что понимал, насколько это может быть ужасно, и девушек ему было реально жаль. Но виноватым себя или сервис в чем-либо он не считает. Очевидно, что большинство пострадавших скорее всего выступили бы против биометрии и нейросети, но их голос не был бы услышан.

К слову об ответственности и позиции социальных сетей. «ВКонтакте» несколько лет не обращала внимания на использование публичных фото пользователей сервисом Findсlone, несмотря на скандальные истории, однако потом вопрос законности все же возник. В 2019 году Саидов и Зданович общались с юристом сети по его инициативе. Юрист выступил с требованием удалить базу данных на том основании, что они принадлежат соцсети. Авторы сервиса распознавания, спросив об основаниях таких требований, внятного ответа так и не получили. Да его, собственно, их нет.

Создатели сервиса по этому поводу говорят о том, что и данных-то не копируют и, в целом, они по-своему правы: они лишь переводят визуал из публичного пространства в цифру. Технически здесь нет нарушений.

Findсlone от всего этого только выиграли: новости о неоднозначности сервиса привлекли к нему внимание, им стали пользоваться в Bellingcat, а потом и правоохранители. А потом просто пользователи для деанонимизации правоохранителей. И так далее.

А что делать-то?

Можете не пользоваться соцсетями, например. Что сложно в условиях уровня проникновения интернета, но можно. Правда, если вы уже разместили фото, то поздно. С другой стороны вы, как пользователь, конечно, можете изъять свое изображение из базы данных, об этом говорит и Кирилл Каплин из Findclone. Да, как и любые свои данные по заявлению. Один нюанс – уже поздно. Ваши данные уже везде и ими уже пользуются здесь и сейчас. А еще неплохо было бы учесть, что сервисов по распознаванию и поиску двойников масса, а базы у всех разные. А потом посчитать, сколько у вас аккаунтов и изображений в интернете. Все, что однажды оказалось в интернете, там остается.

Интересно, что именно российские разработчики чаще всего оказываются лидерами по технологии распознавания лиц. Среди остальных стран разве что Китай может составить конкуренцию. Это подтверждают и регулярные призовые места в конкурсе NIST. Это здорово, но знающие люди могли бы позаботиться и о правах пользователей, чтобы они не стали жертвами поневоле. Однако правила и здесь отстают от технологий и реальности, ибо все слишком динамично. По сей день нормативно-правовое поле не готово к тому, чтобы как-то защитить всю информацию, принадлежащую пользователю. Фото из социальных сетей очень условно (и не всегда) на практике относятся к персональным данным. Но и персональные данные защищены у нас недостаточно надежно, что же с этим делать? Нет четкого запрета делать то, что делают такие сервисы. Общедоступная информация может использоваться любыми лицами по их усмотрению при соблюдении закона.

Этот просветительский экскурс – еще один из множества повод задуматься о безопасности в сети и сменить беспечность на осознанность и бережливость по отношению к себе. 

Они ТАМ есть: «Солнышко моё…»

Ни Марина, ни муж ее Виталий не поддерживали майдан. Это было бы смешно, живя в русском городе, имея нормальное образование, верить в секту, носящую кругами гробы на майдане. Они, как и...

Война за Прибалтику. России стесняться нечего

В прибалтийских государствах всплеск русофобии. Гонения на русских по объёму постепенно приближаются к украинским и вот-вот войдут (если уже не вошли) в стадию геноцида.Особенно отличае...

Ну, прощайте, старые границы! Почему США и ЕС устроит даже урезанная Украина

Стремление Запада сохранить Украину в качестве карманной анти-России необычайно велико. Настолько, что в Вашингтоне и Брюсселе готовы убедить Киев отказаться от идеи вернуть и уже потер...

Обсудить
  • "Этот просветительский экскурс – еще один из множества повод задуматься о безопасности в сети и сменить беспечность на осознанность и бережливость по отношению к себе" Это почти бессмысленный совет - не Вы сами, так Ваши знакомые уже давно разнесли по Сети всё о Вас: фотографии, личные данные, а у некоторых - и пароли на всё и вся. Нынешние правоохранительные системы в этом вопросе практически бессильны. Тут нужны серьёзные усилия госудраств - а им не до того: подумаешь, у людишек расползлись по Сети их данные Разумеется, - "и сам не плошай" никто не отменял. Но это не обеспечит решения проблемы.
  • "Секрет автора был в том, что он использовал нейросети в сочетании с геймерскими видеокартами.", - и тут мне поплохело. Ладно, если вся эта тема с "криптой", - вопрос государственный (а то и нескольких, т.к. их несколько), получить нахаляву вычислительные мощности и энергию, создать свою вычислительную систему, которая делает вид, что генерит какие-то пакеты данных ради самих пакетов данных, а лохи за это платят сами себе, играя на бирже, - это ещё полбеды. Беда будет, если это ИИ мафии, и вообще Беда-Беда, если это реально самостоятельный ИИ, детище того сумасшедшего ученого, который эту штуку выдумал: распределённая по планете сеть, которую люди содержат за свои деньги. Похоже на "Skynet", и он, судя по распространенности - вполне готов пережить ядерный апокалипсис.