Идентификация пользователя по движению мышки

2 15772

Актуальность вопросов сохранности персональных данных и массовой слежки в настоящее время трудно переоценить. Такие инженеры как Джулиан Ассанж и Эдвард Сноуден открыли глаза мировой общественности на реальные возможности вездесущих спецслужб разных стран. Чуть меньше внимания мировой общественности уделяется возможностям крупных информационных компаний, таких как Гугл, Яндекс, Фейсбук или Вконтакте.

В данной статье речь пойдет об одном из методов неявного слежения за пользователями персональных компьютеров, основанном на анализе биометрических данных, поставляемых пользователями добровольно и в большом объеме: о анализе данных движений мыши.

Автор не имеет подтверждений использования описываемого подхода крупными компаниями и спецслужбами.

Теоретическое обоснование

Хотя пользователю кажется, что курсор мыши перемещается плавно, для компьютера движение мыши представляется последовательным набором дискретных данных. Одна единица таких данных содержит положение курсора, состояние кнопок мыши и текущее время события. Под событием мыши понимается как нажатие кнопки, так и движение самой мыши.

Пользователь перемещает курсор мыши по сложной кривой и с изменяющейся в процессе перемещения скоростью. Как сама кривая движения курсора, так и скорость движения обусловлены рядом физиологических и психологических факторов. Движение мыши зависит не только от таких факторов как размер и масса руки, положение руки и всего тела, но и от состояния нервной системы и привычек пользователя. Движение курсора мыши можно сравнить с почерком: как текст на бумаге состоит из линий, так из движений мыши состоит цифровой почерк. Каждый, кто использует мышь оставляет подпись таким почерком в памяти компьютера.

Согласно Википедии, биометрия - распознавание людей по одной или более физических, или поведенческих черт. Движения мыши являются биометрическими данными, потому как представляют возможность однозначного определения пользователя компьютера.

Методы сбора и анализа данных

Биометрия на основе данных мыши и клавиатуры рассматривается в научном сообществе с 2007 года. Первые исследования, согласно опубликованной диссертации на соискание степени кандидата наук Диденко Сергея Михайловича, были начаты еще в 2003 году. Разные авторы используют разные наборы ключевых характеристик, однако общая методология сбора и анализа схожа.

На основе анализа научных работ по данной тематике представляется возможным выделение следующих ключевых этапов:

• сбор и передача сырых данных;

• хранение сырых данных;

• выделение ключевых характеристик данных («фич»);

• обучение нейронной сети;

• хранение состояния нейронной сети;

• классификация (определение) пользователей с помощью обученной нейронной сети.

Имеются варианты касательно обработки сырых данных. Одни системы на компьютере пользователя собирают данные и отправляют их на сервер для анализа, в то время, как другие – вычисляют ключевые характеристики непосредственно на компьютере пользователя и отправляют на сервер уже обработанные данные.

Уже в 2007 году системы определения пользователя на основе биометрических данных, полученных при помощи мыши давали точность 95%. Позднее ученым удалось увеличить точность до 99,7% (три ошибочных срабатывания на 1000 порций данных).

Характеристики собираемых персональных данных

В основном ученые ставят перед собой задачу идентификации пользователя по полученным биометрическим данным. Однако, идентификация – не единственная возможная сфера применения данного подхода. В ряде работ имеются заявления о получении следующих типов информации:

• идентификация пользователя;

• определение настроения;

• определение эмоциональной реакции на изучаемый материал;

• определение психофизических характеристик (например, усталость);

• определение физических характеристик (рост, вес);

Данный список может быть расширен посредством анализа влияющих на рассматриваемую биометрию факторов организма и личности.

Возможные области применения

При анализе биометрических данных чаще всего используются нейронные сети. Особенностью нейронные сетей является возрастающая эффективность при возрастающем числе обучающей выборки. Чем большим набором собранных данных сеть обладает, тем точнее работает система.

Рассмотрим основные группы организаций, которые могут обладать большим набором обучающих данных в рассматриваемой области:

• Поисковые системы. Как Яндекс, так и Гугл предоставляют разработчикам сайтов удобный инструмент анализа посещаемости сайта (Аналитикс и Метрика соответственно). Данные о движениях мыши поступают к поисковым гигантам в огромном количестве. Не будет преувеличением сказать, что Яндекс может обладать биометрическими данными всех граждан России. Даже если пользователь напрямую не использует поисковик, данные пересылаются непосредственно с посещаемых им сайтов.

• Разработчики ПО. Не является секретом, что многие программы отправляют своим разработчикам данные об использовании их программ. Даже если программа непосредственно не отправляет указанные пользователем личные данные, она может отправлять данные движения мыши, тем самым позволяя однозначно идентифицировать пользователя. Операционная система компьютера также является подобной программой.

• Владельцы каналов связи. Передача биометрических данных от компьютера пользователя на сервер осуществляется через сети провайдеров. Провайдер имеет возможность анализировать передаваемые данные по сети данных и извлекать из них данные биометрии.

• Службы безопасности стран. Каждая уважающая себя спецслужба имеет доступ к каналам передачи как минимум своей страны.

Перспективы развития

Биометрия на основе данных движения мыши может позволить разработать системы аутентификации без использования вводимых ключевых данных, таких как пароли. Уже сейчас поисковые системы позволяют владельцу сайта однозначно идентифицировать пользователя. Однако данные механизмы не используются для авторизации, возможно, по причине опасения общественного резонанса. Так современные площадки электронной торговли уже оснащены системой отслеживания пользователя на основе данных его поведения в глобальной сети, однако доступ в личный кабинет таких систем до сих пор осуществляется посредством аутентификации по паролю.

На основе вышеизложенных методов возможна постоянная аутентификация пользователей во время работы с системой. На основании данных биометрии программные системы могут понять, когда определенный пользователь закончил работать с системой.

Средства защиты

На основании возможных областей применения методов сбора биометрических данных о использовании мыши, а также исходя из требуемого уровня конфиденциальности можно сформировать следующий перечень мер противодействия.

1. Для анонимного (относительно движений мыши) серфинга сети Интернет стоит использовать браузер с отключенным выполнением языка сценариев JavaScript. Поисковые системы используют скрипты для сбора статистики движения мыши, отключение которых предотвратит сбор и отправку биометрических данных.

2. Для анонимного использования общедоступного компьютера стоит ограничить использование мыши. Данные использования клавиатуры также несут в себе биометрию, однако в значительно меньшем объеме.

3. Для анонимного использования личного персонального компьютера кроме пункта 1 стоит также настроить межсетевой экран на передачу данных только тем серверам и только по тем протоколам, которые известны и понятны пользователю, которым он доверяет.

4. Для работы с критичными данными стоит использовать компьютер вообще без возможности сетевого взаимодействия. Либо не использовать компьютер вообще.

Важно отметить, что идентификация пользователя на основе данных движения мыши является лишь одним из многих способов идентификации. Каждый из методов имеет свои средства блокировки и нейтрализации.

Выводы

Метод аутентификации на основе данных движения мыши, как и любой другой инструмент, можно использовать как для упрощения жизни, так и для ее улучшения. Ключевым моментом здесь является осведомленность пользователя и его добровольное согласие на сбор данных.

Данному методу подвержены все персональные компьютеры, оснащенные мышью. То есть потенциальная возможность аутентификации существует всегда. Вопрос применения метода состоит лишь в том, представляет ли пользователь интерес для организации, обладающей достаточного размера обучающей выборкой.

Не существует универсального метода защиты от сбора биометрических данных, заложенных в движении мыши, кроме как не пользоваться мышью.

Полезные материалы

Научные работы:

1. http://www.tmnlib.ru/jirbis/fi...f, Диденко Сергей Михайлович, 2007 г. – Наиболее раннее найденное упоминание рассматриваемого метода. Автор работы разработал ПО, с точностью идентификации в 95% на основе нейронных сетей. «Реализованные метод и программа идентификации образа информационного почерка пользователя позволяют вести скрытое наблюдение за работой конкретного и группы пользователей.» Исследование проводилось в 2003 году. Автор выделяет определяющие характеристики движения мыши.

2. http://miro.enev.us/docs/mouse..., Ryan Kaminsky, 2008 г. Автор определяет пользователя компьютерной игры, на основе обученной на исторических данных нейронной сети. Для обработки данных используется машина состояний. Оценивается не только траектория, но и точность кликов. Погрешность ПО составляет 6-20%.

3. http://www.ise.bgu.ac.il/facul..., Clint Feher, 2012 г. Автор предлагает использовать биометрические данные, полученные анализом использования мышки для постоянной (периодической) аутентификации пользователя. Биометрия данных движения мыши представляется как отражение психологических и поведенческих характеристик пользователя. Выделяются такие данные, как настроение, усталость.

4. https://www.fer.unizg.hr/_down..., Mirko Stanić. Автор проводит сравнительный анализ методов из более ранних работ. Приводятся цифры точности идентификации от 84% до 99,7%.

Статьи в Википедии по теме:

1. https://en.wikipedia.org/wiki/... - отслеживание мыши.

2. https://ru.wikipedia.org/wiki/... – биометрия.

Упоминания в СМИ:

1. http://www.theregister.co.uk/2...

2. http://habrahabr.ru/post/21839...

3. http://kvnews.ru/gazeta/2015/a...

Как это будет по-русски?

Вчера Замоскворецкий суд Москвы арестовал отца азербайджанца Шахина Аббасова, который зарезал 24-летнего москвича у подъезда дома на Краснодарской улице в столичном районе Люблино. Во время ...

Почему валят грустноарбатовцы?

Сразу с началом Россией силового сопротивления Западу, над приграничными тропами поднялась плотная пыль от топота Принципиальных ПораВалильщиков. В первых рядах, как обычно, пронеслась ...

О дефективных менеджерах на примере Куева

Кто о чём, а Роджерс – о дефективных менеджерах. Но сначала… Я не особо фанат бокса (вернее, совсем не фанат). Но даже моих скромных знаний достаточно, чтобы считать, что чемпионств...

Обсудить