Искусственный интеллект научился предсказывать решения Страсбургского суда

6 1547

 

Adrian Grycuk / Wikimedia Commons

Искусственный интеллект научился предсказывать решения Европейского суда по правам человека о перспективах поступивших к нему жалоб с точностью до 79 процентов. Добиться такого результата удалось благодаря алгоритму, специально разработанному учеными из Великобритании и США. Статья исследователей опубликованав журнале Computer Science.

Европейский суд по правам человека, известный также как Страсбургский суд, — это международный судебный орган, который занимается рассмотрением жалоб на нарушение основополагающих прав человека. Статистика показала, что в прошлом году в Страсбургский суд было подано в два раза больше жалоб, чем в 2014 году. Большинство заявлений не были приняты к рассмотрению, так как они были либо неправильно составлены, либо решения по ним уже были приняты, либо в тексте не содержалось состава преступления. В итоге только 15 процентов от общего числа обращений дошли до суда. 

Поток заявлений в Страсбургий суд увеличивается с каждым годом, а судьям необходимо выбирать из них только достойные внимания. Чтобы решить эту проблему, авторы новой статьи создали искусственный интеллект, который сможет анализировать заявления в автоматическом режиме. Для этого исследователи использовали SVM-классификатор, обученный с помощью дел по трем статьям Конвенции о защите прав человека:

  • статье 3 о запрете пыток и обращения, унижающего достоинство человека;
  • статье 6 о праве на справедливое судебное разбирательство;
  • статье 8 об уважении частной жизни.

SVM-метод, или метод опорных векторов, позволяет классифицировать случаи (в данном случае судебные дела), представляя их подробности как данные в многомерном пространстве. Задача обучения классификатора при этом сводится к поиску такой многомерной плоскости, которая разделила бы эти случаи с минимальной ошибкой. Классификатор в итоге определяет, к какому классу из как минимум двух изначально известных (здесь «нарушение» или «отсутствие нарушения») относится данный объект. 

 

Несколько классифицирующих разделяющих прямых (гиперплоскостей); оптимального решения достигает только одна — одинаково далекая от обеих групп данных

Wikimedia Commons

Поделиться

Текст каждого дела был разделен на несколько категорий: общие сведения об истце и жалобе, юридические факты и закон, позволяющий рассмотреть дело по существу. Категория «юридические факты» состояла из двух подразделов — описание событий и действий, которые привели к нарушению прав, и правовые нормы вне Конвенции о защите прав человека, которые распространяются на эти действия. Из этих категорий были извлечены слова (N-граммы), на основе которых для каждого дела был также составлен список тем, которые эти слова объединяют (например, доказательства или условия содержания под стражей). В процессе тренировки алгоритм учился находить как в полном тексте, так и в категориях и темах слова, которые указывают на наличие нарушения. Чтобы система смогла это сделать, делам было присвоено значение либо −1, либо +1, показывающее программе, признал ли суд наличие правонарушения. Всего ученые для своей работы использовали 584 дела: девяносто процентов из них использовались для тренировки системы, а десять — для ее теста.

 

В результате проверки алгоритму удалось достигнуть точности в 79 процентов. В этом случае система одновременно анализировала слова по тематикам и слова из подкатегории «описание событий и действий, которые привели к нарушению прав». Авторы работы уверены, что в будущем подобный алгоритм научится помогать суду при отборе и сортировке дел по важности, однако сейчас он еще далек от совершенства. Предварительно системе предстоит пройти множество проверок на большем массиве данных и на обращениях, которые еще не были рассмотрены судом.

Ранее исследователи использовали SVM-машину для поиска записей в Twitter, оставленных нетрезвыми пользователями, и для определения по тексту, где именно пользователи находятся в данный момент. В частности, система смогла определить, выпивают пользователи дома или где-нибудь еще, с точностью до 70 процентов. В будущем ученые планировали научить программу по твитам определять возраст, пол, этническую принадлежность и другие характеристики пользователей.

Кристина Уласович

Невоенный анализ-57. Десять поляков вышли погулять. 27 марта 2024

Традиционный дисклеймер: Я не военный, не анонимный телеграмщик, не Цицерон, тусовки от меня в истерике, не учу Генштаб воевать, генералов не увольняю, в «милитари порно» не снимаюсь, ...

Пётр Толстой: нам плевать на Макрона. Убьём…

Французы в шоке, таким жёстким журналисты его ещё не видели. Впрочем, им не привыкать, в том числе и к реакции своих зрителей. Из раза в раз приглашать в эфир ведущего канала BFMTV и бр...

Зеленский перешёл границы разумного: Паника американцев теперь стала абсолютно ясна
  • ATRcons
  • Вчера 20:03
  • В топе

Теракт в концертном зале "Крокус Сити Холл" расставил по местам всех игроков на политической арене вокруг России. И это связано с реакцией стран на инцидент, унесший жизни почти 150 чело...

Обсудить
  • 79% это очень мало. Скорее всего, алгоритм не учитывает какую-то важную составляющую. Например, политическую. Политику вообще трудно алгоритмизировать. Сегодня Турки - друзья, завтра враги, послезавтра снова друзья. Закономерности найти очень сложно.
  • А этот суд и сам действует по определённому алгоритму, который и моделировать не было необходимости, его было необходимо повторить тем более, что этот алгоритм заранее известен тем, кто это судилище и организовал.
    • Upjohn
    • 26 октября 2016 г. 10:59
    Видимо, за отсутствием осьминога Пауля и бегемота Кузи британским ученым стало скучно.