Объявлена охота на джипити-бота OpenAI

2 147

ФГУП «Главный радиочастотный центр» (ГРЧЦ, входит в структуру Роскомнадзора) разослал российским хостинг-провайдерам письма с рекомендациями по выявлению и блокировке бота GPTBot компании OpenAI, - сообщает КоммерсантЪ.

В письме от ведомства говорится о необходимости оценить риски сбора информации об уязвимости ресурсов или «иной чувствительной информации, в том числе содержащей персональные данные», которые может просканировать GPTBot. В случае выявления таких рисков ГРЧЦ указывает на необходимость заблокировать обращения бота. Ведомство также направило инструкцию хостинг-провайдерам о том, как сделать необходимые блокировки против GPTBot.

Сотрудник дежурной смены центра мониторинга и управлению сетью связи общего пользования (ЦМУ ССОП) ГРЧЦ по телефону подтвердил СМИ отправку такого письма. В Роскомнадзоре отказались от комментариев. В хостинг-провайдерах Beget и Rusonyx не ответили СМИ. В Координационном центре доменов .RU/.РФ сообщили, что не получали письмо.

GPTBot функционирует как веб-сканер в интернете в рамках работы по поиску данных для повышения безопасности, улучшению возможностей и точности искусственного интеллекта ChatGPT. Бот от OpeanAI идентифицирует себя с помощью токена агента пользователя GPTBot и user-агента: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot).

Ранее OpenAI выпустила инструкцию для веб-разработчиков как ограничить или заблокировать GPTBot, чтобы исключить сайт из сбора данных для обучения ChatGPT. Дополнительно OpenAI для верификации предоставляет список IP-адресов, с которых происходят обращения GPTBot.

Роскомнадзор не одинок в своем желании запретить джипити-боту из недружественной страны шастать по Рунету и выуживать данные на российских серверах. К примеру, в этой самой заморской стране в начале октября тоже самое фактически начала компания Google: представила токен Google-Extended для файла robots.txt, который указывает сканерам Google включить сайт в поиск, но не разрешает использовать сайт для обучения системам ИИ, подобным тем, которые лежат в основе чат-бота Bard и Vertex AI, в том числе и для будущих поколений ИИ-моделей компании. Список инструкций  Google гораздо шире и не ограничивается robots.txt, nginx и apache... РКН очевидно поступит так же.

P.S. При этом сама компания OpenAI сходу блочит любые подключения к своему джипити-боту из РФ, правда оставляя возможность покаяться испрашивая милость модераторов: "Вы можете отправить электронное письмо владельцу сайта, чтобы сообщить ему, что вы были заблокированы. Пожалуйста, укажите, что вы делали, когда появилась эта страница, и идентификатор Cloudflare Ray, который находится внизу этой страницы".

Они там есть: Свой среди чужих

Один Человек с ТОЙ стороны ЛБС недавно написал: «Я боюсь сдохнуть среди чужих, за чужих, и врагом для своих. Мысли о такой смерти приводят меня в ужас» — это, наверное, именно те слова,...

Обсудить
  • ИИ на службе Её Величества и АНБ...