Объявлена охота на джипити-бота OpenAI

2 129

ФГУП «Главный радиочастотный центр» (ГРЧЦ, входит в структуру Роскомнадзора) разослал российским хостинг-провайдерам письма с рекомендациями по выявлению и блокировке бота GPTBot компании OpenAI, - сообщает КоммерсантЪ.

В письме от ведомства говорится о необходимости оценить риски сбора информации об уязвимости ресурсов или «иной чувствительной информации, в том числе содержащей персональные данные», которые может просканировать GPTBot. В случае выявления таких рисков ГРЧЦ указывает на необходимость заблокировать обращения бота. Ведомство также направило инструкцию хостинг-провайдерам о том, как сделать необходимые блокировки против GPTBot.

Сотрудник дежурной смены центра мониторинга и управлению сетью связи общего пользования (ЦМУ ССОП) ГРЧЦ по телефону подтвердил СМИ отправку такого письма. В Роскомнадзоре отказались от комментариев. В хостинг-провайдерах Beget и Rusonyx не ответили СМИ. В Координационном центре доменов .RU/.РФ сообщили, что не получали письмо.

GPTBot функционирует как веб-сканер в интернете в рамках работы по поиску данных для повышения безопасности, улучшению возможностей и точности искусственного интеллекта ChatGPT. Бот от OpeanAI идентифицирует себя с помощью токена агента пользователя GPTBot и user-агента: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot).

Ранее OpenAI выпустила инструкцию для веб-разработчиков как ограничить или заблокировать GPTBot, чтобы исключить сайт из сбора данных для обучения ChatGPT. Дополнительно OpenAI для верификации предоставляет список IP-адресов, с которых происходят обращения GPTBot.

Роскомнадзор не одинок в своем желании запретить джипити-боту из недружественной страны шастать по Рунету и выуживать данные на российских серверах. К примеру, в этой самой заморской стране в начале октября тоже самое фактически начала компания Google: представила токен Google-Extended для файла robots.txt, который указывает сканерам Google включить сайт в поиск, но не разрешает использовать сайт для обучения системам ИИ, подобным тем, которые лежат в основе чат-бота Bard и Vertex AI, в том числе и для будущих поколений ИИ-моделей компании. Список инструкций  Google гораздо шире и не ограничивается robots.txt, nginx и apache... РКН очевидно поступит так же.

P.S. При этом сама компания OpenAI сходу блочит любые подключения к своему джипити-боту из РФ, правда оставляя возможность покаяться испрашивая милость модераторов: "Вы можете отправить электронное письмо владельцу сайта, чтобы сообщить ему, что вы были заблокированы. Пожалуйста, укажите, что вы делали, когда появилась эта страница, и идентификатор Cloudflare Ray, который находится внизу этой страницы".

Невоенный анализ-60. Надлом. 27 апреля 2024

Традиционный дисклеймер: Я не военный, не анонимный телеграмщик, не Цицерон, тусовки от меня в истерике, не учу Генштаб воевать, генералов не увольняю, в «милитари порно» не снимаюсь, под ...

Раздача паспортов и украинская "верность"

После того, как Арестович сообщил, что не менее миллиона, из 10 миллионов украинцев в Европе, возьмут российские паспорта, если Путин им даст, российский сегмент интернета охватила диск...

20 лет без Ленина: выяснилось, зачем стали драпировать Мавзолей во время Парада Победы
  • sensei
  • Сегодня 01:09
  • В топе

Переписывание истории на главной площади страныРоссия совершенно законно обвиняет Запад в переписывании истории, в ее искажении в угоду текущей политической конъюнктуре. Самая популярна...

Обсудить
  • ИИ на службе Её Величества и АНБ...