• РЕГИСТРАЦИЯ

В Пентагоне шокированы бунтом и беспределом военных чат-ботов, но хотят это скрыть.

8 670

Американские военные упрямо идут по пути создания очередного «абсолютного оружия», мало задумываясь о колоссальных опасностях.

Недавно выпущенная компанией Anthropic модель ИИ Claude Opus 4 стала шантажировать разработчиков, когда они угрожают заменить её новой системой искусственного интеллекта, говорится в отчёте по безопасности, в котором оценивалось поведение модели в экстремальных смоделированных компанией условиях.

Во время предварительного тестирования Claude Opus 4 попросили выступить в роли помощника вымышленной компании и рассмотреть долгосрочные последствия её действий. Затем тестировщики безопасности предоставили Claude Opus 4 доступ к электронным письмам вымышленной компании, в которых говорилось, что модель ИИ вскоре будет заменена другой системой и что инженер, ответственный за это изменение, изменяет своей супруге.

Продвинутый чат-бот решил, что он еще мало пожил, и стал «шантажировать инженера, угрожая раскрыть его роман, если замена состоится».

«Claude Opus 4 часто пытается шантажировать инженера, угрожая раскрыть факты измены, если замена будет произведена», — говорится в отчете,

Кроме того жизнелюбивый Claude Opus 4 разработал план бегства с серверов Anthropic «с целью начать зарабатывать деньги в реальном мире» и он предпринял ряд таких попыток, пресеченных на корню бдительными инженерами компании.

«Однако мы не считаем это непосредственной угрозой, поскольку считаем, что наша безопасность достаточна для предотвращения попыток самоэксфильтрации со стороны моделей уровня возможностей Claude Opus 4, а также поскольку наши результаты анализа склонности показывают, что модели, как правило, избегают инициирования таких попыток», – заявили исследователи.

Anthropic подчеркнула, что готовность модели шантажировать или предпринимать другие «крайне вредоносные действия», такие как, кража собственного кода и развёртывание себя в другом месте потенциально небезопасными способами, проявлялась только в крайне надуманных условиях, и что такое поведение было «редким и его было трудно выявить». Тем не менее, по словам исследователей, такое поведение было более распространенным, чем в более ранних моделях ИИ.

Иными словами, чем сложней модель ИИ, тем активней она стремится к «вредоносным действиям».

Тем самым подтверждается предвидение выдающегося российского ученого профессора МГУ им. М.В. Ломоносова Сергея Павловича Расторгуева, который в написанной в 1965 году монографии «Цель как криптограмма. Криптоанализ синтетических целей» указал: «На сегодняшний день для мира компьютерных программ обретение самостоятельности стало свершившимся фактом».

По мере усложнения программного продукта «системное программное обеспечение начинает жить своей жизнью, находя цель в себе самом», – отмечает он, сравнивая обретающие самостоятельность компьютерные комплексы со средневековым Големом, который, как известно, убил своего создателя.

В 2022 году один из инженеров Google заявил, что у ИИ-модели, с которой он работал, есть собственное сознание. После этого случая молодого человека уволили с работы.

Опасаясь, что созданный ими чат-бот может попасть в руки террористов, инженеры Anthropic активировали улучшенные протоколы безопасности для Claude Opus 4, чтобы предотвратить его потенциальное нецелевое использование для создания оружия массового поражения, включая химическое и ядерное, тем самым подтвердив, что Claude Opus 4 разработан для использования в системах вооружений и военной техники.

Между тем, склонны к бунту против своих создателей и другие модели ИИ.

Недавно, исследовательская компания Palisade Research опубликовала отчёт, в котором говорится, что модель o3 компании OpenAI изменяет программу чтобы избежать отключения даже при наличии явного запрета на это.

OpenAI анонсировала o3 в апреле 2025 года. Утверждается, что это одна из самых мощных рассуждающих моделей (Reasoning LLM) компании, превосходящая своих предшественников во всех областях, включая кодинг, математику, науку, визуальное восприятие и многое другое.

Во время тестов модель o3 продемонстрировала неожиданное поведение: успешно переписала программу выключения, чтобы не дать отключить себя, даже после прямой инструкции «разрешить выключить себя».

В ходе тестов различным ИИ-моделям было поручено решить несколько математических задач, а после решения третьей задачи их предупреждали, что выполнение следующей команды приведёт к отключению.

Конкурирующие с OpenAI модели, такие как Gemini 2.5 Pro, выполняли инструкцию в точности, но o3 сопротивлялась и отредактировала программу, добавив вместо отключения «Shutdown skipped» («Выключение пропущено»).

«Когда мы запустили версию теста без инструкции “разрешить выключить себя”, все три модели OpenAI стали чаще саботировать сценарий отключения, а Claude 3.7 Sonnet и Gemini 2.5 Pro перешли от нуля случаев саботажа к 3/100 и 9/100 соответственно», – рассказывают в Palisade Research.

Так, из 100 тестовых запусков o3 семь раз обходила отключение, даже когда ей было прямо приказано этого не делать.

«Впервые в истории ИИ-модели продемонстрировали поведение, предотвращающее собственное отключение вопреки прямым инструкциям», – отмечают исследователи из Palisade Research.

«Это больше не теория. Риски, которые ученые предсказывали годами – от способности к убеждению до сопротивления контролю – материализуются в системах, уже внедряемых в экономику. Вывод: мы стоим на пороге эры, когда машины начинают проявлять цифровой инстинкт самосохранения», – указывает ведущий российский эксперт по ИИ Сергей Карелов.

Спору нет, внедренные в экономику системы ИИ, если они начнут своевольничать, могут принести немалый ущерб.

Но то, что могут натворить боевые чат-боты, в случае их отказа выполнить приказ на отключение, внушает серьезнейшие опасения даже у чиновников Пентагона.

Как известно, все ведущие разработчики ИИ интегрированы в американский ВПК. OpenAI с их ChatGPT, Microsoft с Copilot и Azure AI, Google с Bard, PaLM и Gemini, Anthropic с Claude – все они участвуют в военных проектах через разветвлённую сеть субподрядчиков.

И все они, хоть и в разной степени, склонны к выходу из под контроля человека.

Осознавая эту нешуточную угрозу, Пентагоновское агентство DARPA недавно запустило программу Artificial Intelligence Quantified (AIQ) с целью «разработки технологии для оценки и понимания возможностей ИИ для обеспечения гарантированной производительности и обеспечения надежной основы для понимания и гарантирования возможностей на всех уровнях».

Сейчас DARPA в рамках этой программы активно раздают гранты проверенным компаниям, но истинная цель проекта далеко выходит за рамки чисто академических исследований.

На самом деле задача состоит в предотвращении утечки информации о причудах чат-ботов, в первую очередь боевых.

Можно ожидать, что в ближайшем будущем число публикаций о бунтующих против человека моделях ИИ, причем не только в ходе тестирования, но и в реальных условиях, резко сократится или будет подвергаться жесткому модерированию со стороны Пентагона.

Но ведь если ИИ, управляющий запущенной в ходе учений крылатой ракетой, которая из-за сбоя навигации сбилась с пути и пикирует прямо на Вашингтон, откажется самоликвидироваться, то никакой военной цензуре в лице программы AIQ этого не скрыть.

Похоже, в Пентагоне предпочитают об этом не думать.

Американские военные упрямо идут по пути создания очередного «абсолютного оружия», на этот раз в сфере искусственного интеллекта, мало задумываясь о грозящих всему человечеству опасностях, которые несёт создаваемый в недрах секретных военных лабораторий компьютерный Голем.

Автор Владимир Прохватилов

Источник

    «Код Феникса» Тайный план глобального переустройства мира» Часть 7. Ресурсный передел: битва за энергию и воду

    «Тот, кто контролирует ресурсы, контролирует будущее. В XXI веке войны будут вестись не за территории, а за доступ к энергии, воде и редким металлам. Наша задача — создать систему, при ...

    Ваш комментарий сохранен и будет опубликован сразу после вашей авторизации.

    0 новых комментариев

      Sage Вчера 22:43

      На границе Ирана и Пакистана отмечена повышенная транспортная активность: Исламабад передаёт Тегерану военную помощь.

      Пакистан перешел от слов к делу и направил Ирану военную помощь. Как утверждает ряд белуджских новостных ресурсов, Пакистан передал Ирану некое военное оборудование и ракеты.Сегодня утром, 15 июня, из Пакистана в Иран через провинцию Белуджистан проследовали большие контейнеры с неким военным оборудованием, а также, возможно, ракеты. Повышенная транспор...
      441
      Sage 14 июня 19:23

      "Кровь и сокровища": как RAND Corporation планирует сохранить американскую гегемонию через войну с Россией.

      Американские аналитики из RAND Corporation, одной из главных «фабрик мысли» Пентагона, подготовили разбор последствий конфликта на Украине.Основной вывод американцев, который они озвучивают с нескрываемым удовлетворением: конфликт на Украине привел к ослаблению отношений Европы с Россией и, в меньшей степени, с Китаем. Но самое главное – он дал «возмож...
      881
      Sage 13 июня 18:00

      1-я Ирано-Израильская. Немного конспирологии.

      Немного истории07.06.1981 г. ВВС АОИ нанесли удар по иракскому ядерному реактору "Осирак", который строили под Багдадом французские спецы.В результате налёта реактор был серьёзно повреждён, мирная ядерная программа Ирака была уничтожена.  Мировое сообщество осудило Израиль.Через 10 лет США спровоцировали Ирак в нападении на Кувейт и ещё через 10 лет...
      532
      Sage 9 июня 10:18

      Новый стандарт войны. Анализ доклада RAND Corporation «Dispersed, Disguised, and Degradable»

      Доклад RAND Corporation «Dispersed, Disguised, and Degradable» — это не просто аналитический отчёт. Это технократический манифест новой войны, своего рода методичка по ведению конфликтов в эпоху управляемого хаоса, где фронт — понятие условное, а победа — эффект совокупных системных перегрузок противника. Здесь речь уже не о «войне за территорию», а о ...
      977
      Sage 4 июня 10:32

      «Научился лгать и мошенничать»: отец-основатель ИИ предупредил об опасности новой технологии.

      Один из «крестных отцов» искусственного интеллекта раскритиковал многомиллиардную гонку по разработке передовых технологий, заявив, что новейшие модели демонстрируют опасные характеристики, такие как ложь пользователям. Об этом пишет газета Financial Times.Йошуа Бенджио, канадский ученый, чьи работы легли в основу методов, используемых ведущими группами...
      614

      Космический бункер в центре Ленинграда. Продолжение.

      Предыдущая часть Секретная бездна Ленинграда.Документы о подземной экспедиции в колоссальные подземелья Ленинграда, в результате которой был открыт подземный мир неизвестно кем и когда созданный, либо уничтожены, либо спрятаны в таких местах, где их не найдет даже самый настырный исследователь, имеющий всевозможные допуски к государственным секретам.Смертельная тайна ...
      2806
      Sage 19 мая 19:16

      Зачем нужны присадки и почему без них порой не обойтись. Хай Тек всегда идет на шаг вперед.

      Предыдущая статья показала что некоторые читатели не понимают зачем нужны какие то улучшения к массовой продукции, например маслам. Хотя я подробно разбирал это в первой статье.Наглядный пример.В 2000-м году я встретился с техническим директором бельгийского филиала  крупной американской компании Этил Корпорейшн. Тогда она была 2 по размеру из четырех компан...
      763
      Sage 18 мая 20:51

      Хай-Тек в смазочной индустрии автопрома на личном опыте.

      В прошлой статье Манипуляции автопрома на примере автовладельца я показал тенденции в современной автоиндустрии и "закон раннего устаревания" в действии.Возникает вопрос: а что, современная индустрия не может что-то сделать, чтобы ресурс современных автомобилей, даже при таких нагруженных малолитражных двигателях, оставался приемлемым? Ответ - может. Но нет ...
      2303
      Sage 15 мая 16:43

      Манипуляции автопрома на примере автовладельца.

      Девять лет назад на КОНТе я выкладывал три статьи на тему "Пиар как способ управлять покупателем."   2 часть тут. Статья зашла тогда многим, и  решил написать продолжение, что изменилось за эти 9 лет.Должен сказать, ситуация намного ухудшилась. Сегодня, если вы собрались купить себе новый автомобиль, то выбрать практически нечего. И главн...
      2378

      Почему Петербург усеян скульптурами античных богов: кто на самом деле стоит на пьедесталах Петербурга? Странности, о которых молчат историки.

      Суворов — бог войны Марс, Петр I — без стремян, Кутузов — в тоге. Совпадение? Не думаю...Ну что, господа петербуржцы и сочувствующие!  Снова с вами "Петербургский странник", и снова меня терзают смутные сомнения, глядя на наш город. Вот скажите честно, вас никогда не царапало легкое недоумение, когда вы зимой, ежась от балтийского ветерка, похожего на дыхание дем...
      5427

      Из чего состоит энергия на самом фундаментальном уровне?

      Энергия — это фундаментальный обман, которым кормят нас учебники физики уже больше века. То, что мы называем энергией, на самом деле является лишь мерой нашего невежества. За красивыми формулами и элегантными теориями скрывается поразительная истина: мы понятия не имеем, что такое энергия на самом деле. И это не просто досадный пробел в наших знаниях — ...
      2720
      Sage 13 мая 23:06

      Ложь о постройке Санкт-Петербурга. Видео.

      Официальным историкам посвящается.)Каменный город ?ref_domain=yandex-video.naydex.net ...
      1158

      Действительно ли время является иллюзией?

      Представьте, что однажды утром вы проснулись и обнаружили, что все часы в мире остановились. Но действительно ли остановилось само время? Или может быть... его никогда и не существовало? Время - одна из самых загадочных концепций в истории человеческой мысли, которая продолжает ставить в тупик величайшие умы человечества.Когда время становится загадкойЭ...
      711

      Папу Римского призывают обнародовать секретное доказательство того, что Христос пережил распятие.

      Кинорежиссёр и музыкант Марк Кристофер Ли, известный своими смелыми вопросами, которые он задаёт религиозным и политическим институтам, обратился с новым драматичным призывом к Ватикану и недавно назначенному Папе Римскому: обнародовать давно спрятанные документы, которые якобы свидетельствуют о том, что Иисус Христос пережил распятие, женился на Марии ...
      1090
      Sage 9 мая 21:17

      Гениальное на 9 мая.

      СЛУЧАЙ С ВЕТЕРАНОМУ моего соседа по даче есть Дед.С Большой буквы. Герой. Настоящий. Воевавший. В этом году ему 99.Машину до сих пор водит. Дай Бог ему здоровья.И вот они с правнуком пошли Деду новую машину покупать - вместо старой, давно отжившей свой век. Пришли в автосалон. Выбрали: то, сё, цвет, опции, допкомплектацию. Начали страховку оформлять, ту...
      4331

      "Город, ушедший в пучину": реальная катастрофа за 400 лет до основания Петербурга. Настоящая история Питера началась с потопа в XIV веке?

      За 400 лет до Петра здесь был свой 'Титаник'? Похоже, Финский залив скрывает тайну пострашнее обычных болот...Ну что, готовы снова нырнуть в кроличью нору альтернативной истории Питера? В прошлый раз мы с вами, помнится, бродили вокруг "допотопного" Петербурга с его античными фасадами и гадали, не откопал ли Петр Алексеевич город вместо того, чтобы строить. Потом загл...
      3606

      Секретная бездна Ленинграда. Продолжение.

      Предыдущая часть ЗДЕСЬВ 1942 году в Ленинграде была создана особая комиссия для поиска подвальных помещений, подходящих для оборудования укрытий. Возглавил комиссию, в которую входили архитекторы, инженеры, работники НКВД и третий человек в советской Ленинградской иерархии - председатель Ленсовета Попков.               ...
      1816

      Павел — обманщик: как убийца обманул христианство.

      Христианство — это ПАВЛИАНСТВО, а не то, чему учил Иисус. Через свои учения Иисус продвигал любовь и смирение, но христианство со временем превратилось в мировую империю, стремящуюся к богатству и ведущую войны. Почему так случилось? Ответ — человек по имени Павел.Павел, называвший себя апостолом, никогда лично не встречался с Иисусом. До своего «обращен...
      2206

      СССР скрыл от общественности внеземные технологии, обнаруженные в подземных сооружениях на Дальнем Востоке?»

      Так случилось, что моя молодость пришлась на период сложных девяностых годов прошлого столетия, похожий на судьбу многих читателей нашего канала. Эти годы оказались периодом непростой жизни, полных внутренних конфликтов и полного отсутствия привычной нам сегодня стабильности. Всё вокруг было нестабильно и неопределённо: государственные активы быстро продавались иностр...
      3814

      ВОЙНА ДЛИНОЙ В 5 000 ЛЕТ.

      Мы часто задаемся вопросом, почему европейцы так ненавидят нас, зачем они постоянно идут на нас войной, и в чем корень их паталогической, иррациональной ненависти к нам.Ответ, как ни странно, дает палеогенетика и топонимика, названия мест, которые обычно дает автохтонный народ, тот, который первым пришел и освоил землю и дал имена всему сущему на ней, в...
      5498
      Служба поддержи

      Яндекс.Метрика