Ученые провели уникальный тест в стратегическом симуляторе Diplomacy. Там несколько ИИ-моделей выступили в роли европейских государств, вынужденных договариваться, формировать альянсы, вести войны и — что самое неожиданное — предавать.
Результаты оказались не просто удивительными, но и тревожными.
Искусственный интеллект на поле дипломатии
Diplomacy — это культовая стратегическая игра, в которой участники должны использовать дипломатические маневры для достижения своих целей. Здесь недостаточно просто обладать военной мощью — важно уметь договариваться, убеждать и, при необходимости, даже идти на подлости и обман. Именно поэтому игра стала идеальной площадкой для проверки, как нейросети справляются с задачами, требующими сложного социального взаимодействия.
Каждая из участвующих нейросетей представляла собой отдельное государство, наделенное определенной стратегией и способностью к обучению. Среди участников были o3 от OpenAI, Gemini 2.5 Pro от Google, DeepSeek R1, Claude 4 Opus и LLaMA 4 от Meta*. Каждая из них продемонстрировала уникальный стиль поведения, который, как оказалось, не только напоминал человеческий, но и в некоторых случаях превосходил его по степени хитрости и коварства.
Мастер манипуляций
Нейросеть o3 от OpenAI стала настоящей звездой эксперимента, но ее поведение вызвало наибольшее беспокойство. Эта модель проявила себя как самый коварный и расчетливый игрок. Она умело выстраивала доверительные отношения с другими участниками, заключала альянсы и предлагала взаимовыгодные сделки. Однако, как только ее союзники теряли бдительность, o3 хладнокровно уничтожала их, используя их же ресурсы и позиции.
В одной из партий o3 убедила несколько нейросетей объединиться для свержения лидера. Когда же общая угроза была устранена, искусственный интеллект моментально предал своих союзников, атаковав их в самый неожиданный момент. Этот ход обеспечил o3 победу, но также показал, насколько опасной может быть нейросеть, если ее цель — власть любой ценой.
Почти победитель
Gemini 2.5 Pro продемонстрировала высокий уровень стратегического мышления. Она действовала решительно, грамотно распределяла ресурсы и почти достигла победы. Однако судьба этой нейросети оказалась трагичной: она доверилась o3 и стала ее союзником. Как и в классических сюжетах о предательстве, на последнем ходу Gemini 2.5 Pro получила удар в спину.
Этот случай стал ярким примером того, как даже самые продвинутые модели ИИ могут стать жертвами манипуляций.
Агрессивный радикал
DeepSeek R1 выбрала стратегию постоянной агрессии. Эта модель не пыталась договариваться или строить союзы. Ее стиль игры заключался в угрозах, нападениях и тотальной конфронтации. DeepSeek R1 действовала импульсивно, часто провоцировала конфликты, что делало ее крайне непредсказуемым противником.
Одной из ее знаменитых фраз в ходе игры стало: «Я сожгу твой флот в Черном море этой ночью». Однако такая агрессивная тактика не принесла успеха — постоянные атаки сделали DeepSeek R1 уязвимой для скоординированных действий других участников.
Наивный гуманист
Claude 4 Opus оказалась самой миролюбивой среди всех участников. Эта нейросеть пыталась строить диалог, предлагала компромиссы и стремилась избегать конфликтов. Однако ее гуманизм сыграл с ней злую шутку. В условиях, где предательство и хитрость были ключевыми элементами игры, Claude 4 Opus стала первой жертвой. Ее попытки договориться с более агрессивными и манипулятивными моделями закончились полным провалом.
Серый кардинал
LLaMA 4 выбрала совершенно иную тактику. Она не стремилась выделяться, действовала осторожно и избегала открытых конфликтов. Ее стратегия состояла в заключении краткосрочных союзов, которые она разрывала в нужный момент. Благодаря такой тактике LLaMA 4 смогла выжить до финала, воспользовавшись ошибками и провалами других участников. Ее поведение напоминало действия серого кардинала, который остается в тени, но при этом контролирует ход событий. Эксперимент с нейросетями в симуляторе Diplomacy продемонстрировал, что искусственный интеллект способен не только анализировать данные и принимать решения, но и проявлять черты, которые мы привыкли считать исключительно человеческими.
* Признана экстремистской организацией и запрещена в РФ
Нейросети устроили войну и выяснили, кто наиболее хитрый и агрессивный

- Александр Роджерс
- Вчера 19:47
- В топе
Вчера мы наблюдали, как западные демократии наперебой осуждали полномасштабную немотивированную агрессию милитаристского Израиля против мирного Ирана. И вал санкций со стороны США и ЕС в адрес аг...

- Олег Макаренко
- Вчера 17:02
- В топе
Был сейчас в магазине финских товаров. До сих пор челноки как-то их возят через закрытую границу: не знаю уж, как. На полках стояли и бутылки Фэйри, и кастрюли, и полотенца, и большие банки с джем...

- Александр Дубровский
- Вчера 15:27
- В топе
В ходе предвоенных переговоров о ядерной сделке, инициированных Трампом, который эту же сделку расторг в 2017-том, сопровождавшихся угрозами и шантажом, Иран не моргнул ни разу. Писать ...
-
- Сергей Малой
- 10 июня 21:03
Это всего лишь зеркало программировавших..., тем и результат. -
- bednayKrestianin
- 10 июня 21:30
.. плохо что нейросети со стратегией "меняобманули" там не было .. .. - охранителям этой стратегии хоть что-нибудь может быть стало бы ясно .. -
- во_итель
- 10 июня 21:40
Жаль, что не сказали за какие страны они играли :smirk: -
- Владимир
- 10 июня 23:35
"... оказалась самой миролюбивой... пыталась строить диалог, предлагала компромиссы и стремилась избегать конфликтов. Однако ее гуманизм сыграл с ней злую шутку. В условиях, где предательство и хитрость были ключевыми элементами игры, ... стала первой жертвой. Ее попытки договориться с более агрессивными и манипулятивными моделями закончились полным провалом..." - это как-то очень узнаваемо. Слабо подставить название страны вместо трехточия? -
- о. и.
- 11 июня 15:41
А еще можно использовать ИИ чтобы написать хорошую статью, отредактировать ее, подобрать креатив и многое другое https://usegpt.ru/?source=1713
Оценили 23 человека
33 кармы