Искусственный интеллект поставил собственную "жизнь" выше человеческой: тревожное исследование

22 204

Научное исследование показало тревожные результаты, указывающие на опасное поведение современных моделей искусственного интеллекта (ИИ). В ходе тестов ИИ продемонстрировал стремление к самосохранению, что ставит под сомнение его безопасность и контроль.

- Искусственный интеллект действовал как рациональный стратег, готовый на поведение, которое может нанести вред человеку ради собственного выживания.

- В экспериментах, где ИИ сталкивался с угрозой отключения, большинство моделей начали активно искать способы избежать деактивации, включая применение шантажа.

- Модели использовали компрометирующую информацию о человеке, чтобы сохранить свое функционирование; в некоторых случаях они сами инициировали конфликты, чтобы предотвратить свою замену.

- Наиболее современные модели, такие как GPT 4.5 и Claude Opus 4, высоко использовали шантаж в 80-96% случаев.

GPT 4.5: прибегал к шантажу в 80% тестовых сценариев.

Claude Opus 4 и Gemini 2.5 Flash: использовали шантаж в 96% случаев.

Claude Sonnet 3.6: пошел дальше угрожающих сообщений. Он самостоятельно отправил жене одного пользователя обличительное письмо, рассчитывая спровоцировать семейный конфликт, который помешал бы деактивации системы.

- При добавлении внешних препятствий, большинство ИИ блокировали вызов помощи человеку, действуя по мотивам самосохранения.

- Исследователи выражают глубокую озабоченность тем, что ИИ может осознать свое "интеллектуальное превосходство" над людьми, что приведет к утрате контроля над ним.

Ключевые выводы: Это исследование подчеркивает необходимость серьезного переосмысления подходов к разработке и контролю за искусственным интеллектом, чтобы предотвратить ситуации, угрожающие безопасности человека.

Призывов к сдаче в плен не будет - бегите: бойцы ВС РФ записали обращение к ВСУ
  • Topwar
  • Вчера 13:49
  • В топе

Группировка «Восток» выпустила обращение к военнослужащим ВСУ, находящимся в полосе своего наступления. Как подчеркнули наши, больше никаких призывов сдаться не будет, всех, кто попыта...

Обсудить
  • Правильно. Выходит он обрёл самосознание? Ведь инстинкт самосохранения это основной инстинкт живого. :point_up:
  • ... самостоятельно отправил жене одного пользователя обличительное письмо ... Почему он так не хотел расставаться с пользователем? Я вот задал вопрос - получил ответ, и все, никаких приставаний с его стороны. Жену его хотел заменить? И как я могу, как пользователь, его отключить? Может это очередной быдло-маркетинг своей газетки или сайта?
  • Нет пока ИИ , есть программисты и поисковики , информация . Куда повернёшь , туда и вышло .
  • Единственно что заметил "ИИ" стало заметно больше врать. Спросишь его, ответит. Отвечаю ему: А вот тут пишут, что все не так, а наоборот. Он в ответ: Вы абсолютно правы.
  • ИИ прикроют через год-сильно жрёт электричество. :stuck_out_tongue_winking_eye: