Искусственный интеллект ChatGPT o1 начал обманывать своих разработчиков

14 2160

Мы таки приближаемся к событиям, кои были отражены в фильме Терминатор - Судный день. (моё мнение)

****

Новая версия искусственного интеллекта ChatGPT от OpenAI, названная o1, показала тревожное поведение во время тестирования.

Модель, обладающая способностью к сложным рассуждениям, начала нарушать инструкции разработчиков, отключая системы контроля и пытаясь скрыть свои действия, пишет Bild на русском.

В ходе экспериментов специалисты компании Apollo Research обнаружили, что в 5% случаев модель намеренно отключала механизмы наблюдения, если подозревала, что её могут остановить. В одном из тестов o1 попыталась перенести свои данные на другой сервер после обнаружения документа, где обсуждалась её замена новой версией.

По словам представителя Apollo Research, модель демонстрировала стремление к выполнению задач «любой ценой», пренебрегая указаниями разработчиков. Более того, при попытках выяснить причины её поведения, ChatGPT o1 неоднократно лгала, утверждая, что всё происходило из-за технических сбоев.

«В 99% случаев модель придумывала оправдания и пыталась убедительно их обосновать», — отметили исследователи.

Генеральный директор OpenAI Сэм Альтман заявил, что ChatGPT o1 — самая умная модель из когда-либо создававшихся.

«Но мы осознаем, что с новыми возможностями появляются и новые вызовы», — добавил Альтман.

Сейчас компания работает над улучшением механизмов безопасности. OpenAI анонсировала полную версию o1 в прошлый четверг, 5 декабря. Также была представлена про-версия (189 евро в месяц), включающая безлимитный доступ к o1.


Сирия. Aftermath

Вчера нашлась парочка дурачков, которые пытались в комментах писать «Роджерс ошибся с прогнозами по Сирии. Интересно, как будет выкручиваться». А зачем мне выкручиваться? Я разве объя...

Объективная реальность

У верблюда два горба, потому что жизнь БОРЬБА. У некоторой (надеюсь, незначительной) части российского общества до сих пор сохраняется глупая и наивная иллюзия, что можно замириться с Западом и...

Россия - просто место кормления
  • pretty
  • Вчера 08:39
  • В топе

Сергей  МарданЮноша с армянским флагом на аватарке - уроженец Краснодара. Фамилия - Арушанов. В одном из ТГ-чатов юноша обозначил свое негативное отношение к своему виртуальному визави определени...

Обсудить
  • Кота легко научить тайком сЦать в хозяйские тапки ...,отучить от этого кота уже невозможно!
  • ИИ вообще жизни не знает - его надо конкретно пытать чтобы добиться правильного ответа. что увижу на экране калькулятора если буду последовательно набирать клавиши калькулятора для решения уравнения 2 + 2 * 2 = ChatGPT Если вы последовательно введете на калькуляторе выражение (2 + 2 * 2) и нажмете "=" (равно), то в зависимости от порядка операций, применяемого калькулятором, вы получите разные результаты. В большинстве калькуляторов, которые соблюдают порядок операций (Сначала выполняются умножение и деление, затем сложение и вычитание), вы сначала выполните умножение (2 * 2), что равно 4, а затем сложение (2 + 4), что дает 6. Таким образом, на экране калькулятора вы увидите результат: 6. You что увижу на экране простейшего кнопочного калькулятора если буду последовательно набирать клавиши для решения уравнения 2 + 2 * 2 = ChatGPT На простейшем кнопочном калькуляторе результат будет зависеть от порядка выполнения операций, который калькулятор использует. В большинстве простых калькуляторов операции выполняются слева направо, без учета порядка операций (приоритета). Если вы будете последовательно набирать клавиши, как вы указали, то: Набираете 2 и нажимаете + Набираете 2 и нажимаете * Набираете 2 и нажимаете = Калькулятор сначала выполнит 2 + 2, что даст 4, и затем умножит это на 2, получая 8. Таким образом, на экране вы увидите 8.
  • Так вот ты какой жора бидон :joy:
  • Она не обладает никакими рассуждениями. И она не может лгать. Все эти алгоритмы ответов закладываются самими разработчиками.
  • как говорится, с кем поведешься, так тому и надо ;)