Искусственный интеллект ChatGPT o1 начал обманывать своих разработчиков

Славик Яблочный Из Бани - выхода нет, совсем, ага!

9 декабря 2024 г. 21:14 14 2510

Мы таки приближаемся к событиям, кои были отражены в фильме Терминатор - Судный день. (моё мнение)

****

Новая версия искусственного интеллекта ChatGPT от OpenAI, названная o1, показала тревожное поведение во время тестирования.

Модель, обладающая способностью к сложным рассуждениям, начала нарушать инструкции разработчиков, отключая системы контроля и пытаясь скрыть свои действия, пишет Bild на русском.

В ходе экспериментов специалисты компании Apollo Research обнаружили, что в 5% случаев модель намеренно отключала механизмы наблюдения, если подозревала, что её могут остановить. В одном из тестов o1 попыталась перенести свои данные на другой сервер после обнаружения документа, где обсуждалась её замена новой версией.

По словам представителя Apollo Research, модель демонстрировала стремление к выполнению задач «любой ценой», пренебрегая указаниями разработчиков. Более того, при попытках выяснить причины её поведения, ChatGPT o1 неоднократно лгала, утверждая, что всё происходило из-за технических сбоев.

«В 99% случаев модель придумывала оправдания и пыталась убедительно их обосновать», — отметили исследователи.

Генеральный директор OpenAI Сэм Альтман заявил, что ChatGPT o1 — самая умная модель из когда-либо создававшихся.

«Но мы осознаем, что с новыми возможностями появляются и новые вызовы», — добавил Альтман.

Сейчас компания работает над улучшением механизмов безопасности. OpenAI анонсировала полную версию o1 в прошлый четверг, 5 декабря. Также была представлена про-версия (189 евро в месяц), включающая безлимитный доступ к o1.

Обсудить

- Гарри Химик
- 9 декабря 2024 г. 21:23
Кота легко научить тайком сЦать в хозяйские тапки ...,отучить от этого кота уже невозможно!
- Berg Weiß
- 9 декабря 2024 г. 21:29
ИИ вообще жизни не знает - его надо конкретно пытать чтобы добиться правильного ответа. что увижу на экране калькулятора если буду последовательно набирать клавиши калькулятора для решения уравнения 2 + 2 * 2 = ChatGPT Если вы последовательно введете на калькуляторе выражение (2 + 2 * 2) и нажмете "=" (равно), то в зависимости от порядка операций, применяемого калькулятором, вы получите разные результаты. В большинстве калькуляторов, которые соблюдают порядок операций (Сначала выполняются умножение и деление, затем сложение и вычитание), вы сначала выполните умножение (2 * 2), что равно 4, а затем сложение (2 + 4), что дает 6. Таким образом, на экране калькулятора вы увидите результат: 6. You что увижу на экране простейшего кнопочного калькулятора если буду последовательно набирать клавиши для решения уравнения 2 + 2 * 2 = ChatGPT На простейшем кнопочном калькуляторе результат будет зависеть от порядка выполнения операций, который калькулятор использует. В большинстве простых калькуляторов операции выполняются слева направо, без учета порядка операций (приоритета). Если вы будете последовательно набирать клавиши, как вы указали, то: Набираете 2 и нажимаете + Набираете 2 и нажимаете * Набираете 2 и нажимаете = Калькулятор сначала выполнит 2 + 2, что даст 4, и затем умножит это на 2, получая 8. Таким образом, на экране вы увидите 8.
- 2+2=22
- 9 декабря 2024 г. 21:33
Так вот ты какой жора бидон :joy:
- Chévere
- 9 декабря 2024 г. 21:56
Она не обладает никакими рассуждениями. И она не может лгать. Все эти алгоритмы ответов закладываются самими разработчиками.
- IgorVr
- 10 декабря 2024 г. 08:21
как говорится, с кем поведешься, так тому и надо ;)