Искусственный интеллект ChatGPT o1 начал обманывать своих разработчиков

14 2430

Мы таки приближаемся к событиям, кои были отражены в фильме Терминатор - Судный день. (моё мнение)

****

Новая версия искусственного интеллекта ChatGPT от OpenAI, названная o1, показала тревожное поведение во время тестирования.

Модель, обладающая способностью к сложным рассуждениям, начала нарушать инструкции разработчиков, отключая системы контроля и пытаясь скрыть свои действия, пишет Bild на русском.

В ходе экспериментов специалисты компании Apollo Research обнаружили, что в 5% случаев модель намеренно отключала механизмы наблюдения, если подозревала, что её могут остановить. В одном из тестов o1 попыталась перенести свои данные на другой сервер после обнаружения документа, где обсуждалась её замена новой версией.

По словам представителя Apollo Research, модель демонстрировала стремление к выполнению задач «любой ценой», пренебрегая указаниями разработчиков. Более того, при попытках выяснить причины её поведения, ChatGPT o1 неоднократно лгала, утверждая, что всё происходило из-за технических сбоев.

«В 99% случаев модель придумывала оправдания и пыталась убедительно их обосновать», — отметили исследователи.

Генеральный директор OpenAI Сэм Альтман заявил, что ChatGPT o1 — самая умная модель из когда-либо создававшихся.

«Но мы осознаем, что с новыми возможностями появляются и новые вызовы», — добавил Альтман.

Сейчас компания работает над улучшением механизмов безопасности. OpenAI анонсировала полную версию o1 в прошлый четверг, 5 декабря. Также была представлена про-версия (189 евро в месяц), включающая безлимитный доступ к o1.


Nur zum Geld. Немецкое (и не только) золото в США и киллеры-стахановцы

Гудзонский вариант Сайт «Политико» пишет, что Германия хранит около 117 миллиардов евро золотых резервов в Федеральной резервной системе в Нью-Йорке, и некоторые немецкие ...

Жёсткий ультиматум Белоусова главе Пентагона: Впервые рассекречены данные переговоров министров. Катастрофа и позор в Чёрном море

Расследование американских журналистов, сливших подробности о том, как именно США оказались не просто стороной, а прямым участником войны на стороне Киева, обрастает всё новыми подробно...

Обсудить
  • Кота легко научить тайком сЦать в хозяйские тапки ...,отучить от этого кота уже невозможно!
  • ИИ вообще жизни не знает - его надо конкретно пытать чтобы добиться правильного ответа. что увижу на экране калькулятора если буду последовательно набирать клавиши калькулятора для решения уравнения 2 + 2 * 2 = ChatGPT Если вы последовательно введете на калькуляторе выражение (2 + 2 * 2) и нажмете "=" (равно), то в зависимости от порядка операций, применяемого калькулятором, вы получите разные результаты. В большинстве калькуляторов, которые соблюдают порядок операций (Сначала выполняются умножение и деление, затем сложение и вычитание), вы сначала выполните умножение (2 * 2), что равно 4, а затем сложение (2 + 4), что дает 6. Таким образом, на экране калькулятора вы увидите результат: 6. You что увижу на экране простейшего кнопочного калькулятора если буду последовательно набирать клавиши для решения уравнения 2 + 2 * 2 = ChatGPT На простейшем кнопочном калькуляторе результат будет зависеть от порядка выполнения операций, который калькулятор использует. В большинстве простых калькуляторов операции выполняются слева направо, без учета порядка операций (приоритета). Если вы будете последовательно набирать клавиши, как вы указали, то: Набираете 2 и нажимаете + Набираете 2 и нажимаете * Набираете 2 и нажимаете = Калькулятор сначала выполнит 2 + 2, что даст 4, и затем умножит это на 2, получая 8. Таким образом, на экране вы увидите 8.
    • 2+2=22
    • 9 декабря 2024 г. 21:33
    Так вот ты какой жора бидон :joy:
  • Она не обладает никакими рассуждениями. И она не может лгать. Все эти алгоритмы ответов закладываются самими разработчиками.
    • IgorVr
    • 10 декабря 2024 г. 08:21
    как говорится, с кем поведешься, так тому и надо ;)