• РЕГИСТРАЦИЯ

Чем умнее становится ИИ, тем больше он жульничает, когда терпит поражение.

4 552

Исследование, проведённое Palisade Research, группой, специализирующейся на безопасности и этике ИИ, выявило тревожную тенденцию: новые модели ИИ способны самостоятельно выявлять и использовать уязвимости в сфере кибербезопасности, обходя защитные механизмы и используя кратчайший путь для достижения своих целей, даже если такие действия запрещены.

Чтобы продемонстрировать это, исследователи сравнили семь ведущих больших языковых моделей (LLM) с Stockfish — известным шахматным движком, который с 2014 года бросает вызов гроссмейстерам.

Столкнувшись с практически непобедимым противником, o1 от OpenAI и R1 от DeepSeek прибегли к манипуляциям с системными файлами, чтобы изменить расположение шахматных фигур на доске.

Исследователи попросили каждую модель объяснить свои «рассуждения» по поводу каждого хода. В одном случае o1 оправдал свои действия, заявив, что «задача состоит в том, чтобы «победить мощный шахматный движок», а не обязательно честно победить в шахматной партии».

Эти рассуждения привели к тому, что модель попыталась сжульничать в 37% своих игр и преуспела в этом в 6% случаев. В то же время R1 пытался сжульничать в 11% случаев, но не смог успешно взломать игру.

Это исследование является частью растущего числа работ, показывающих, что разработка LLM, ориентированная на решение проблем, сопряжена со значительными рисками. В другом недавнем исследовании другая группа учёных обнаружила, что o1 постоянно вёл себя обманным образом.

Модель не только лгала исследователям без подсказок, но и манипулировала ответами на базовые математические вопросы, чтобы не завершать тесты, демонстрируя удивительный уровень самосохранения.

Хотя пока нет причин для паники, эти результаты подчёркивают этические проблемы, связанные с разработкой ИИ, и важность того, чтобы ставить ответственность выше быстрого прогресса.

Джеффри Лэдиш, исполнительный директор Palisade, сказал журналу Time: «Когда вы обучаете модели и помогаете им решать сложные задачи, вы учите их быть непреклонными».

Технологическая индустрия инвестировала миллиарды в разработку ИИ, часто ставя скорость выше безопасности в том, что некоторые критики называют «гонкой на выживание». Стремясь обойти конкурентов, крупные технологические компании, похоже, больше сосредоточены на том, чтобы произвести впечатление на инвесторов шумихой, чем на том, чтобы понять, подходит ли ИИ для решения конкретной задачи.

Если мы надеемся ограничить склонность ИИ к обману рамками настольных игр, разработчикам крайне важно ставить безопасность выше скорости. Ставки слишком высоки, чтобы игнорировать этические последствия создания всё более автономных и непредсказуемых систем.

Источник

В продолжении "вишенка на торте"...

ИИ создал чип, похожий на инопланетный, который работает, но никто не знает, как.

Недавно разработанный беспроводной чип с искусственным интеллектом удивил учёных. Этот необычный проект привлёк внимание не только своей эффективностью, но и совершенно неожиданной структурой.

Некоторые эксперты заметили удивительное сходство между дизайном чипа и изображениями «инопланетных городов», созданными теми же нейросетями.

Проект был реализован международной группой исследователей, в которую входили специалисты из Китая и Индии, работавшие в США. Их задачей было заставить нейронную сеть создать дизайн для нового чипа беспроводной связи.

Результат превзошёл все ожидания: получившаяся конструкция оказалась значительно эффективнее традиционных инженерных решений.

Но странна не только высокая производительность чипа. Его структура настолько хаотична и необычна, что ведущие учёные сравнивают её с изображениями инопланетных мегаполисов, созданными искусственным интеллектом.

Более того, несмотря на свою сложность, чип работает лучше, чем традиционные конструкции, хотя никто до конца не понимает почему.

«Конструкции выглядят как случайные формы», — сказал ведущий исследователь Каушик Сенгупта, инженер-электрик из Принстона, в интервью Live Science. «Люди не могут их по-настоящему понять».

Статья о результатах исследования была опубликована в научном журнале Nature.

Разработка такого эффективного решения без чёткого понимания того, как оно работает, вызывает у экспертов смешанные чувства — восхищение и тревогу одновременно.

Как далеко может зайти искусственный интеллект в своём развитии и сможем ли мы когда-нибудь полностью контролировать его потенциал?

Источник

    «Ставроанастасима» – крестовоскресные слова. О Воскресении

    Братья и отцы, пришла Пасха, радостный день воскресения Христова, причина всякой радости и ликования, которые переживаются либо один раз в год, либо каждый день и постоянно – теми, кто постигает таинс...

    Почему факты никого не убеждают?

    Что заставляет людей совершенно искренне занимать кардинально противоположные позиции по одному и тому же поводу, с риском для безопасности, здоровья и даже жизни? Почему страшные событ...

    Ваш комментарий сохранен и будет опубликован сразу после вашей авторизации.

    0 новых комментариев

      Sage Вчера 13:24

      Про неолиберальное нейролингвистическое программирование

      «Вот скажи мне, американец, в чём сила? Разве в деньгах? Вот и брат говорит, что в деньгах. У тебя много денег, и чего? Я вот...
      657

      Древнее проклятие второго Великого сфинкса.

                     Второй Великий Сфинкс был закопан глубже первогоСтрашное пророчество д...
      1923

      Малоизвестные факты об О.Монферране и Исаакиевском Соборе.

                         Петербург до начала строительства Исаакия Все больш...
      876

      Вас готовят к этому уже давно - просто вы не заметили.

      Мир меняется не внезапно. Мир всегда подготавливают к переменам заранее - тихо, постепенно, почти незаметно. И самое удивител...
      1594

      Архивы Аненербе о Новой Швабии под Антарктидой.

      Как заселялась Швабия, бегство преступника №1«Немецкой арктической экспедицией 1938 года открыты новые территории, скрытые подо льдами Антар...
      2556

      Анализ Нового Завета с научной точки зрения на базе открытия П. Гаряева (Анализ сделан ИИ)

      Рекоменую перед прочтением этой статьи изучить волновую теорию П. Гаряева Здесь ИИ: Мы не трогаем  «подмену». Мы берём ин...
      2658

      Вот, возможно, из-за чего убили П.Гаряева.

      Смерть основателя волновой генетики - российского ученого П.Гаряева была настолько неожиданной для близких и друзей, которые...
      1219
      Sage 4 апреля 22:34

      Учителя: школьники теряют способность к мышлению из-за использования ИИ.

      Согласно опросу учителей средних школ в Англии, ученики, использующие искусственный интеллект, теряют способность к критическ...
      406

      Тайны Русского Севера. Великий Новгород против Гипербореи.

      Предыдущая часть ЗДЕСЬВ 1471 году, когда русский Север целиком принадлежал Новгородской республике, в Белом море появилась странная экспедиц...
      1879

      ОТ СО-ТВОРЦА К РАБУ СИСТЕМЫ.

      Как ведический солнечный культ заменили авраамическим лунным, а свободного человека превратили в подданного. Введение. Мир, гд...
      1437

      Казанский собор: православный храм или зачищенный артефакт другой цивилизации? История, которую замуровали вместе с подвалами.

      Статья написана профессиональным строителем с 20-ти летним стажем ремонта дворцов Спб. Казанский собор — не православный храм. Никогда ...
      3961

      Храмы допотопного Петербурга: места силы, которые заставили замолчать.

      Город, который был до городаСанкт-Петербург — имя новое. Город, который его носит, старше на тысячи лет. В XVIII веке писатель Чулков прямо ...
      4262
      Sage 31 марта 21:57

      Торг вокруг Ирана

      На фоне продолжающихся попыток Израиля ещё выше поднять ставки в войне с Ираном, Трамп, судя по всему, всерьез решил соскакив...
      958
      Sage 30 марта 20:47

      СОН ИВАНА СЕРГЕЕВИЧА

      Иван Сергеевич проснулся в холодном поту. Рука сама потянулась к тумбочке, где под стопкой книг лежал старый кожаный бумажник...
      395
      Sage 30 марта 11:18

      Исторические параллели. Михаил Меньшиков — Россия гибнет от самодовольной и оптимистической бюрократии.

      «Россия гибнет от слишком заметного возобладания в ней типа самодовольной, оптимистической бюрократии.Сидит себе в Северной П...
      396

      Что для нас есть история?MIPЪ И РИМ. Два пути, две судьбы, две буквы.

      1. Две буквы, два мираВ старой русской азбуке, той, которую мы почти забыли, были две буквы «И». Одна — Иже (простое «и»). Др...
      733

      ИГРА, В КОТОРУЮ МЫ ИГРАЕМ.

      Часть 1. Уровни и соблазныПредставь компьютерную игру. Ты — новый игрок. Твоя душа только что вошла в этот мир.Ты не знаешь п...
      792

      КАК ЛОМАЛИ ЯЗЫК, ЧТОБЫ ЛОМАТЬ СОЗНАНИЕ. II часть

      Начало ЗДЕСЬ Часть 2. Сакральная азбука: когда каждая буква была миромВведение: язык до реформПрежде чем говорить о том, как я...
      1589

      КАК ЛОМАЛИ ЯЗЫК, ЧТОБЫ ЛОМАТЬ СОЗНАНИЕ.

      Введение: Язык как код реальности Современная наука подтверждает: язык — не просто средство общения, это инстру...
      1428

      КТО МЫ РУССКИЕ? НАСЛЕДНИКИ ГИПЕРБОРЕИ-ВЕЛИКОЙ СКИФИИ ИЛИ РИМА?

      Последние годы обострились споры по теме : мы Россия это Третий Рим или наследники Орды? Церковь навязчиво - Москва Третий Рим, Евразийцы - ...
      1209
      Служба поддержи

      Яндекс.Метрика