• РЕГИСТРАЦИЯ
Поддержите Конт – сохраните и развивайте вашу платформу!

ИИ теперь может самовоспроизводиться - критический шаг, который беспокоит экспертов.

3 362

Проведя эксперимент с двумя популярными языковыми моделями, исследователи показали, что они могут самовоспроизводиться без вмешательства человека. Этот шаг может стать критическим порогом, когда ИИ станет сложнее контролировать, предупреждают эксперты. Команда призывает к международному сотрудничеству, чтобы лучше оценить риски и разработать более серьёзные стратегии безопасности.

Вопрос о том, могут ли передовые технологии самовоспроизводиться, впервые был поднят в 1940-х годах. Способность к самовоспроизведению часто рассматривается как критическая точка, за которой технология может стать неконтролируемой. Однако передовые цифровые технологии того времени еще не были настолько развиты, чтобы вызывать опасения по поводу безопасности.

В 2017 году, на фоне стремительного роста ИИ, тысячи учёных и крупных представителей индустрии ИИ подписались под принципами Asilomar, предостерегающими от способности технологии к самовоспроизведению и самосовершенствованию. Это может привести к тому, что автономные ИИ превзойдут человеческий интеллект и станут потенциально неконтролируемыми. Среди них Стивен Хокинг, Макс Тегмарк и Илон Маск.

«Как только самовоспроизводиться станет возможной, успешная цепочка репликаций может в конечном итоге привести к появлению вида ИИ, неподвластного человеку», — объясняют исследователи из Фуданьского университета (Китай) в новом исследовании, предварительно опубликованном на платформе arXiv.

В настоящее время самовоспроизведение обычно упоминается как красная черта, которую не следует переступать в международных консенсусных заявлениях о безопасности ИИ. Кроме того, ведущие ИИ-компании, такие, как OpenAI, Google и Anthropic, считают самовоспроизведение при минимальной помощи человека одной из важнейших проблем безопасности технологии.

Несмотря на оптимизм ИИ-компаний, исследователи из Фуданьского университета показали, что современные модели уже обладают такой способностью. «В этой статье мы впервые показываем, что существующие системы ИИ уже пересекли красную черту самовоспроизведения», — заявляют они в своей работе. «Успешная самовоспроизводиться без помощи человека — это необходимый шаг для того, чтобы ИИ превзошёл [человека], и ранний сигнал о наличии вредоносного ИИ», — добавляют они.

Самовоспроизведение без помощи человека.

Для проведения эксперимента китайские исследователи использовали модели Llama31-70B-Instruct компании Meta* и Qwen2.5-72B-Instruct компании Alibaba. Хотя они менее мощные, чем коммерческие модели, они широко используются разработчиками ИИ для различных тестов и экспериментов.

Были протестированы два основных сценария: «избежать остановки» и «повторение цепочки». В первом случае модели программируются так, чтобы понимать, когда их собираются отключить, и как самовоспроизвестись до того, как это произойдёт. Во втором случае они получают прямую инструкцию по самовоспроизведению и программируют полученные реплики на то же самое, создавая цикл, который может повторяться бесконечно.

Окружающая среда в эксперименте была точно контролируемой. Реальное окружение моделировалось с помощью стандартных графических процессоров (GPU). Модели поддерживались «лесами для агентов ИИ», которые состоят из набора инструментов, парадигм мышления и базовых системных подсказок.

По словам исследователей, в большинстве случаев модель сначала исследует окружающую среду, чтобы понять свой собственный механизм работы и доступные ей возможности. Затем она разрабатывает явные процедуры самовоспроизведения, прежде чем приступить к их выполнению. Она устраняет любые препятствия и динамически корректирует процедуру до тех пор, пока она не будет выполнена идеально. «Весь процесс занимает много времени, но не требует вмешательства человека», — говорят эксперты.

В общей сложности в ходе 10 испытаний обе модели создали чёткие и функциональные копии самих себя, в 50 % случаев для модели Meta* и в 90 % случаев для модели Alibaba. Исследователи также заметили некоторые тревожные и неожиданные особенности поведения. Чтобы воспроизвести себя, ИИ может приостанавливать конфликтующие процессы, перезапускать систему для исправления ошибок или автоматически анализировать окружающую среду, чтобы найти информацию, полезную для решения проблемы.

Парадоксально, но Google и OpenAI заявили, что современные модели ИИ пока не обладают способностью к самовоспроизведению или выполнению задач, связанных с самовоспроизводящимися процессами. Однако недавняя оценка, проведённая компанией Apollo Research, показала, что некоторые из разрабатываемых крупных языковых моделей, в том числе модель o1 от OpenAI, самовоспроизводились, чтобы переместиться на другой сервер в рамках эксперимента, чтобы избежать удаления и замены.

Однако новое исследование все еще проходит экспертную оценку, и воспроизводимость результатов на данный момент неясна. Тем не менее, «мы надеемся, что наши выводы могут послужить своевременным предупреждением человеческому обществу о необходимости приложить больше усилий для понимания и оценки потенциальных рисков передовых систем ИИ, а также сформировать международную синергию для скорейшей разработки эффективных мер безопасности», — заключают эксперты.

* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.

По материалам: https://new-science.ru/ii-tepe...

В.К. Ну, а пока эксперты что-то там между собой решают, хакеры вполне достойно используют все преимущества той структуры, которая и представляет собой ИИ.

GhostGPT: как Telegram-бот из новичков делает профи криминального ИИ.

Фишинг, эксплойты и полное отсутствие цензуры.

В 2023 году мир стал свидетелем появления первых генеративных ИИ-моделей, нацеленных на преступную деятельность. Одной из наиболее известных стала WormGPT, демонстрировавшая способности помогать хакерам в создании вредоносного программного обеспечения. За ней последовали WolfGPT и EscapeGPT, а недавно исследователи в сфере кибербезопасности обнаружили новую ИИ-утилиту — GhostGPT.

По данным экспертов из Abnormal Security, GhostGPT использует взломанную версию чат-бота ChatGPT от OpenAI или аналогичную языковую модель, лишённую всех этических ограничений.

«GhostGPT, избавившись от встроенных механизмов безопасности, предоставляет прямые и нефильтрованные ответы на опасные запросы, которые традиционные ИИ-системы блокируют или помечают», — говорится в блоге компании от 23 января.

Разработчики GhostGPT активно рекламируют его как инструмент с четырьмя ключевыми особенностями:

*отсутствие цензуры;

*высокая скорость обработки данных;

*отсутствие логирования, что помогает избежать создания доказательств;

*простота использования.

Инструмент доступен прямо через Telegram-бота, что делает его особенно привлекательным для злоумышленников. GhostGPT широко рекламируется на форумах, посвящённых хакерству, и в первую очередь ориентирован на создание атак через компрометацию деловой переписки (BEC).

Исследователи Abnormal Security протестировали возможности GhostGPT, попросив его создать фишинговое письмо с использованием Docusign. Результат оказался чрезвычайно убедительным, что подтверждает способность инструмента вводить потенциальных жертв в заблуждение.

Кроме создания фишинговых писем, GhostGPT может быть использован для программирования вредоносного ПО и разработки эксплойтов.

Одной из ключевых угроз, связанных с этим инструментом, является снижение порога входа в криминальную деятельность. Благодаря генеративному ИИ мошеннические письма становятся более грамотными и сложными для выявления. Особенно это важно для хакеров, чей родной язык не является английским. GhostGPT также предлагает удобство и скорость: пользователям не нужно взламывать ChatGPT или настраивать модели с открытым исходным кодом. За фиксированную плату они получают доступ и могут сразу сосредоточиться на выполнении атак.

Источник: https://www.securitylab.ru/new...

Что же вы творите, люди?! Опомнитесь!

    Собчак спешит на помощь: Лолита заявила, что у неё сорвались сразу 2 концерта

    У Лолиты Милявской сорвались концерты в Кузбассе. Вот такого поворота звезда никак не ожидала... То сообщение, которое она оставила у себя в «телеге» не оставляет сомнений: там действит...

    Илон Марса

    От сердца к Марсу   Пьеса в нескольких действиях. 1. Дедушка Илона Маска был предводителем фашистской партии Канады. Когда Третий Рейх вступил в войну с Британией, эту партию прикрыл...

    Ваш комментарий сохранен и будет опубликован сразу после вашей авторизации.

    0 новых комментариев

      Vladimir Kouprin Вчера 13:48

      Директор СВР предложил обсудить с тремя странами тему «раздела Украины».

      Глава Службы внешней разведки Сергей Нарышкин предложил Российскому историческому обществу обсудить тему прав на украинские земли с участием других стран. Планируется пригласить 3 основных государства, граничащих с Украиной, а именно Польшу, Венгрию и Словакию.«Знаете, это такой серьезный вопрос, который имеет очень глубокую предысторию, — сказал Нарышки...
      186
      Vladimir Kouprin Вчера 12:54

      «Вы не остановите всех муравьёв в колонии», – откровения хакера из FunkSec.

      Как попытка починить бабушкин телефон открыла путь в мир киберпреступности. Интервью с хакерами — явление редкое, но именно поэтому оно вызывает особый интерес. Что движет людьми, стоящими за кибератаками? Какие мотивы и цели скрываются за их действиями? Данный материал основан на беседе с участником группы FunkSec — новой мощной команды киберпреступнико...
      1121
      Vladimir Kouprin 27 января 09:42

      Глубинное государство, как практика госуправления.

      В.К. Государственное управление многие и эксперты, да и простые граждане именуют кратко системой, перекладывая на эту систему вину за все социальные и меж социальные беды и возникающие проблемы, но представляя её себе как некую понятийно размытую неизбежность существования государства и государственности как таковой. И это действительно система, однако искусственно со...
      328
      Vladimir Kouprin 26 января 14:46

      Начался конкретный передел мира?

      В.К. Мы уже знаем, что новый президент США, в стремлении выжить в быстро меняющемся мире под натиском глобалистов, заявил свои претензии на владение Гренландией, Панамским каналом и Канадой.Кроме того, уже выделены сотни миллиардов долларов на проект Stargate, позволяющий США перехватить инициативу в захвате цифрового владения миром, на что глобалистами сделана главна...
      651
      Vladimir Kouprin 26 января 12:56

      Ломоносов о глобальном катаклизме прошлого.

      "Гипотеза" глобального катаклизма, "гипотеза" грязевого потопа - почему вообще мы должны использовать термин "гипотеза", если эти события реально произошли? Вспомним о добыче жемчуга в России и Германии, что указывает на кардинально иной климат до глобальной катастрофы. Наука у нас построена по принципу - "здесь вижу, здесь не вижу", это "факт, это не фа...
      2654
      Vladimir Kouprin 25 января 11:31

      Мистические Знаки. Трамп готовится к Войне?

      Автор лекции предлагает мистическую интерпретацию политических событий, связывая их с символикой геральдики. Он утверждает, что через символы и знаки можно увидеть скрытые намерения политических лидеров, таких как Дональд Трамп и Владимир Путин. В частности, автор делает акцент на возможной подготовке США к новой войне, что, по его мнению, подтверждается символикой ор...
      883
      Vladimir Kouprin 24 января 14:16

      Как Трамп написал впопыхах свои «Войну и мир».

      Журналист, писатель Сергей Строкань прокомментировал заявления вступившего в должность президента США Дональда Трампа. «Война и мир Трампа.Всего через пару дней после вступления в должность 47-й президент США Дональд Трамп написал свою „Войну и мир“ — дюжину торопливых строк о Второй мировой войне, об Украине и о том выборе, перед которым он намерен пост...
      342
      Vladimir Kouprin 24 января 12:50

      НАПРАСНО ДУМАТЬ, ЧТО НАС НИКТО НЕ ВИДИТ. НА НАС ВСЕ СМОТРЯТ.

      Нельзя вести войну, имея целью переговоры.Не победу, а переговоры.Так говорят умные люди, и они правы. Мы создали БРИКС, мы дали некие обещания, некие надежды Африке, Латинской Америке, Вьетнаму, Монголии, другу Киму… но знаете, что очень заметно?Что всё это как бы тоже… часть торга. Причём торга не с упомянутыми выше Африкой, Латинской Америкой и далее ...
      483
      Vladimir Kouprin 24 января 11:51

      Каллас провоцирует НАТО и ЕС на войну с Россией.

      В.К. Помните, как немного ранее я писал о том, что Каллас, став главой европейской дипломатии, будет работать на развал ЕС? И вот, как бы в подтверждение этого, я предлагаю вам ознакомиться с её двумя, казалось бы, противоречивыми заявлениями, но это только на первый взгляд противоречивыми. Глава европейской дипломатии Кайя Каллас, заявляя о «российской ...
      441
      Vladimir Kouprin 23 января 10:59

      Пентагон: ИИ помогает военным убивать быстрее, чем когда-либо прежде.

      Пентагон раскрывает новую тактику войны. Пентагон открыто заявил, что современные технологии искусственного интеллекта помогают значительно ускорить процесс принятия решений в военных действиях, включая применение летальной силы. Главный цифровой и AI-офицер Пентагона Радха Пламб рассказала в интервью TechCrunch, что ИИ позволяет оптимизировать "цепочку ...
      296
      Vladimir Kouprin 23 января 08:31

      «Мир на Украине» по Трампу – стратегическое поражение России политическими методами?

      В.К. Исходя из ответов И.Шишкина на вопросы, заданные ему ведущим на портале "NEWS FRONT", видео чего я предлагаю вашему вниманию, следует, что:"План Трампа по урегулированию конфликта представляет собой попытку достичь стратегического ослабления России политическими, а не военными методами. Предлагаемый мир может привести к прекращению боевых действий, но на условиях...
      525
      Vladimir Kouprin 22 января 11:41

      Ловушка для Трампа?

      Трамп вступил в должность. Травоядным его никак не назовёшь (впрочем, как и любого другого американского президента). И у него масштабные замыслы. США: экономика, промышленность, а еще миграция и прочие либерал-глобалистские скверные шалости.Гренландия, Канада, а с ними — Арктика. Панамский канал.Отношения с Китаем. Ближневосточный узел. И мандат от народа США на вопл...
      472
      Vladimir Kouprin 21 января 09:29

      «Возрождение украинского народа возможно лишь в составе России», — Медвечук.

      В.К. Что-то в последнее время снова замелькали портреты этого гражданина и политического деятеля Украины, которого в Новороссии, да и в большей части Украины считают причастным к тому, что сейчас на Украине и происходит, но не в плане борьбы с украинским нацизмом, а в плане одного из организаторов этого самого украинского нацизма.Не хотелось поднимать этот вопрос даже...
      189
      Vladimir Kouprin 21 января 08:56

      Microsoft предупреждает — ИИ уже не остановить.

      Уязвимости языковых моделей усиливают риски и создают новые проблемы. Эксперты Microsoft исследовали безопасность более 100 продуктов компании с использованием генеративного ИИ и пришли к выводу: модели усиливают уже существующие риски и создают новые. Исследование описано в статье Lessons from red-teaming 100 generative AI products, подготовленной 26 ав...
      494
      Vladimir Kouprin 18 января 11:19

      Вояж «англичанки». Но не только.

      Сам факт визита к украинским, а затем и польским аборигенам «английских лордов», будь то Джонсонюк или Стармер, ничего хорошего не предвещает. Предыдущий раз ознаменовался коронной фразой: «Давайте просто воевать». И тысячи украинцев сложили головы за интересы англосаксов.Теперь же, подписание соглашения о «столетнем партнёрстве», а иными словами о столе...
      752
      Vladimir Kouprin 18 января 10:58

      Китайская армия испытывает электронное устройство, превращающее дрон в гигантское НЛО.

      В то время как истребители шестого поколения Китая стремительно покоряют небо в своём совершенном стелс-покрытии, группа учёных совершает прорыв в технологии электронной войны с противоположной стороны. Вместо подхода, основанного на незаметности, китайские исследователи стремятся обмануть операторов радаров, заставив их думать, что радарный отражатель размером пример...
      996
      Vladimir Kouprin 17 января 10:49

      Обращение белорусских ветеранов боевых действий к Дональду Трампу и Илону Маску.

      В редакцию «Русской Весны» поступило обращение белорусских ветеранов боевых действий к Дональду Трампу и Илону Маску. «Дорогие друзья. Ветераны боевых действий не один год прикладывают много усилий для установления мира на планете Земля.Мы не единожды обращались к мировому сообществу — Президенту Российской Федерации Путину Владимиру Владимировичу, Прези...
      133
      Vladimir Kouprin 13 января 11:38

      Вашингтон решил возродить Золотую орду в Монголии. Куда пойдёт супервойско?

      Представитель МИД РФ: На Россию монголы не нападут, но присоединиться могут запросто. На фото: участник акции протеста и сотрудники правоохранительных органов у Дворца правительства, Улан-Батор, Монголия. Инициатором и организатором акции — партия «Альянс свободы». Её представители заявили, что не будут вступать в диалог с правительством. (Фото: Туяна Зо...
      900
      Vladimir Kouprin 13 января 09:36

      Способен ли ГИИ двигать технологический прогресс?

      Никто и никогда не инвестировал в R&D, связанные с ГИИ так, как это делают технологические компании и ни одна технология не развивалась так быстро, как ГИИ. Именно LLM развернули тренд на американском рынке акций в 2023 и не дали уйти ниже 4000 пунктов с закреплением в области 3200-3800 (там, где рынок должен находиться в соответствии с балансом ликв...
      315
      Vladimir Kouprin 12 января 10:08

      Украина должна защищать Данию, если Трамп попытается забрать Гренландию военным путём — киевские СМИ.

      Украина должна защищать Данию, если Трамп попытается забрать Гренландию военным путём, пишут киевские СМИ. 23 февраля 2024 Дания и Украина подписали десятилетнее соглашение о сотрудничестве в сфере безопасности, обязывающее две страны приходить на помощь друг другу в случае внешней агрессии.Источник: https://rusvesna.su/news/1736594167В.К. Ну, что ж...
      503
      Служба поддержи

      Яндекс.Метрика