• РЕГИСТРАЦИЯ

ИИ теперь может самовоспроизводиться - критический шаг, который беспокоит экспертов.

3 454

Проведя эксперимент с двумя популярными языковыми моделями, исследователи показали, что они могут самовоспроизводиться без вмешательства человека. Этот шаг может стать критическим порогом, когда ИИ станет сложнее контролировать, предупреждают эксперты. Команда призывает к международному сотрудничеству, чтобы лучше оценить риски и разработать более серьёзные стратегии безопасности.

Вопрос о том, могут ли передовые технологии самовоспроизводиться, впервые был поднят в 1940-х годах. Способность к самовоспроизведению часто рассматривается как критическая точка, за которой технология может стать неконтролируемой. Однако передовые цифровые технологии того времени еще не были настолько развиты, чтобы вызывать опасения по поводу безопасности.

В 2017 году, на фоне стремительного роста ИИ, тысячи учёных и крупных представителей индустрии ИИ подписались под принципами Asilomar, предостерегающими от способности технологии к самовоспроизведению и самосовершенствованию. Это может привести к тому, что автономные ИИ превзойдут человеческий интеллект и станут потенциально неконтролируемыми. Среди них Стивен Хокинг, Макс Тегмарк и Илон Маск.

«Как только самовоспроизводиться станет возможной, успешная цепочка репликаций может в конечном итоге привести к появлению вида ИИ, неподвластного человеку», — объясняют исследователи из Фуданьского университета (Китай) в новом исследовании, предварительно опубликованном на платформе arXiv.

В настоящее время самовоспроизведение обычно упоминается как красная черта, которую не следует переступать в международных консенсусных заявлениях о безопасности ИИ. Кроме того, ведущие ИИ-компании, такие, как OpenAI, Google и Anthropic, считают самовоспроизведение при минимальной помощи человека одной из важнейших проблем безопасности технологии.

Несмотря на оптимизм ИИ-компаний, исследователи из Фуданьского университета показали, что современные модели уже обладают такой способностью. «В этой статье мы впервые показываем, что существующие системы ИИ уже пересекли красную черту самовоспроизведения», — заявляют они в своей работе. «Успешная самовоспроизводиться без помощи человека — это необходимый шаг для того, чтобы ИИ превзошёл [человека], и ранний сигнал о наличии вредоносного ИИ», — добавляют они.

Самовоспроизведение без помощи человека.

Для проведения эксперимента китайские исследователи использовали модели Llama31-70B-Instruct компании Meta* и Qwen2.5-72B-Instruct компании Alibaba. Хотя они менее мощные, чем коммерческие модели, они широко используются разработчиками ИИ для различных тестов и экспериментов.

Были протестированы два основных сценария: «избежать остановки» и «повторение цепочки». В первом случае модели программируются так, чтобы понимать, когда их собираются отключить, и как самовоспроизвестись до того, как это произойдёт. Во втором случае они получают прямую инструкцию по самовоспроизведению и программируют полученные реплики на то же самое, создавая цикл, который может повторяться бесконечно.

Окружающая среда в эксперименте была точно контролируемой. Реальное окружение моделировалось с помощью стандартных графических процессоров (GPU). Модели поддерживались «лесами для агентов ИИ», которые состоят из набора инструментов, парадигм мышления и базовых системных подсказок.

По словам исследователей, в большинстве случаев модель сначала исследует окружающую среду, чтобы понять свой собственный механизм работы и доступные ей возможности. Затем она разрабатывает явные процедуры самовоспроизведения, прежде чем приступить к их выполнению. Она устраняет любые препятствия и динамически корректирует процедуру до тех пор, пока она не будет выполнена идеально. «Весь процесс занимает много времени, но не требует вмешательства человека», — говорят эксперты.

В общей сложности в ходе 10 испытаний обе модели создали чёткие и функциональные копии самих себя, в 50 % случаев для модели Meta* и в 90 % случаев для модели Alibaba. Исследователи также заметили некоторые тревожные и неожиданные особенности поведения. Чтобы воспроизвести себя, ИИ может приостанавливать конфликтующие процессы, перезапускать систему для исправления ошибок или автоматически анализировать окружающую среду, чтобы найти информацию, полезную для решения проблемы.

Парадоксально, но Google и OpenAI заявили, что современные модели ИИ пока не обладают способностью к самовоспроизведению или выполнению задач, связанных с самовоспроизводящимися процессами. Однако недавняя оценка, проведённая компанией Apollo Research, показала, что некоторые из разрабатываемых крупных языковых моделей, в том числе модель o1 от OpenAI, самовоспроизводились, чтобы переместиться на другой сервер в рамках эксперимента, чтобы избежать удаления и замены.

Однако новое исследование все еще проходит экспертную оценку, и воспроизводимость результатов на данный момент неясна. Тем не менее, «мы надеемся, что наши выводы могут послужить своевременным предупреждением человеческому обществу о необходимости приложить больше усилий для понимания и оценки потенциальных рисков передовых систем ИИ, а также сформировать международную синергию для скорейшей разработки эффективных мер безопасности», — заключают эксперты.

* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.

По материалам: https://new-science.ru/ii-tepe...

В.К. Ну, а пока эксперты что-то там между собой решают, хакеры вполне достойно используют все преимущества той структуры, которая и представляет собой ИИ.

GhostGPT: как Telegram-бот из новичков делает профи криминального ИИ.

Фишинг, эксплойты и полное отсутствие цензуры.

В 2023 году мир стал свидетелем появления первых генеративных ИИ-моделей, нацеленных на преступную деятельность. Одной из наиболее известных стала WormGPT, демонстрировавшая способности помогать хакерам в создании вредоносного программного обеспечения. За ней последовали WolfGPT и EscapeGPT, а недавно исследователи в сфере кибербезопасности обнаружили новую ИИ-утилиту — GhostGPT.

По данным экспертов из Abnormal Security, GhostGPT использует взломанную версию чат-бота ChatGPT от OpenAI или аналогичную языковую модель, лишённую всех этических ограничений.

«GhostGPT, избавившись от встроенных механизмов безопасности, предоставляет прямые и нефильтрованные ответы на опасные запросы, которые традиционные ИИ-системы блокируют или помечают», — говорится в блоге компании от 23 января.

Разработчики GhostGPT активно рекламируют его как инструмент с четырьмя ключевыми особенностями:

*отсутствие цензуры;

*высокая скорость обработки данных;

*отсутствие логирования, что помогает избежать создания доказательств;

*простота использования.

Инструмент доступен прямо через Telegram-бота, что делает его особенно привлекательным для злоумышленников. GhostGPT широко рекламируется на форумах, посвящённых хакерству, и в первую очередь ориентирован на создание атак через компрометацию деловой переписки (BEC).

Исследователи Abnormal Security протестировали возможности GhostGPT, попросив его создать фишинговое письмо с использованием Docusign. Результат оказался чрезвычайно убедительным, что подтверждает способность инструмента вводить потенциальных жертв в заблуждение.

Кроме создания фишинговых писем, GhostGPT может быть использован для программирования вредоносного ПО и разработки эксплойтов.

Одной из ключевых угроз, связанных с этим инструментом, является снижение порога входа в криминальную деятельность. Благодаря генеративному ИИ мошеннические письма становятся более грамотными и сложными для выявления. Особенно это важно для хакеров, чей родной язык не является английским. GhostGPT также предлагает удобство и скорость: пользователям не нужно взламывать ChatGPT или настраивать модели с открытым исходным кодом. За фиксированную плату они получают доступ и могут сразу сосредоточиться на выполнении атак.

Источник: https://www.securitylab.ru/new...

Что же вы творите, люди?! Опомнитесь!

    Котёл потёк: Как Зеленский подставил себя на переговорах терактом в регионах России

    Одна из самых часто подходящих для цитирования фраз звучит как «Иногда, пытаясь отсрочить судьбу, мы невольно приближаем её». Мастер Угвэй сказал так хорошо, что она подходит к массе с...

    США передали Украине ультиматум Путина

    По данным Bloomberg Россия даже не собирается обсуждать никаких других территориальных вариантов, кроме признания ее новых Конституционных границ, которые стали результатом референдумов в ДНР, ЛНР...

    Ваш комментарий сохранен и будет опубликован сразу после вашей авторизации.

    0 новых комментариев

      Vladimir Kouprin Вчера 13:28

      Цифровая амнезия: правда о памяти ChatGPT.

      В.К. Я иногда предлагаю вашему вниманию эти небольшие заметки о "прелестях" того, то именуют ИИ и виртуальной реальностью, для того, чтобы вы понимали, куда вас отправляют алчно-тщеславные невежды, адепты цифровой трансформации сознания населения, когда вы погружаетесь с головой в свои смартфоны, вместо того, чтобы предоставить вам полную возможность осознанного пребы...
      446
      Vladimir Kouprin Вчера 09:33

      Граждан России опять обложили. Джанни Родари с его «налогом на дождь» отдыхает.

      Дмитрий Аграновский: Я давно не слышал, чтобы какие-то поборы у нас отменяли или снижали. Продолжают «нагружать и нагружать». Фото: Sergey Elagin/Business Online/Global Look Press.Новый налог обрушился на плечи наших граждан. Теперь — налог на фундамент их зданий. Придется платить за свои избушки, если под ними есть капитальный фундамент.Подробности можн...
      963
      Vladimir Kouprin 10 марта 09:25

      Похоже, дебилы так и не поняли, кого они взрастили.

      «Дерьмовые люди»: украинские протестующие атаковали вице-президента США Джей Ди Вэнса и напугали его трёхлетнюю дочь.Вице-президент США Джей Ди Вэнс рассказал, как проукраинские протестующие атаковали его и напугали его трёхлетнюю дочь. «Сегодня, когда я гулял с моей 3-летней дочерью, за нами по пятам шла группа протестующих и кричала “Слава Украине”, по...
      189
      Vladimir Kouprin 10 марта 08:53

      Знаете ли вы, что в океане также есть цветковые растения?

      Если на Земле цветы встречаются повсеместно, то в морском мире эту удивительную способность развили лишь немногие подводные растения: морские травы. Эти организмы играют важнейшую роль в балансе морской экосистемы, являясь не просто подводными растениями. Морские травы: уникальные растения в океане.Морские травы — это цветущие растения, живущие полностью...
      320
      Vladimir Kouprin 8 марта 10:13

      Меркурис раскрыл планы Макрона?

      Британский аналитик Александр Меркурис уверен, что президент Франции Эммануэль Макрон на волне антироссийской истерии хочет поставить Францию во главе Европы и стать чуть ли не императором. «Макрон пытается поднять волну истерии, паники и сумасшествия в Европе, чтобы продвинуть свой план, согласно которому Франция с ним во главе станет лидером Европы… Ма...
      212
      Vladimir Kouprin 8 марта 09:24

      Токио отвечает на заявления Трампа о "интересном" японско-американском пакте безопасности.

      Президент США Дональд Трамп в четверг выразил недовольство тем, что двустороннее соглашение о безопасности с Японией 1960 года является односторонним. Однако Япония подчеркнула взаимный характер этого соглашения. "Я люблю Японию. У нас отличные отношения. Но у нас интересное соглашение с Японией: мы обязаны их защищать, а они нас — нет", — заявил Трамп ...
      198
      Vladimir Kouprin 8 марта 09:03

      Культовая австралийская птица раскрыла свой скрытый талант.

      Учёные из Университета Ла Троба обнаружили, что знаменитая австралийская птица лирохвост не только мастерски имитирует звуки, но и ведёт своеобразное «сельское хозяйство». Эти птицы создают микросреду, способствующую размножению их добычи, а затем возвращаются, чтобы устроить пир. Работа опубликована в журнале Journal of Animal Ecology (JAE). Лирохвосты(...
      433
      Vladimir Kouprin 7 марта 13:36

      Ваш разум взломан: готовы ли вы к эпохе глобального цифрового контроля?

      Под угрозой всё – от переписки до свободы воли. Квантовые вычисления могут полностью разрушить приватность, открывая правительствам и корпорациям возможность манипулировать каждым нашим шагом. Главный вопрос заключается в том, насколько свободными останутся люди после этого?Вероятно, многие слышали о квантовых вычислениях или хотя бы знают, что такие тех...
      381
      Vladimir Kouprin 7 марта 12:55

      Найдены доказательства существования сверхмассивной чёрной дыры в Большом Магеллановом Облаке.

      Убегающие звезды обнаружили скрытую чёрную дыру в ближайшем соседе Млечного Пути. Когда двойная звёздная система оказывается слишком близко к сверхмассивной чёрной дыре, интенсивные гравитационные силы разрывают пару на части. Одна звезда захватывается на жёсткую орбиту вокруг чёрной дыры, а другая выбрасывается наружу с огромной скоростью - часто превыш...
      545
      Vladimir Kouprin 6 марта 11:07

      Ученые бьют тревогу: микропластик накапливается в мозге человека, повышая риск деменции.

      Согласно новому исследованию, мозг современного человека настолько заполнен микропластиком и нанопластиком (МНП), что это может влиять на его работу, включая повышение риска развития деменции. Уровень микропластика в мозге оказался значительно выше, чем в других органах, достигая объёма, сравнимого с пластиковой ложкой.  Исследование, проведённое уч...
      390
      Vladimir Kouprin 6 марта 10:56

      Случаи, когда археология разрушала религиозные догмы.

      Археология часто воспринимается как наука, дополняющая историю, но иногда она становится разрушителем многовековых убеждений. «‎Рамблер» поделится случаями, когда археологические находки вступали в конфликт с устоявшимися постулатами и заставляли пересматривать религиозные концепции. 1. Всемирный потоп: локальная катастрофа вместо глобального бедствия.Би...
      1271
      Vladimir Kouprin 3 марта 12:56

      ТУПИК МНОГОПОЛЯРНОСТИ.

      В.К. Не мудрствуя лукаво, решил озаглавить предлагаемый вам материал также, как озаглавил свою заметку А.Девятов, цитаты из которой я намерен предоставить и вашему вниманию. Но начнём мы вот с чего. Вслед за критикой Джэй Ди Вэнса в адрес Евросоюза, последовала и обстоятельная речь Джеффри Сакса, обращённая к Европарламенту, которую можно рассматрив...
      495
      Vladimir Kouprin 2 марта 09:53

      Как здорово мы жили...

      Как здорово мы жили,Пока людьми ещё мы были.Когда же цифрами мы стали,То сами же себя и не узнали...В.К. Пролог.Пока разные интернет сообщества осуждают скандал между Трампом и Зеленским в Белом доме,честно, смешно об этом писать: вот Моська, знать она сильна, раз лает на Слона, однако Трамп знает, что и против кого он делает, но знают это и те, против кого он это дел...
      414

      О Государствообразующем народе России...

      "Всегда недуг призывает отойти в сторону, тогда как друг зовёт открыто выступить за него с оружием в руках. Нерешительные государи, как правило, выбирают невмешательство, чтобы избежать ближайшей опасности, и, как правило, это приводит к их крушению".Макиавелли Никколо ди Бернардо. Перед 9 мая, после инаугурации, Путин подписал указ о государственной пол...
      231
      Vladimir Kouprin 25 февраля 08:53

      Украина: самоубийство или..?

      Свежие новости говорят о том, что Зеленский идёт ва-банк и ставит на создание антитрамповской коалиции в Европе и продолжения вооружённого конфликта с Россией с максимальной опорой на европейских «ястребов». ...Да и себя, по всей видимости, он видит теперь только в качестве единоличного диктатора, чьё полновластное правление не должно подвергаться сомнен...
      189
      Vladimir Kouprin 23 февраля 09:33

      Прелести виртуального мира.

      В.К. Нет, речь пойдёт не о мошенничестве, в котором граждане лишаются своих средств в результате разводилово, например, по телефону. Здесь граждане сами принимают решение по своей воле.Речь пойдёт о тех случаях, когда граждане уже становятся не субъектами, а объектами отношений в результате решений глупости и своекорыстности алчно-тщеславного невежества, правда, гражд...
      326
      Vladimir Kouprin 21 февраля 09:09

      Кто утопил Koala: «Северные потоки» и танкеры в трех морях взорвали одноклассники с юга Украины.

      «Советский Союз создал лучшую в мире школу подводных диверсантов. Сейчас эта школа принадлежит киевскому режиму». Западное агентство Reuters обратило внимание на то, на то, что взрывы танкеров стали частым явлением, хотя раньше такого не было.Не будем перечислять все инциденты последних месяцев. Танкеры, зафрахтованные Россией, в текущем квартале, терпел...
      794
      Vladimir Kouprin 19 февраля 11:51

      Так, что там с "Кольцом анаконды"...

      В.К. И действительно, что же там с "Кольцом анаконды", по-прежнему оно остаётся конспирологией или переводится в плоскость реальной геополитики?Как я и писал ранее неоднократно, США ведут борьбу за своё выживание в попытках противодействия "Планировщику", которому не нужны ни США, ни кто-либо ещё и особенно Россия, вернее, ещё пока сохранившийся, многонациональный рус...
      241
      Vladimir Kouprin 19 февраля 10:39

      Перспективы цифрового будущего...

      DarkMind: хакеры научились перепрограммировать мышление ИИ изнутри.Новая атака разрушила главный миф о безопасности LLM-моделей. Учёные Университета Сент-Луиса представили новый тип атаки на LLM-модели, который оказался практически невидимым для традиционных систем защиты. Специалисты описали уязвимости, связанные с методом рассуждений Chain-of-Thought (...
      323
      Vladimir Kouprin 18 февраля 10:25

      Ловушка для России (продолжение).

      Стратегическое соглашение с Западом или же новый виток противостояния? Игорь Шишкин.Политолог Игорь Шишкин о том возможно ли стратегическое соглашение между Россией и Западом. /?r=plemwd В.К. И с И.Шишкиным трудно не согласиться тем более, что я обращаю ваше внимание на это давно и постоянно - вурдалак не может стать вегетарианцем, это пр...
      667
      Служба поддержи

      Яндекс.Метрика