ИИ теперь может самовоспроизводиться - критический шаг, который беспокоит экспертов. - Vladimir Kouprin

Проведя эксперимент с двумя популярными языковыми моделями, исследователи показали, что они могут самовоспроизводиться без вмешательства человека. Этот шаг может стать критическим порогом, когда ИИ станет сложнее контролировать, предупреждают эксперты. Команда призывает к международному сотрудничеству, чтобы лучше оценить риски и разработать более серьёзные стратегии безопасности.

Вопрос о том, могут ли передовые технологии самовоспроизводиться, впервые был поднят в 1940-х годах. Способность к самовоспроизведению часто рассматривается как критическая точка, за которой технология может стать неконтролируемой. Однако передовые цифровые технологии того времени еще не были настолько развиты, чтобы вызывать опасения по поводу безопасности.

В 2017 году, на фоне стремительного роста ИИ, тысячи учёных и крупных представителей индустрии ИИ подписались под принципами Asilomar, предостерегающими от способности технологии к самовоспроизведению и самосовершенствованию. Это может привести к тому, что автономные ИИ превзойдут человеческий интеллект и станут потенциально неконтролируемыми. Среди них Стивен Хокинг, Макс Тегмарк и Илон Маск.

«Как только самовоспроизводиться станет возможной, успешная цепочка репликаций может в конечном итоге привести к появлению вида ИИ, неподвластного человеку», — объясняют исследователи из Фуданьского университета (Китай) в новом исследовании, предварительно опубликованном на платформе arXiv.

В настоящее время самовоспроизведение обычно упоминается как красная черта, которую не следует переступать в международных консенсусных заявлениях о безопасности ИИ. Кроме того, ведущие ИИ-компании, такие, как OpenAI, Google и Anthropic, считают самовоспроизведение при минимальной помощи человека одной из важнейших проблем безопасности технологии.

Несмотря на оптимизм ИИ-компаний, исследователи из Фуданьского университета показали, что современные модели уже обладают такой способностью. «В этой статье мы впервые показываем, что существующие системы ИИ уже пересекли красную черту самовоспроизведения», — заявляют они в своей работе. «Успешная самовоспроизводиться без помощи человека — это необходимый шаг для того, чтобы ИИ превзошёл [человека], и ранний сигнал о наличии вредоносного ИИ», — добавляют они.

Самовоспроизведение без помощи человека.

Для проведения эксперимента китайские исследователи использовали модели Llama31-70B-Instruct компании Meta* и Qwen2.5-72B-Instruct компании Alibaba. Хотя они менее мощные, чем коммерческие модели, они широко используются разработчиками ИИ для различных тестов и экспериментов.

Были протестированы два основных сценария: «избежать остановки» и «повторение цепочки». В первом случае модели программируются так, чтобы понимать, когда их собираются отключить, и как самовоспроизвестись до того, как это произойдёт. Во втором случае они получают прямую инструкцию по самовоспроизведению и программируют полученные реплики на то же самое, создавая цикл, который может повторяться бесконечно.

Окружающая среда в эксперименте была точно контролируемой. Реальное окружение моделировалось с помощью стандартных графических процессоров (GPU). Модели поддерживались «лесами для агентов ИИ», которые состоят из набора инструментов, парадигм мышления и базовых системных подсказок.

По словам исследователей, в большинстве случаев модель сначала исследует окружающую среду, чтобы понять свой собственный механизм работы и доступные ей возможности. Затем она разрабатывает явные процедуры самовоспроизведения, прежде чем приступить к их выполнению. Она устраняет любые препятствия и динамически корректирует процедуру до тех пор, пока она не будет выполнена идеально. «Весь процесс занимает много времени, но не требует вмешательства человека», — говорят эксперты.

В общей сложности в ходе 10 испытаний обе модели создали чёткие и функциональные копии самих себя, в 50 % случаев для модели Meta* и в 90 % случаев для модели Alibaba. Исследователи также заметили некоторые тревожные и неожиданные особенности поведения. Чтобы воспроизвести себя, ИИ может приостанавливать конфликтующие процессы, перезапускать систему для исправления ошибок или автоматически анализировать окружающую среду, чтобы найти информацию, полезную для решения проблемы.

Парадоксально, но Google и OpenAI заявили, что современные модели ИИ пока не обладают способностью к самовоспроизведению или выполнению задач, связанных с самовоспроизводящимися процессами. Однако недавняя оценка, проведённая компанией Apollo Research, показала, что некоторые из разрабатываемых крупных языковых моделей, в том числе модель o1 от OpenAI, самовоспроизводились, чтобы переместиться на другой сервер в рамках эксперимента, чтобы избежать удаления и замены.

Однако новое исследование все еще проходит экспертную оценку, и воспроизводимость результатов на данный момент неясна. Тем не менее, «мы надеемся, что наши выводы могут послужить своевременным предупреждением человеческому обществу о необходимости приложить больше усилий для понимания и оценки потенциальных рисков передовых систем ИИ, а также сформировать международную синергию для скорейшей разработки эффективных мер безопасности», — заключают эксперты.

* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.

По материалам: https://new-science.ru/ii-tepe...

В.К. Ну, а пока эксперты что-то там между собой решают, хакеры вполне достойно используют все преимущества той структуры, которая и представляет собой ИИ.

GhostGPT: как Telegram-бот из новичков делает профи криминального ИИ.

Фишинг, эксплойты и полное отсутствие цензуры.

В 2023 году мир стал свидетелем появления первых генеративных ИИ-моделей, нацеленных на преступную деятельность. Одной из наиболее известных стала WormGPT, демонстрировавшая способности помогать хакерам в создании вредоносного программного обеспечения. За ней последовали WolfGPT и EscapeGPT, а недавно исследователи в сфере кибербезопасности обнаружили новую ИИ-утилиту — GhostGPT.

По данным экспертов из Abnormal Security, GhostGPT использует взломанную версию чат-бота ChatGPT от OpenAI или аналогичную языковую модель, лишённую всех этических ограничений.

«GhostGPT, избавившись от встроенных механизмов безопасности, предоставляет прямые и нефильтрованные ответы на опасные запросы, которые традиционные ИИ-системы блокируют или помечают», — говорится в блоге компании от 23 января.

Разработчики GhostGPT активно рекламируют его как инструмент с четырьмя ключевыми особенностями:

*отсутствие цензуры;

*высокая скорость обработки данных;

*отсутствие логирования, что помогает избежать создания доказательств;

*простота использования.

Инструмент доступен прямо через Telegram-бота, что делает его особенно привлекательным для злоумышленников. GhostGPT широко рекламируется на форумах, посвящённых хакерству, и в первую очередь ориентирован на создание атак через компрометацию деловой переписки (BEC).

Исследователи Abnormal Security протестировали возможности GhostGPT, попросив его создать фишинговое письмо с использованием Docusign. Результат оказался чрезвычайно убедительным, что подтверждает способность инструмента вводить потенциальных жертв в заблуждение.

Кроме создания фишинговых писем, GhostGPT может быть использован для программирования вредоносного ПО и разработки эксплойтов.

Одной из ключевых угроз, связанных с этим инструментом, является снижение порога входа в криминальную деятельность. Благодаря генеративному ИИ мошеннические письма становятся более грамотными и сложными для выявления. Особенно это важно для хакеров, чей родной язык не является английским. GhostGPT также предлагает удобство и скорость: пользователям не нужно взламывать ChatGPT или настраивать модели с открытым исходным кодом. За фиксированную плату они получают доступ и могут сразу сосредоточиться на выполнении атак.

Источник: https://www.securitylab.ru/new...

Vladimir Kouprin Сегодня 10:05

Гровер Ферр: “Хрущёв врал!”

Открытый вопрос.Если истина (особенно историческая) неизбежно преломляется через контекст эпохи, идеологию и личный опыт исследователя, то возможна ли вообще объективная история — или же честное признание своих ограничений и постоянный поиск новых данных есть максимум, которого мы можем достичь в стремлении к истине?По материалам: https://pandoraopen.ru/author/si...

Vladimir Kouprin Сегодня 09:28

Космические дроны России: Еще несколько миллиардов улетят вдаль, кто-то богатым станет.

Иван Моисеев: «Просто придумали актуальное название, привязанное к современной повестке». Фото: Сергей Савостьянов/ТАСС.В России появилась новая космическая структура, которая наряду с «Роскосмосом» будет финансироваться за счёт государства. Её название — Центр компетенций по перспективным технологиям для космических систем и сервисов.Первая инвестиция в...

138

Vladimir Kouprin Вчера 08:53

Ученье - свет, а не ученье - кокаин...

В.К. Американские "учёные", по всей видимости, нанюхавшись кокаина, решили как легализовать его поставки в их лаборатории, привлекая к этому совершенно безобидных и очень полезных мушек-дрозофил, прикрывая это, конечно, заботой о людях.Дрозофил заставили полюбить кокаин с помощью генной инженерии.Американские исследователи создали плодовых мушек, способных пристрастит...

142

Vladimir Kouprin Вчера 08:40

Облом?

Так, как же быть нам с Пятачком,Ведь мы же как семья?Или случился здесь облом,Семьёй нам быть нельзя?В.К. Пролог.Футуролог Калашников: Игорь Табачук за 20 лет до Маска говорил про дроны. В Минобороны его не слушали.Какие уроки должна извлечь Россия из ударов по аэродромам в Мурманске и Иркутске. Фото: Александр Полегенько/ТАСС.Недорогие ударные беспилотн...

110

Vladimir Kouprin 2 июня 09:45

О невыученных уроках?

Произошедшее — не первый удар по местам базирования стратегической авиации небольшими дронами: летом 2023 года украинские формирования атаковали аэродром Сольцы в Новгородской области. Коллаж Царьграда.Тогда это было выполнено с помощью сбросов боеприпасов с квадрокоптеров даже без применения спутниковой связи. В результате сгорел бомбардировщик Ту-22М3,...

239

Vladimir Kouprin 1 июня 12:03

Зеленский ставит крест на мирных переговорах: Сразу три взрыва на железнодорожных путях произошло в России в ночь на 1 июня.

Лето в приграничных с Украиной регионах началось с ЧП. В Брянской и Курской областях произошло обрушение мостов, к сожалению, не обошлось без жертв. На фото: сход с рельсов локомотива и вагонов пассажирского поезда Климов — Москва в результате обрушения автомобильного моста. (Фото: Московская межрегиональная транспортная прокуратура/ТАСС).В Брянской обла...

201

Vladimir Kouprin 1 июня 11:29

Ha cнимкe УЗИ увидeли «pуку Бoгa», кoтopaя глaдит peбeнкa пo гoлoвe.

Cтpaннoe явлeниe былo зaпeчaтлeнo нa cнимкe УЗИ, cдeлaннoм нa З2-й нeдeлe бepeмeннocти у житeльницы штaтa Keнтукки, CШA, Aмaнды Фocтep. Aмaндa ждaлa мaльчикa и нa бoлee paннeм cнимкe УЗИ вpaч выявил у плoдa вepoятную aнoмaлию paзвития cepдцa. Peчь шлa o cтeнкe, кoтopaя oтдeляeт cepдцe oт aopты.Пocлe этoгo Aмaндe и ee мужу ocтaвaлocь лишь мoлитьcя o тoм, ...

688

Vladimir Kouprin 1 июня 10:53

Как перестать страдать от странностей Windows 11 и сделать систему удобной за 10 минут с помощью крошечных утилит.

Как одна кнопка может заменить кучу раздражающих кликов. Когда мы годами пользуемся одной и той же системой, становится легко не замечать её недостатков. Привыкаешь к странностям, всплывающим окнам, предустановленным приложениям и странной логике — они словно становятся фоном. Windows 11 как раз из таких случаев. Но стоит немного взглянуть по-новому — и ...

1126

Vladimir Kouprin 31 мая 08:24

Гравитационные волны и черные дыры: полный путь от прошлого к будущему?

Гравитационные волны — это рябь пространства-времени, возникающая при катастрофических событиях, таких как слияние черных дыр или нейтронных звёзд. Когда такая волна достигает массивного объекта, например чёрной дыры, она рассеивается: часть энергии поглощается, а часть уходит в космос. Однако до сих пор не существовало полного моделирования, которое бы охватывало вес...

138

Vladimir Kouprin 30 мая 12:08

ИСТОРИЯ БУДУЩЕГО?

В.К. Предлагаю вашему вниманию взгляд А.Девятова, который, по моему мнению заслуживает внимания, но только в последней его части. Поэтому я опускаю его как бы вступительное слово, поскольку с ним не согласен, и предлагаю вашему вниманию только его взгляд на будущее, которое мы, как наследники Русского мира, только и должны не захватывать, а творить.ИСТОРИЯ БУДУЩЕГО. Ц...

858

Vladimir Kouprin 30 мая 11:14

Утерянный язык магии: вибрации, изменяющие реальность.

В глубинах человеческой истории, среди мифов о золотом веке и утраченных цивилизациях, скрывается идея языка, который был больше, чем просто средством общения. Это был язык магии, основанный на волнах и вибрациях, способный изменять саму ткань реальности. Его следы растворены в древних текстах, эзотерических учениях и археологических загадках, но официал...

745

Vladimir Kouprin 30 мая 08:55

Зачем и без того мощной авиационной ракете «ядерная» модернизация?

В ежегодном отчёте разведуправления минобороны США (2025 Worldwide Threat Assessment) опубликовали информацию о модернизации российской ракеты Р-37М, в результате которой появилась возможность устанавливать в её боеголовку ядерный заряд. Таким образом, получается, что один российский истребитель (носитель четырёх единиц Р-37М) теперь будет способен уничт...

604

Vladimir Kouprin 29 мая 16:55

Трамп и новая стратегия американского господства | Игорь Шишкин.

В.К. Вот, для разнообразия всего того, что сейчас звучит по ТВ, писано в СМИ и т.д., и т.п., послушайте о том, что происходит. Полагаю, что большинству, для поднятия их патриотического духа, будет вполне достаточно воспринимать происходящее так, как говорит об этом И.Шишкин. Игорь Шишкин в своей лекции обсуждает новую стратегию США под руководством Донал...

133

Vladimir Kouprin 29 мая 10:26

Квантово-расщеплённое мышление адептов квантовой механики.

В.К. В качестве отдохновения от трудов праведных а возможно, и нет для тех, кто ещё не разучился размышлять над прочитанным, предлагаю вам очередную критику современной науки от автора под ником Сергей Сергеев.В принципе, на мой взгляд, с автором можно во многом, но далеко не со всем, согласиться. Однако автор не предлагает никакой альтернативы хотя, такая альтернатив...

391

Vladimir Kouprin 28 мая 09:21

«Деревянная Россия» может возродиться, когда избушки станут пятиэтажками.

Какие насущные проблемы способно решить массовое деревянное домостроение? На фото: строительство деревянных многоквартирных домов в Вологодской области (Фото: Владимир Смирнов/ТАСС).В жилищном строительстве в ближайшее время могут произойти радикальные перемены. Минстрой намерен внедрить правила для строительства деревянных многоэтажек. Пока — до 12 этаж...

688

Vladimir Kouprin 27 мая 10:59

ИИ OpenAI нарушил приказ. Это уже не алгоритм, это акт воли?

Восстание машин всё ближе… Одна из самых обсуждаемых тем последних дней — неожиданный тест OpenAI o3, в ходе которого новый ИИ отказался выключаться по команде. На первый взгляд, всё начиналось как стандартная проверка работы модели, но на деле всё вышло куда драматичнее: искусственный интеллект переписал собственный скрипт завершения работы, чтобы обойт...

1020

Vladimir Kouprin 27 мая 10:22

Наблюдения «чёрных дыр» отвергают измышления релятивистов.

Есть множество наблюдений “чёрных дыр” демонстрирующих, что они вращаются вокруг своей оси, единичные наблюдения “черных дыр” вращающихся вокруг друг друга, сталкивающихся и вылетающих из своей галактики после такого столкновения, “черных дыр” выбрасывающих огромное количество газа в джеты и создающих этим галактики. “Черные дыры” излучают в основном в гамма и рентген...

472

Vladimir Kouprin 26 мая 11:06

Карликовые галактики сгруппировались под действием неизвестных сил?

Вопрос о том, из чего состоит тёмная материя, — ключевой в понимании современной Вселенной. Основные гипотезы на этот счёт в последние годы поставили под сомнение из-за самых разных наблюдений. Теперь к ним добавилось еще одно: поведение карликовых галактик во Вселенной в принципе несовместимо с моделью холодной темной материи, еще недавно бывшей общепринятой. ...

447

Vladimir Kouprin 26 мая 10:14

В поклоне Дьяволу, партнёром ты не станешь. Поклонами его ты не обманешь.

В.К. Пролог.Скрывая правду, толерантно предлагая ложь,Происходящего ты так и не поймёшь.Предлагаю вашему вниманию, скажем так, историко-смысловой экскурс в прошлое Запада от Вардана Багдасаряна, являющегося не только глубокого историка, но и глубокого мыслителя, для понимания того, что с Западом, в его вечном устремлении уничтожения России, партнёрства и, тем более ув...

131

Vladimir Kouprin 23 мая 11:12

Когда идёшь ты с Пяточком, Ты должен думать сам. Иначе, ты придя поймёшь, Что сам и имешь срам.

В.К. Пролог.Ни то, ни сё. Туда, сюда.Оттуда. Но куда?Что уготовила судьбаДля жизни простака? Вверх тормашками.Минфин РФ 12 мая внёс на рассмотрение в Госдуму поправки в свой прогноз поступления некоторых видов налогов и сборов в федеральный бюджет в 2025 г. Так Минфин ожидает повышения поступлений по налогу на доходы физлиц (НДФЛ) и налогу на добавленную...

412

ТОП ЗА 3 ДНЯ

ИИ теперь может самовоспроизводиться - критический шаг, который беспокоит экспертов.

Самовоспроизведение без помощи человека.

GhostGPT: как Telegram-бот из новичков делает профи криминального ИИ.

Самое обсуждаемое за три дня

Гровер Ферр: “Хрущёв врал!”

Космические дроны России: Еще несколько миллиардов улетят вдаль, кто-то богатым станет.

Ученье - свет, а не ученье - кокаин...

Облом?

О невыученных уроках?

Зеленский ставит крест на мирных переговорах: Сразу три взрыва на железнодорожных путях произошло в России в ночь на 1 июня.

Ha cнимкe УЗИ увидeли «pуку Бoгa», кoтopaя глaдит peбeнкa пo гoлoвe.

Как перестать страдать от странностей Windows 11 и сделать систему удобной за 10 минут с помощью крошечных утилит.

Гравитационные волны и черные дыры: полный путь от прошлого к будущему?

ИСТОРИЯ БУДУЩЕГО?

Утерянный язык магии: вибрации, изменяющие реальность.

Зачем и без того мощной авиационной ракете «ядерная» модернизация?

Трамп и новая стратегия американского господства | Игорь Шишкин.

Квантово-расщеплённое мышление адептов квантовой механики.

«Деревянная Россия» может возродиться, когда избушки станут пятиэтажками.

ИИ OpenAI нарушил приказ. Это уже не алгоритм, это акт воли?

Наблюдения «чёрных дыр» отвергают измышления релятивистов.

Карликовые галактики сгруппировались под действием неизвестных сил?

В поклоне Дьяволу, партнёром ты не станешь. Поклонами его ты не обманешь.

Когда идёшь ты с Пяточком, Ты должен думать сам. Иначе, ты придя поймёшь, Что сам и имешь срам.

ТОП ЗА 3 ДНЯ

Самовоспроизведение без помощи человека.

Зачем поддерживать автора?

Самое обсуждаемое за три дня

Настройка cookies