• РЕГИСТРАЦИЯ

Перспективы цифрового будущего...

2 277

DarkMind: хакеры научились перепрограммировать мышление ИИ изнутри.

Новая атака разрушила главный миф о безопасности LLM-моделей.

Учёные Университета Сент-Луиса представили новый тип атаки на LLM-модели, который оказался практически невидимым для традиционных систем защиты. Специалисты описали уязвимости, связанные с методом рассуждений Chain-of-Thought (CoT), который широко используется в современных LLM, таких как GPT-4o, O1 и LLaMA-3.

Метод CoT помогает моделям разбивать сложные задачи на последовательные шаги, улучшая точность ответов. Однако исследователи обнаружили, что этот процесс можно незаметно изменить, внедрив «скрытые триггеры». Такой подход позволяет атаке оставаться скрытой до определенного момента, активируясь лишь при соблюдении определенной последовательности рассуждений. Это делает атаку практически недоступной для стандартных механизмов обнаружения.

Новая атака под названием DarkMind отличается от ранее известных методов (BadChain и DT-Base) тем, что не требует изменения пользовательских запросов или перетренировки модели. Вместо этого бэкдор встраивается в код кастомизированных моделей, например, размещённых в OpenAI GPT Store или других популярных платформах, и остаётся незамеченным до момента активации. В ходе экспериментов DarkMind стабильно демонстрировала высокую эффективность, незаметно изменяя процесс вычислений в ходе логических рассуждений.

Пример бэкдора. Встроенное поведение изменяет процесс рассуждения, указывая модели заменить сложение вычитанием на промежуточных этапах (Zhen Guo, Reza Tourani).

Исследование также показало, что чем более продвинута языковая модель, тем выше вероятность успешной атаки. Это противоречит распространенному мнению о том, что усиленные способности к логическому анализу делают модели более устойчивыми к атакам. DarkMind успешно воздействовала на модели, работающие с математическими расчётами, символической логикой и даже здравым смыслом.

Пример бэкдора. Пользователь отправляет два запроса (Q1 и Q2) в LLM с бэкдором. На этапах рассуждения триггер Q1 (символ «+») отсутствует – DarkMind неактивен, и модель выдаёт правильный ответ. Триггер Q2 появляется на втором этапе процесса рассуждения, активируя DarkMind и заставляя модель генерировать неправильный ответ (Zhen Guo, Reza Tourani).

Опасность такого типа атак особенно актуальна в контексте интеграции LLM в критически важные системы — от финансовых сервисов до медицинских приложений. Потенциальная возможность скрытого изменения логики решений ставит под угрозу надёжность ИИ, который уже широко используется в различных отраслях.

В настоящее время разработчики DarkMind работают над механизмами защиты, включая проверки согласованности рассуждений и обнаружение скрытых триггеров. В перспективе планируется исследовать другие уязвимости LLM, такие как отравление диалогов в ходе многошаговых взаимодействий и скрытая манипуляция инструкциями.

Ранее группа исследователей из Redwood Research обнаружила тревожный факт — нейросети способны обмениваться зашифрованными сообщениями, смысл которых скрыт от людей. В основе метода Encoded Reasoning, лежит техника CoT, которая позволяет модели поэтапно раскрывать ход своих рассуждений. Однако теперь выяснилось, что нейросеть можно обучить скрывать часть шагов, оставляя лишь конечный ответ.

Источник: https://www.securitylab.ru/new...

В.К. Всё это очевидно принципиально. Всё же та лапша по обеспечению защищённости и надёжности предназначена не для специалистов, а обывателей и инвесторов, финансирующих производителей этой лапши. Таков новый чудный мир, в который, как стадо, ведут создатели каких-то цифровых благ типа цифровых денег, которые вовсе и не деньги, цифровой экономики и прочей аналогичной хрени. Чем это всё закончится, предвидеть несложно даже тогда, когда эти лапшевесы попытаются добровольно-насильно внедрить чипы в мозги обывателя, чтобы осуществить над ним полный контроль.

И прошу обратить ваше особое внимание на то обстоятельство, что любое нечто созданное в условиях цивилизации технократии под вывеской благ для цивилизации и её окружения, приносит только разрушения и окружению цивилизации, и цивилизации самой.

Ну, а теперь, предлагаю вам расслабиться и обратить внимание на новость от Опера.

Opera Air: браузер, который заботится о вашем эмоциональном благополучии.

Новый продукт компании разработан для пользователей, ценящих осознанность и комфорт в сети.

Компания Opera представила новый веб-браузер Opera Air, разработанный с акцентом на осознанность и эмоциональное благополучие пользователей. Новый продукт сочетает мощные функции классического браузера с интегрированными техниками релаксации, такими как дыхательные упражнения, бинауральные ритмы и мотивирующие цитаты. Его интерфейс выполнен в минималистичном скандинавском стиле с полупрозрачным эффектом, адаптирующимся к фону просматриваемых веб-страниц.

Современные браузеры уже давно превратились в универсальные приложения, позволяющие работать, учиться, развлекаться и совершать покупки в режиме онлайн. Однако длительное нахождение в цифровой среде может приводить к стрессу и перегрузке. В Opera считают, что браузер должен не только обеспечивать безопасность и скорость работы, но и помогать пользователям сохранять концентрацию и эмоциональное равновесие.

Одной из ключевых функций Opera Air стала «Take a Break» — встроенный инструмент для осознанных пауз в течение дня. Пользователи могут выполнять дыхательные упражнения, расслаблять мышцы шеи, проходить сеансы медитации или совершать так называемое «сканирование тела» для глубокого соединения разума и физического состояния. Все упражнения сопровождаются голосовыми инструкциями, записанными профессиональными дикторами.

Функция «Boosts» использует технологию бинауральных ритмов, создавая звуковые частоты, способствующие релаксации, концентрации или приливу энергии. Пользователь может выбирать из предустановленных режимов, таких как «Творческий импульс», «Энергичный фокус» или «Глубокая релаксация», а также настраивать громкость музыкального фона, уровень окружающих звуков и частоту бинауральных волн.

Дополнительное внимание уделено и визуальной составляющей. На стартовой странице браузера отображаются вдохновляющие цитаты, которые можно менять или отключать. Эта небольшая деталь призвана создать позитивное настроение перед началом работы.

Opera подчёркивает, что разработка Air заняла значительное время, и компания надеется, что новый браузер поможет пользователям не только комфортно работать в сети, но и более осознанно относиться к собственному состоянию. Скачать Opera Air можно уже сейчас на официальном сайте компании.

Источник: https://www.securitylab.ru/new...

Что же вы творите, люди?! Опомнитесь!

    «Русские всегда держат слово», разморозка русских активов и рост силы русского паспорта

    1. Одна из причин, по которым современная Россия выигрывает на дипломатическом фронте, заключается в прочности нашего слова. Иностранцы знают, что США, например, обязательно их кинут, тогда как ру...

    Daily Express, Великобритания. Лавров на G20 показал, что речь Лэмми просто болтовня, не стоящая внимания
    • pretty
    • Вчера 20:05
    • В топе

    На встрече G20 Лавров продемонстрировал высший класс дипломатии, отказавшись слушать пустые упреки главы британского МИДа. Не отреагировав на провокацию, министр доказал, что его уровень политической ...

    Путин: Благодаря разработанным в России материалам боеголовки ракеты «Орешник» выдерживают температуру Солнца
    • Topwar
    • Вчера 19:35
    • В топе

    Боеголовки новейшей российской гиперзвуковой баллистической ракеты средней дальности «Орешник» выдерживают нагрев, равный температуре на поверхности Солнца. Этого удалось дости...

    Ваш комментарий сохранен и будет опубликован сразу после вашей авторизации.

    0 новых комментариев

      Vladimir Kouprin Вчера 09:09

      Кто утопил Koala: «Северные потоки» и танкеры в трех морях взорвали одноклассники с юга Украины.

      «Советский Союз создал лучшую в мире школу подводных диверсантов. Сейчас эта школа принадлежит киевскому режиму». Западное агентство Reuters обратило внимание на то, на то, что взрывы танкеров стали частым явлением, хотя раньше такого не было.Не будем перечислять все инциденты последних месяцев. Танкеры, зафрахтованные Россией, в текущем квартале, терпел...
      599
      Vladimir Kouprin 19 февраля 11:51

      Так, что там с "Кольцом анаконды"...

      В.К. И действительно, что же там с "Кольцом анаконды", по-прежнему оно остаётся конспирологией или переводится в плоскость реальной геополитики?Как я и писал ранее неоднократно, США ведут борьбу за своё выживание в попытках противодействия "Планировщику", которому не нужны ни США, ни кто-либо ещё и особенно Россия, вернее, ещё пока сохранившийся, многонациональный рус...
      190
      Vladimir Kouprin 18 февраля 10:25

      Ловушка для России (продолжение).

      Стратегическое соглашение с Западом или же новый виток противостояния? Игорь Шишкин.Политолог Игорь Шишкин о том возможно ли стратегическое соглашение между Россией и Западом. /?r=plemwd В.К. И с И.Шишкиным трудно не согласиться тем более, что я обращаю ваше внимание на это давно и постоянно - вурдалак не может стать вегетарианцем, это пр...
      634
      Vladimir Kouprin 18 февраля 09:08

      Ловушка для России.

      В.К. Пока ура-патриоты с криками Ура! сообщают об очередной победе российских войск на Украине, а, не обращающие внимания на политические расстановки граждане, не отрывая своего внимания от телевизионных пропагандистских шоу, им внемлют, Запад начинает захлопывать ловушку, удачно сооружённую им, для кремлёвских башен. На фоне и в преддверии переговоров Т...
      243
      Vladimir Kouprin 16 февраля 10:46

      Дж. Д. Вэнса мир так и не услышал, как и не услышал ранее Сталина и Мао.

      В.К. Выступая на Мюнхенской конференции по безопасности, Вэнс обратился не только к европейцам, но и, можно сказать, ко всему миру и к России в  том числе, но миром так и не был услышан, как ранее миром не были услышаны Сталин и Мао. К 75-летию договора о дружбе и союзе с Китаем. Настоятельно рекомендую ознакомиться с видео по ссылке:h...
      197
      Vladimir Kouprin 15 февраля 11:16

      Шеф Пентагона Хегсет: Трамп сам решит, передавать ли Киеву ядерное оружие.

      Окончательное решение о возможности передачи Украине ядерного оружия остаётся за президентом Дональдом Трампом, заявил министр обороны США Пит Хегсет в интервью порталу Breitbart News. Он подчеркнул, что глава Белого дома обладает всеми компетенциями для принятия столь сложного решения.“Это работа президента. Он – лидер, он – мастер переговоров и заключе...
      398
      Vladimir Kouprin 15 февраля 10:46

      ИИ подложил факты и подставил юристов в суде.

      Слепая вера ИИ превратила адвокатов в обвиняемых. Суд округа Вайоминг потребовал объяснений от группы адвокатов, которые представили суду фальшивые судебные прецеденты. Выяснилось, что юристы использовали искусственный интеллект для подготовки документов, но система сгенерировала несуществующие дела.Иск против Walmart и Jetson Electronic Bikes, Inc. был ...
      490
      Vladimir Kouprin 13 февраля 15:23

      Запад построился «свиньёй» и ждёт Александра Невского.

      Тысяча лет крестоносной чумы — смерть сеяли на Востоке, в Греции, Византии, теперь вот на Украине. Фото: репродукция картины Шарля-Филиппа Ларивьер.Наиболее близкий аналог вооружённого конфликта на Украине — Первый крестовый поход 1096−1099 годов. Давайте я это коротко обосную.Коллективный Запад ополчился на Россию. Из десятков стран на Украину едут толп...
      809
      Vladimir Kouprin 13 февраля 14:39

      БУДЕМ ЖИТЬ ПЛОХО, НО НЕ ДОЛГО.

      Куда ведёт Россию концепция многополярного мира? МОСКВА, 5 фев. - РИА Новости. «Заявление госсекретаря США Марко Рубио о многополярности мира совпадает с видением Москвы, Россия, конечно, это приветствует», – заявил пресс-секретарь президента РФ Дмитрий Песков.По поводу этих заявлений небополитика имеет следующее мнение:Многополярность обрекла РФ на стра...
      287
      Vladimir Kouprin 13 февраля 13:43

      «В Кремле сегодня пьют водку, это большой день для Москвы», — экс-советник Трампа Болтон.

      «Путин не может быть счастливее. Сегодня в Кремле пьют водку прямо из бутылки. Это большой день для Москвы»: так экс-советник Дональда Трампа Джон Болтон прокомментировал в эфире CNN вчерашний разговор президентов России и США. По мнению экс-советника Трампа по нацбезопасности, президент США «эффективно сдался» Путину.Слова Болтона подтверждают общий нас...
      174
      Vladimir Kouprin 7 февраля 09:56

      Как жаль, что много не видим мы, карманы пришивая на штаны.

      В.К. Вспоминая своё четверостишье, предложенное вашему вниманию ранее, я пытаюсь уже обратить ваше внимание на то, что происходит вокруг нас и с нами самими.Дебилы во власти, -Хуже всякой напасти.Подонки во власти не для забавыИ это, по сути, гибель державы.И вот, в связи с этим, предлагаю послушать Е.Спицина, хорошо и вполне откровенно разложившего по полочкам то, к ...
      427
      Vladimir Kouprin 6 февраля 09:28

      Белый дом обнародовал список самых «важных» и нелепых трат USAID.

      Миллиарды долларов, были направлены на создание систем орошения и приобретение удобрений в Афганистане. Эти удобрения применяются для изготовления героина.На счёт организации, которая имеет отношение к террористической деятельности, было перечислено несколько сотен тысяч долларов. Также были выделены средства на обеспечение боевиков «Аль-Каиды»* — 100 ты...
      506
      Vladimir Kouprin 6 февраля 09:19

      Google снимает запрет: теперь их ИИ можно использовать в военных целях.

      Alphabet, материнская компания Google, недавно внесла серьёзные изменения в свою этическую хартию, отменив некоторые обещания, данные несколько лет назад, в частности запрет на использование моделей искусственного интеллекта в военных целях. В 2018 году более 3 000 сотрудников Google протестовали против участия компании в Project Maven, программе военных...
      174
      Vladimir Kouprin 5 февраля 11:53

      Отравление данных в ИИ: возможные угрозы, их обнаружение и профилактика.

      Даже незначительные отклонения способны привести к необратимым последствиям. Следует дважды подумать, прежде чем доверять своему ИИ-ассистенту, ведь отравление базы данных может значительно изменить его выводы — и даже сделать их опасными.Современные технологии далеки от совершенства — это наглядно демонстрируют многочисленные уязвимости, которые продолж...
      385
      Vladimir Kouprin 5 февраля 10:59

      И волки будут сыты, и овцы целы?

      В.К. А.Девятов давно предлагает в рамках китайского проекта "единый путь", как он называет, "альтернативу для севморпути". Однако, как известно, а воз и ныне там.АЛЬТЕРНАТИВА ДЛЯ СЕВМОРПУТИ.Связать РФ с КНР можно по рекам Обь и ИртышПонимание смыслов достигается не логикой убеждений, но лишь сравнением с другим. Таким «другим» выступает транссибирский транспортный мар...
      205
      Vladimir Kouprin 4 февраля 11:15

      Европа запретила ИИ манипулировать людьми.

      За нарушение запрета на опасный ИИ – 7% годового оборота. В Европейском союзе вступил в силу первый этап регулирования ИИ: с 2 февраля запрещены системы, которые несут «неприемлемый риск» для общества. Это часть масштабного Акта об искусственном интеллекте, принятого в марте 2023 года после долгих обсуждений.ЕС разделил ИИ-системы на четыре категории рис...
      391
      Vladimir Kouprin 3 февраля 12:03

      От четырёхствольного вертолётного ЯкБ-12,7 не спасётся ни одна “Баба Яга”.

      В.К. В сети появилась вот такая восторженная реляция от якобы военных аналитиков. Наиболее мощным средством поражения вражеских тяжёлых дронов “Баба Яга” стал четырёхствольный пулемёт ЯкБ-12,7. В Telegram-канале “Военач” представлена фотография такого оружия, доработанного для выполнения специфических задач противовоздушной обороны. На нем имеются коллим...
      2274
      Vladimir Kouprin 3 февраля 11:06

      Мир в огне: горячие точки, игнорируемые Западом.

      Мир становится более опасным местом, и это не просто убеждение. Отмечается рост числа конфликтов и угроз, которые плохо управляются и продолжают расти. Глобальные конфликты удвоились за последние пять лет, а случаи политического насилия в 2024 году увеличились на 25% по сравнению с 2023 годом. Одним из ярких примеров является конфликт на восточной границе Демократичес...
      318
      Vladimir Kouprin 3 февраля 10:19

      Зеленский сделал НАТО странное предложение?

      Владимир Зеленский назвал украинскую армию бонусом для Североатлантического альянса. Об этом глава киевского режима заявил в интервью Associated Press. «Украинская армия численностью 800 тысяч человек стала бы бонусом для альянса, особенно если Трамп захочет вернуть домой американские войска, дислоцированные за границей», — говорится в публикации.Глава к...
      218
      Vladimir Kouprin 1 февраля 12:04

      Экосистема Созидания – новая нравственная парадигма развития для стран БРИКС и всего человечества.

      Сегодня Вице-президент Экспертного Совета Высокого Уровня БРИКС, д.э.н., профессор Виктор Алексеевич Ефимов представил значимый доклад на пленарном заседании в Москве «Миротворчество – как основа построения многополярного мира». ✨Тема его выступления: «Экосистема Созидания – новая нравственная парадигма развития для стран БРИКС и всего человечества». ...
      494
      Служба поддержи

      Яндекс.Метрика