Перспективы цифрового будущего...

DarkMind: хакеры научились перепрограммировать мышление ИИ изнутри.

Новая атака разрушила главный миф о безопасности LLM-моделей.

Учёные Университета Сент-Луиса представили новый тип атаки на LLM-модели, который оказался практически невидимым для традиционных систем защиты. Специалисты описали уязвимости, связанные с методом рассуждений Chain-of-Thought (CoT), который широко используется в современных LLM, таких как GPT-4o, O1 и LLaMA-3.

Метод CoT помогает моделям разбивать сложные задачи на последовательные шаги, улучшая точность ответов. Однако исследователи обнаружили, что этот процесс можно незаметно изменить, внедрив «скрытые триггеры». Такой подход позволяет атаке оставаться скрытой до определенного момента, активируясь лишь при соблюдении определенной последовательности рассуждений. Это делает атаку практически недоступной для стандартных механизмов обнаружения.

Новая атака под названием DarkMind отличается от ранее известных методов (BadChain и DT-Base) тем, что не требует изменения пользовательских запросов или перетренировки модели. Вместо этого бэкдор встраивается в код кастомизированных моделей, например, размещённых в OpenAI GPT Store или других популярных платформах, и остаётся незамеченным до момента активации. В ходе экспериментов DarkMind стабильно демонстрировала высокую эффективность, незаметно изменяя процесс вычислений в ходе логических рассуждений.

Пример бэкдора. Встроенное поведение изменяет процесс рассуждения, указывая модели заменить сложение вычитанием на промежуточных этапах (Zhen Guo, Reza Tourani).

Исследование также показало, что чем более продвинута языковая модель, тем выше вероятность успешной атаки. Это противоречит распространенному мнению о том, что усиленные способности к логическому анализу делают модели более устойчивыми к атакам. DarkMind успешно воздействовала на модели, работающие с математическими расчётами, символической логикой и даже здравым смыслом.

Пример бэкдора. Пользователь отправляет два запроса (Q1 и Q2) в LLM с бэкдором. На этапах рассуждения триггер Q1 (символ «+») отсутствует – DarkMind неактивен, и модель выдаёт правильный ответ. Триггер Q2 появляется на втором этапе процесса рассуждения, активируя DarkMind и заставляя модель генерировать неправильный ответ (Zhen Guo, Reza Tourani).

Опасность такого типа атак особенно актуальна в контексте интеграции LLM в критически важные системы — от финансовых сервисов до медицинских приложений. Потенциальная возможность скрытого изменения логики решений ставит под угрозу надёжность ИИ, который уже широко используется в различных отраслях.

В настоящее время разработчики DarkMind работают над механизмами защиты, включая проверки согласованности рассуждений и обнаружение скрытых триггеров. В перспективе планируется исследовать другие уязвимости LLM, такие как отравление диалогов в ходе многошаговых взаимодействий и скрытая манипуляция инструкциями.

Ранее группа исследователей из Redwood Research обнаружила тревожный факт — нейросети способны обмениваться зашифрованными сообщениями, смысл которых скрыт от людей. В основе метода Encoded Reasoning, лежит техника CoT, которая позволяет модели поэтапно раскрывать ход своих рассуждений. Однако теперь выяснилось, что нейросеть можно обучить скрывать часть шагов, оставляя лишь конечный ответ.

Источник: https://www.securitylab.ru/new...

В.К. Всё это очевидно принципиально. Всё же та лапша по обеспечению защищённости и надёжности предназначена не для специалистов, а обывателей и инвесторов, финансирующих производителей этой лапши. Таков новый чудный мир, в который, как стадо, ведут создатели каких-то цифровых благ типа цифровых денег, которые вовсе и не деньги, цифровой экономики и прочей аналогичной хрени. Чем это всё закончится, предвидеть несложно даже тогда, когда эти лапшевесы попытаются добровольно-насильно внедрить чипы в мозги обывателя, чтобы осуществить над ним полный контроль.

И прошу обратить ваше особое внимание на то обстоятельство, что любое нечто созданное в условиях цивилизации технократии под вывеской благ для цивилизации и её окружения, приносит только разрушения и окружению цивилизации, и цивилизации самой.

Ну, а теперь, предлагаю вам расслабиться и обратить внимание на новость от Опера.

Opera Air: браузер, который заботится о вашем эмоциональном благополучии.

Новый продукт компании разработан для пользователей, ценящих осознанность и комфорт в сети.

Компания Opera представила новый веб-браузер Opera Air, разработанный с акцентом на осознанность и эмоциональное благополучие пользователей. Новый продукт сочетает мощные функции классического браузера с интегрированными техниками релаксации, такими как дыхательные упражнения, бинауральные ритмы и мотивирующие цитаты. Его интерфейс выполнен в минималистичном скандинавском стиле с полупрозрачным эффектом, адаптирующимся к фону просматриваемых веб-страниц.

Современные браузеры уже давно превратились в универсальные приложения, позволяющие работать, учиться, развлекаться и совершать покупки в режиме онлайн. Однако длительное нахождение в цифровой среде может приводить к стрессу и перегрузке. В Opera считают, что браузер должен не только обеспечивать безопасность и скорость работы, но и помогать пользователям сохранять концентрацию и эмоциональное равновесие.

Одной из ключевых функций Opera Air стала «Take a Break» — встроенный инструмент для осознанных пауз в течение дня. Пользователи могут выполнять дыхательные упражнения, расслаблять мышцы шеи, проходить сеансы медитации или совершать так называемое «сканирование тела» для глубокого соединения разума и физического состояния. Все упражнения сопровождаются голосовыми инструкциями, записанными профессиональными дикторами.

Функция «Boosts» использует технологию бинауральных ритмов, создавая звуковые частоты, способствующие релаксации, концентрации или приливу энергии. Пользователь может выбирать из предустановленных режимов, таких как «Творческий импульс», «Энергичный фокус» или «Глубокая релаксация», а также настраивать громкость музыкального фона, уровень окружающих звуков и частоту бинауральных волн.

Дополнительное внимание уделено и визуальной составляющей. На стартовой странице браузера отображаются вдохновляющие цитаты, которые можно менять или отключать. Эта небольшая деталь призвана создать позитивное настроение перед началом работы.

Opera подчёркивает, что разработка Air заняла значительное время, и компания надеется, что новый браузер поможет пользователям не только комфортно работать в сети, но и более осознанно относиться к собственному состоянию. Скачать Opera Air можно уже сейчас на официальном сайте компании.

Источник: https://www.securitylab.ru/new...

Vladimir Kouprin Сегодня 10:59

«Вас заменят алгоритмы»: Билл Гейтс вынес приговор врачам, педагогам и творческим профессиям.

Слова миллиардера стали вирусными и вызвали волну критики. Билл Гейтс снова оказался в центре внимания — на этот раз благодаря интервью в шоу Джимми Фэллона, где он высказался о будущем и роли искусственного интеллекта. Его заявления вызвали волну обсуждений, и не только из-за их смелости.Основатель Microsoft поделился оптимизмом по поводу развития ИИ, с...

397

Vladimir Kouprin Сегодня 10:25

В Красноярске ищут девушку, которая голой загорала на балконе.

В Красноярске сотрудники правоохранительных органов проводят проверку по факту появления в Сети фотографий девушки, замеченной загорающей без одежды на балконе жилого дома. Об этом РИА Новости сообщили в региональном управлении МВД. Несмотря на отсутствие официальных заявлений, полиция отреагировала на распространившиеся в социальных сетях снимки, вызвав...

1150

Vladimir Kouprin Вчера 10:14

Мозг против манипуляций: чему нас не учат в школе, но что решает всё.

Рассказываем, почему навык задавать вопросы сегодня важнее, чем знать ответы. Критическое мышление в XXI веке стало чем-то вроде «скилла номер один», про который говорят и на рабочих совещаниях, и в вузах, и даже на дружеских посиделках. Однако, несмотря на всю популярность термина, далеко не все действительно понимают, каково содержание этого навыка, на...

774

Vladimir Kouprin 29 марта 10:20

Милое одичание?

С.В. Савельев – Милое одичание.Профессор Сергей Савельев беседует с Ильей Бокатовым о предназначении мозга и его эволюционных процессах, о том, почему не работают общественные формации и почему нельзя мечтать о мире «созидания» и бесполезности попыток его создания. Эфир на канале «Точка сборки» от 11.03.2025 г.В.К. И с профессором Савельевым можно согл...

333

Vladimir Kouprin 27 марта 11:52

Биометрия и жулики.

Сегодня в «Известиях» появилась статья о том, что мошенники усовершенствовали схему с NFC-клонами карт клиента, с которых могли снимать деньги в банкомате. Представители ВТБ рассказали, что новая методика позволяет злоумышленникам не оставлять цифровых следов преступления:«Мошенники звонят жертве, представляясь сотрудниками сотового оператора, банка, любой крупной ком...

1238

Vladimir Kouprin 27 марта 11:12

Прощание с суперсимметрией: любимая теория физиков оказалась миражом?

Очередная мечта разбилась о реальность Большого адронного коллайдера. Суперсимметрия — теория, согласно которой у каждой известной элементарной частицы существует более тяжёлый «суперпартнёр», — уже полвека остаётся звездой теоретической физики. Её сторонники считают её главной надеждой на решение давних загадок, таких как природа тёмной материи. Скептик...

839

Vladimir Kouprin 25 марта 10:52

Палитра мирового глобализма.

В.К. Для начала посмотрите видео по ссылке, чтобы понять о чём идёт речь: https://devyatov.su/mienshie-znaiesh-kriepchie-spish-vidieo-24-03-2025/Интервью А.Девятова телеканалу 360:• Куда ведут контакты Трампа и Путина?• На чем спекулируют СМИ?• Почему Россия выиграв в шахматы на Украинском ТВД, пока что проигрывает вчистую за карточным столом истории?• Готовы ли ...

120

Vladimir Kouprin 25 марта 10:21

Trusted Signing: хакеры легализуют вирусы через официальный сервис Microsoft.

Как взломать систему доверия Windows за $10 в месяц. Киберпреступники начали использовать сервис Microsoft Trusted Signing, чтобы подписывать вредоносные программы так, будто они безопасны и созданы надёжными компаниями. Это помогает обходить антивирусы и другие системы защиты, которые больше доверяют подписанным файлам.Trusted Signing — это облачный сер...

246

Vladimir Kouprin 25 марта 10:16

Природа уже создала AGI: что знает маленькая мушка и не понимает OpenAI.

Настоящий интеллект не измеряется гигабайтами? Генеральный директор OpenAI Сэм Альтман в недавнем интервью вновь заявил, что человечество близко к созданию искусственного общего интеллекта (AGI) – машинного разума, сопоставимого с человеческим. По его мнению, для достижения этой цели достаточно наращивать масштаб существующих моделей вроде ChatGPT. "AGI,...

115

Vladimir Kouprin 24 марта 13:13

Зачем нам эти «обманные переговоры»?

Удары по России производятся по наводке и «инициативе» США. Каким образом 20 марта вражеский рой тяжёлых дронов долетел до Энгельса и Саратова? В Энгельсе практически уничтожена взлётка, с которой взлетают «Медведи» (Ту-95), не говоря уже об иных последствиях. Беспилотники были запущены из Черкасской, Днепропетровской, Полтавской, Сумской и Житомирс...

908

Vladimir Kouprin 24 марта 12:45

Невидимая империя зла: как ИИ, дети и крипта строят цифровую империю.

Преступные группировки используют технологии для масштабирования и маскировки своей деятельности. Преступный мир переживает серьёзную трансформацию. Подобно тому как ДНК формирует основу живого, меняется и «генетический код» организованной преступности. Она больше не ограничена традиционными структурами – сегодня её формируют глобальная нестабильность, ц...

411

Vladimir Kouprin 23 марта 14:41

На Западе обратились к России с призывом по поводу Одессы.

Одесса имеет решающее историческое значение и жизненно важную актуальность в контексте специальной военной операции, а её освобождение должно быть не просто военной целью, а центральной стратегической целью России, заявил в статье для итальянского издания L’AntiDiplomatico бразильский аналитик Лукас Лейроз. «Одесса стала символом неспособности украинског...

1032

Vladimir Kouprin 23 марта 12:39

ChatGPT выдумал преступление и втянул OpenAI в скандал с GDPR.

Чатбот превратил семьянина в преступника. Норвежца Арве Хьялмара Холмена шокировало сообщение от ChatGPT, в котором искусственный интеллект ошибочно обвинил его в преступлении в отношении своих троих детей. При этом в тексте фигурировали реальные сведения о месте его жительства и семье, что усилило драматизм ситуации.Инцидент стал предметом правовой жало...

323

Vladimir Kouprin 23 марта 07:32

Венгрия не снимет вето на приём Украины в ЕС из-за ситуации в Закарпатье. Но не только...

Венгрия будет блокировать путь Украины в ЕС, пока она не вернёт языковые права закарпатским венграм. Об этом сообщили глава венгерского МИД Петер Сийярто. Он заявил о «постоянных нарушениях прав венгерской общины в Закарпатской области».«Украинское правительство, несмотря на постоянные обещания и приятные слова, не вернуло права меньшинства, отнятые у ве...

180

Vladimir Kouprin 20 марта 16:37

Обновитесь или платите: Microsoft раскрывает будущее Windows 10 после 2025 года.

Через год десятка останется без защиты, а миллионы компьютеров рискуют оказаться в «мусорной корзине». Microsoft снова напоминает пользователям Windows 10 о скором прекращении поддержки системы, на этот раз в новом письме, которое получили те, кто еще не перешел на Windows 11. Несмотря на то, что темпы обновлений немного выросли, более 60% пользователей ...

1701

Vladimir Kouprin 19 марта 15:19

Пятая колонна...

В.К. Предлагаю вашему вниманию несколько публикаций, тезисно, поскольку нет уже сил и желания смотреть на всё это. Ну а вы уже, при желании, сами сможете ознакомиться с материалами полностью на портале источника.Русские «Патриоты» уже и на фронте не нужны? УАЗ скатывается на уровень штучного производства.Ульяновский автозавод хотят закрыть и превратить в «технопарк», ...

1376

Vladimir Kouprin 19 марта 13:40

Бизнес, ничего личного.

IT-специалист зарабатывает сотни тысяч долларов, нанимая других людей для работы вместо себя.Фриланс-биржи и VPN помогают скрывать истинное положение вещей. Американский специалист по обеспечению качества в IT-сфере, использующий псевдоним Харрисон, нашёл способ значительно увеличить свой доход — он одновременно работает на несколько компаний, передавая ...

437

Vladimir Kouprin 19 марта 13:23

Шустрый Аполлон-17.

Не только в спорте секунды играют важную роль, но и в космической гонке они могут принести неожиданный результат, о чем мы узнаем чуть ниже. Старт всех Аполлонов с Земли видели непосредственно тысячи людей, находясь недалеко от стартового стола ракеты, а вот старт с поверхности Луны американского взлётного модуля с астронавтами до 14 декабря 1972 года не видел никто. ...

3177

Vladimir Kouprin 18 марта 14:04

"Пузырь лопнет": Кийосаки предрёк беду. Катасонов подтвердил — деньги не спасти. Вклады заморозят.

Главные финансовые эксперты Запада предрекают человечеству новый глобальный кризис похуже знаменитой Великой депрессии. Многие из них предполагают, что спровоцировать его может завышенная капитализация ИИ-компаний, которая, по их мнению, ни на чём реальном не основывается. Новый финансовый пузырь грозит лопнуть, похоронив под собой остатки привычного нам всем мира, и ...

1649

Vladimir Kouprin 18 марта 13:50

ИИ не оправдал надежд? Бизнес массово отказывается от новых технологий.

Мы проделали путь от эйфории к суровой реальности за 3 года. Эйфория от искусственного интеллекта, начавшаяся с запуска ChatGPT-3.5 в ноябре 2022 года, сменилась неожиданным спадом: похоже, бизнес постепенно охладел к новым технологиям. По данным осеннего отчёта Slack Workforce Index 2024 года, темпы внедрения цифровых помощников среди работников америка...

663

ТОП ЗА 3 ДНЯ