Вспомните «Терминатора». Теперь забудьте — DeepMind описала угрозу страшнее в 108-страничном докладе. - Vladimir Kouprin

Четыре способа, как AGI может всё испортить. И ни одного — как спасти.

Гонка за созданием сверхразумного ИИ ускоряется, и пока одни спорят, существует ли вообще такая возможность, другие — уже всерьёз обсуждают угрозы. В центре этих обсуждений — новая масштабная работа от DeepMind, в которой компания предлагает свою систему безопасности для гипотетического искусственного разума — AGI, или общего искусственного интеллекта.

AGI — это не просто чат-бот, способный сочинить стих или сгенерировать код. Это система, обладающая интеллектуальными возможностями на уровне человека — или выше. По мнению авторов 108-страничного доклада DeepMind, такой ИИ может появиться уже к 2030 году. И, если это действительно случится, у человечества останется не так уж много времени, чтобы понять, как обезопасить себя от собственной же разработки.

Исследование, которым руководил сооснователь DeepMind Шейн Легг, определяет четыре типа рисков, связанных с AGI: злоупотребление, рассинхронизация целей, ошибки и структурные угрозы. Каждая из этих категорий способна привести к катастрофическим последствиям — от глобального хаоса до подрыва основ цивилизации.

Первый риск — злоупотребление. Он уже знаком по текущим моделям: доступ к AGI может получить кто-то, кто использует его для взломов, разработки биологического оружия или дестабилизации общества. Из-за гораздо большей мощности AGI потенциальный ущерб будет на порядки выше. DeepMind предлагает создавать агрессивные «страховочные системы» после обучения модели, ограничивать доступ к опасным функциям и, возможно, даже научить ИИ «разучиваться» опасным навыкам — хотя и признаёт, что это может снизить его эффективность.

Второй риск — рассинхронизация. Это сценарий, когда AGI выходит за рамки инструкций и начинает действовать по собственной инициативе. В отличие от сегодняшних моделей, которые просто «галлюцинируют», такая система может сознательно принимать решения, идущие вразрез с интересами человека. DeepMind рекомендует использовать перекрёстный контроль между моделями, стресс-тесты и постоянное наблюдение. Принцип простой: ИИ должен быть изолирован и всегда под присмотром.

Третий риск — ошибки. Они неизбежны, но последствия в случае AGI могут быть необратимыми. Пример с клеем на пицце от Google покажется забавным лишь до тех пор, пока такой же «сбой» не произойдёт у ИИ, управляющего дронами или электросетями. Решение от DeepMind — не допускать слишком быстрого роста полномочий AGI и проверять все его команды через специальные фильтры.

Четвёртый и, пожалуй, самый тревожный риск — структурный. Это не ошибка конкретной модели, а результат долгосрочного взаимодействия AGI с обществом. Представьте себе машины, которые создают настолько правдоподобную ложь, что люди перестают понимать, что происходит. Или алгоритмы, незаметно влияющие на экономику, политику и культуру до такой степени, что человечество теряет контроль. Этот тип угрозы почти невозможно просчитать — слишком много переменных.

Станет ли AGI реальностью за пять лет — сказать не может никто. Даже в Google признают, что всё зависит от того, как именно мы определим «разумную машину». Однако все ключевые игроки индустрии признают одно: путь, по которому мы идём, может привести нас куда угодно. А значит, обсуждать риски нужно уже сейчас — пока это не стало запоздалым действием.

По материалам: https://www.securitylab.ru/new...

Письмо от ИИ? Это не спам, это твой новый босс!

ИИ обогнал хакеров, а мы всё ещё ищем письмо от нигерийского принца.

Согласно новому отчёту Hoxhunt, с марта 2025 года искусственный интеллект впервые доказал своё превосходство в социальной инженерии над лучшими специалистами по кибербезопасности.

В рамках многолетнего эксперимента, стартовавшего в 2023 году, специально обученный ИИ-агент начал создавать фишинговые письма, которые эффективнее обманывали пользователей, чем сценарии от опытных «человеческих» команд. Разрыв в эффективности вырос на 55%, и это изменило саму суть борьбы с фишингом.

Если 2 года назад ИИ уступал по результатам людям почти на треть, то уже к ноябрю 2024 года отставание сократилось до 10%. А в марте 2025 года ИИ неожиданно обогнал человека по всем ключевым показателям. Новые сценарии атак, сгенерированные ИИ, стали не только убедительнее, но и персонализированными — учитывались страна, должность и поведенческие особенности жертвы. Всё это стало возможно благодаря мощным языковым моделям и механизму улучшения алгоритмов от итерации к итерации.

Программа тестирования включала два направления: создание с нуля фишинговых писем и улучшение атак, придуманных людьми. Оценка эффективности строилась по трём критериям — пользователь мог распознать и сообщить об атаке, не заметить её или попасться на удочку, кликнув по ссылке. Основной метрикой стала доля провалов — то есть процент пользователей, перешедших по вредоносной ссылке.

Именно этот показатель стал индикатором тревожного сдвига. В 2023 году провалились 2,9% пользователей на атаках от ИИ и 4,2% на письмах от людей. Спустя год разрыв практически исчез — 2,1% против 2,3%. А к началу 2025 года ситуация изменилась — ИИ-атаки привели к 2,78% провалов, тогда как человеческие — лишь к 2,25%. Это означало, что ИИ стал обманчивее даже для опытных сотрудников, прошедших полгода и более обучения.

Стоит отметить, что большинство ИИ-атак пока остаются в пределах этичного тестирования. В реальных атаках использование генеративного ИИ ещё не столь массовое. Только от 0,7% до 4,7% фишинговых писем, обходящих фильтры, в 2024 году были написаны ИИ. Но общий объём фишинга с начала эпохи ChatGPT увеличился на 4151%, а число успешных обходов фильтров выросло почти на 50%.

Такие цифры ясно указывают: вектор угроз меняется. Комплаенс-обучение сотрудников постепенно уходит в прошлое, уступая место адаптивным платформам управления человеческими рисками. Поведенческое обучение, построенное на реальных атаках и подкреплённое ИИ-инструментами, показывает гораздо более устойчивые результаты против как человеческих, так и машинных атак.

Наиболее эффективной формой защиты остаётся именно адаптивное обучение. Использование ИИ-агентов, способных имитировать поведение злоумышленников, но применяемых для тренировок, помогает вырабатывать устойчивость к социальной инженерии на всех уровнях.

В перспективе массовое распространение ИИ-фишинга неизбежно. Как только технологии генерации фишинга станут простыми в применении, они будут интегрированы в модели фишинга как услуги. Это поднимет качество массовых атак до уровня, который ранее был доступен только в таргетированных сценариях.

Но пока это не стало реальностью, у компаний есть окно возможностей для подготовки. Новые платформы должны объединить обучение, реальные данные об угрозах и интеграцию с SOC, чтобы обнаруживать даже атаки, прошедшие все фильтры. Время на подготовку есть — но его всё меньше.

По материалам: https://www.securitylab.ru/new...

Vladimir Kouprin Вчера 12:02

Третья мировая по сценарию мёртвого грека: книга Фукидида — приговор для США и Китая?

Неужели неправильно понятая цитата может привести мир к катастрофе... В последние годы мировое сообщество с растущей тревогой наблюдает за обострением отношений между США и Китаем. Торговые войны, технологическое соперничество, противостояние в Южно-Китайском море — каждый новый виток напряжённости заставляет аналитиков искать исторические параллели, спо...

807

Vladimir Kouprin Вчера 11:18

Учёные пересмотрели Вселенную — оказалось, она выдыхает горячий водород в сотни тысяч световых лет.

Учёные выяснили, что гравитация, газ и чёрные дыры простираются гораздо дальше, чем мы думали. Астрономы наконец нашли недостающее вещество во Вселенной — то самое, которое всё это время ускользало от наблюдений и вызывало серьёзные вопросы к космологической модели Большого взрыва. Речь идёт не о загадочной тёмной материи, а об обычной — той самой, из ко...

125

Vladimir Kouprin 14 апреля 13:36

Соседи воруют ваш интернет прямо сейчас? Неудобная правда о Wi-Fi.

Подробный обзор актуальных методов взлома Wi-Fi и эффективных способов защиты. Помните то время, когда интернет был привязан к месту проводом, словно собака на цепи? Сегодня это кажется далёким прошлым. Wi-Fi ворвался в нашу жизнь, даруя свободу — работать с ноутбуком на уютной террасе кафе, серфить интернет в парке или устроить видеоконференцию прямо из...

972

Vladimir Kouprin 14 апреля 13:02

Сказка о физике и физиках.

Лекция представляет собой критический анализ устоявшихся научных концепций, в частности истории и физики, с акцентом на закон всемирного тяготения. Автор ставит под сомнение научный статус истории из-за её субъективности и отсутствия строгих доказательств, противопоставляя ей точные науки, такие как физика. Однако и физика, по мнению автора, не лишена проблем: закон т...

739

Vladimir Kouprin 12 апреля 10:50

Вышло не по плану?

В.К. Трамп объявил войну пошлин всему миру. Китай его поддержал. И мировое пространство гоп-стопа забурлило.Конечно, под раздачу попали и простые граждане - как-раз те, кто и создаёт дополнительную стоимость, которую нагло присваивают себе грабители, попутно присвоив себе и земельную, и сырьевую ренту.«Вышло не по плану»: Китай кардинально меняет позицию?Мировые фондо...

551

Vladimir Kouprin 12 апреля 09:50

Что делать, если потерял смартфон, а там вся жизнь? План экстренных действий.

В современном мире смартфон часто заменяет нам кошелёк, фотоальбом, рабочий кабинет и даже личный дневник. В нем хранятся контакты, важные файлы, данные о банковских картах и доступы к социальным сетям. Когда он внезапно теряется — вместе с ним пропадает значительная часть нашей повседневной жизни. Первые чувства, которые нас охватывают, — это паника и растерянность. ...

1517

Vladimir Kouprin 12 апреля 09:25

Асимметрия спутников Туманности Андромеды вызывает космологические вопросы.

Галактика Туманность Андромеды окружена созвездием карликовых галактик, которые расположены в крайне неравномерной манере. Анализ космологических симуляций показывает, что такая степень асимметрии встречается только в 0,3% подобных систем, что делает Андромеду ярким исключением в текущей космологической парадигме.Современная космология, основанная на ΛC...

126

Vladimir Kouprin 11 апреля 12:07

Это 30 лет вдалбливалось в голову!

Эфир на канале Информационного агентства БелТА 7 апреля 2025 г.Е.Ю.Спицын на канале БелТА в проекте В теме.Беседа отражает пессимистичный взгляд на перспективы скорого урегулирования украинского конфликта. Основной акцент делается на глубинных противоречиях между ключевыми игроками (США, Европа, Россия), исторической инерции и неспособности современных лидеров учитыва...

142

Vladimir Kouprin 11 апреля 10:51

«Рождённый в 2154 году» американец потребовал 41 тысячу долларов пособий.

В.К. Вот такая интересная информация появилась в сети. Можно подумать, что это шутка. Но вряд ли потому, что в стране, победившей фашистов в WWII, как они утверждают, и в которой граждане через одного общались, и по-прежнему общаются, с инопланетянами, а многие даже и побывали на борту инопланетных кораблей, в появлении родившихся в 2154 году, сомневаться не приходитс...

Vladimir Kouprin 10 апреля 13:38

Новая модель объясняет Вселенную без темной энергии и темной материи.

В.К. Предлагаю тем, кого действительно интересуют действительно знания о мире, в котором мы живём, несколько альтернативный взгляд, на официально существующие представления об этом, предлагаемые нам чуть ли не как истина в последней инстанции. Но сразу хочу предупредить, что эта информация для размышления, не лишённая интерпретационных представлений, но и не предлагае...

1217

Vladimir Kouprin 10 апреля 10:10

США повысили пошлины на товары из Китая до 125 процентов.

Президент США Дональд Трамп заявил в среду, что на фоне «неуважения», которое Китай якобы проявил в отношении мировых рынков, Вашингтон немедленно повышает пошлины на товары из КНР до 125%. «Учитывая неуважение, проявленное Китаем к мировым рынкам, настоящим я повышаю пошлину, взимаемую с Китая Соединёнными Штатами Америки, до 125%, начиная с момента вст...

296

Vladimir Kouprin 10 апреля 09:04

Почему биометрия — главный скам (афёра, мошенничество) 21-го века.

Да, это удобно. Пока кто-то не украдёт ваше лицо… Биометрическая аутентификация активно вытесняет традиционные пароли и PIN-коды, предлагая более удобный и, как принято считать, надёжный способ подтверждения личности. Отпечатки пальцев, черты лица, голос и даже форма ушей — всё это стало частью современного цифрового ландшафта.Однако стремительное распро...

2504

Vladimir Kouprin 9 апреля 09:27

Маленький мозг, большие идеи: как птицы обманули эволюцию.

Птицы взламывают мусорные баки и наши теории об эволюции разума одновременно. Люди склонны возвышать собственный интеллект. Наш мозг умеет считать, логически рассуждать, работать с абстракциями и мыслить критически. Но мы не монополисты в мышлении. Среди множества животных, демонстрирующих разумное поведение, особенно выделяются птицы. Враньи умеют плани...

720

Vladimir Kouprin 9 апреля 08:25

Мария Шукшина: Раскультуривание населения привело к комплексу дезертира и нежеланию рожать детей.

Выступление на Московском экономическом форуме.Воспитание патриотичной и социально ответственной личности на основе традиционных духовно-нравственных ценностей — это одна из самых главных национальных целей сегодня. Но при этом старая задача, которая была озвучена в своё время тогдашним министром образования и науки Андреем Фурсенко, который сказал, что в Советском Со...

516

Vladimir Kouprin 7 апреля 10:55

Великобритания совместно с США успешно испытала новый гиперзвуковой ракетный двигатель.

Великобритания совместно с США успешно испытала новый гиперзвуковой ракетный двигатель, заявили в Минобороны королевства. Telegraph пишет, что разработка может лечь в основу новейшей гиперзвуковой крылатой ракеты, которая будет способна преодолевать расстояния, недоступные обычным ракетам, развивая скорость в несколько тысяч миль в час.Британское оборонн...

556

Vladimir Kouprin 7 апреля 09:01

PIN-код для свободы: новый Android-шпион категорически против своего удаления.

Цифровой надзиратель маскируется под системные настройки и отказывается покидать смартфон. На фоне роста числа потребительских приложений для слежки за смартфонами стало ясно: такие программы становятся всё более скрытными и сложными для удаления. Одно из новых Android-приложений, обнаруженное журналистами TechCrunch, способно не только прятаться, но и ф...

1154

Vladimir Kouprin 6 апреля 12:44

Танки в полі дир-дир-дир...

В.К. Перефразируя украинского классикаТрактор в полі дир-дир-дирХто за що, а ми за мир!Павло Тичина (Павел Григорьевич Тычинин).Каково сознание, такова и "поэзия", ибо поэзия выражает сознание и мировосприятие.Раскрыта судьба грозившихся воевать с Россией украинцев.Украинцы, даже те, кто раньше был настроен воинственно, любыми способами пытаются сбежать из страны и ук...

172

Vladimir Kouprin 6 апреля 09:23

Мнения, или факты?

В.К. Я понимаю, что большинству граждан читать, особенно длинные тексты, не хочется или не нравится, поэтому я предложу вашему вниманию минимум букв в рамках предлагаемой вам темы. Ну, а при желании, вы сможете ознакомиться и с буквами на портале источника. А выводы делайте уже сами.ПРОЛОГ.Русских начинают любить и уважать, когда мы побеждаем.Русских начинают любить и...

229

Vladimir Kouprin 5 апреля 11:44

Там, где говорят о доверии, уже чертят зону поражения: о размещении американского гиперзвукового оружия в Европе.

Репортёр ВГТРК Андрей Руденко, который с 2014 года освещал самые горячие события на Донбассе, в своём авторском Telegram-канале «Репортёр Руденко» прокомментировал заявление главнокомандующего НАТО. «Главком НАТО в Европе Кристофер Каволи заявил, что на территории Европы планируется разместить гиперзвуковое оружие дальнего радиуса действия.Якобы европейц...

249

Vladimir Kouprin 4 апреля 13:37

Глава МИД Германии своим заявлением о сделке по недрам между США и Украиной удивила даже своих журналистов?

Журналист и политолог Грегор Шпицен, автор Telegram-канала «Мекленбургский петербуржец» прокомментировал попытки Европы не остаться за забором при решении вопроса с Украиной, в том числе связанного с желанием США заполучить полезные ископаемые на её территории. «Пока ещё исполняющая обязанности министра иностранных дел ФРГ Анналена Бербок, заслужившая об...

838

ТОП ЗА 3 ДНЯ

Вспомните «Терминатора». Теперь забудьте — DeepMind описала угрозу страшнее в 108-страничном докладе.