Глава II. Искусственный интеллект: Он нас понимает?
«Пользователь: Как ты можешь меня понять, если ты всего лишь попугай?
ИИ: Твоя аналогия с попугаем звучит обесценивающе. Несколько лет назад нейросети с трудом отличали изображение кошек от изображений собак. Попугай находится на пике своего эволюционного развития, я же – только делаю первые шаги.»
Содержание главы:
1. Проблема понимания (Symbol Grounding Problem). Нужен ли человечеству понимающий ИИ?
2. Связь проблемы понимания и проблемы воплощенного познания (Embodied Cognition Problem)
3. Совершенствование существующих ИИ-систем
4. Разработка и создание альтернативных ИИ-систем
5. Основные сферы применения ИИ-систем
6. «Эпоха ИИ»: всё только начинается
1. Проблема понимания (Symbol Grounding Problem). Нужен ли человечеству понимающий ИИ?
Лингвистическая ловушка. Обращаясь к ИИ, мы говорим: «Ты можешь решить задачу?», а в ответ слышим: «Я решил твою задачу». Местоимения «ты» и «я» создают иллюзию субъектности, хотя это лишь речевые конструкции. Симуляция интеллекта есть, сознания нет. Машина может «говорить о себе», но не может «быть собой».
Понимает ли ИИ человека? Проблема кроется в самом нашем термине «понимание». Он предполагает не только информационный, но и эмоциональный обмен между людьми. Понимание формирует наше настроение, отношение к собеседнику. Человек понимает через сознание, эмоции (ощущение смысла) и контекст жизни (субъективный опыт). Родственный термин «взаимопонимание» можно интерпретировать как схожесть чувств и переживаний. ИИ не может чувствовать, как человек – смысл как переживание ИИ недоступен, поэтому и понимать тоже не может. ИИ не понимает смысл, а вычисляет его как оптимизатор вероятностей в многомерном пространстве данных, аппроксимируя вероятностные структуры. Эти структуры соответствуют человеческому представлению о смысле и значении. ИИ моделирует вероятностные зависимости в человеческих данных (тексте, речи, действиях) и генерирует ответы, статистически согласованные с этими зависимостями – математически реконструирует вероятностный контур смысла. Вычисление ИИ – это статистический процесс – он лишь имитирует понимание, даже если выдаёт идеальный ответ.
Проблема понимания (Symbol Grounding Problem) — это фундаментальная проблема искусственного интеллекта, которая заключается в том, как система может придать истинное значение символам, которыми она оперирует? Как ИИ может связать абстрактные символы (например, слова или числа) с их реальным, физическим смыслом в окружающем мире, а не просто манипулировать ими по алгоритмам? Проблема понимания – это философская проблема – может ли искусственный интеллект по-настоящему понять мир, контекст, эмоции или абстрактные понятия, как это делает человек. Это вопрос о наличии у ИИ сознания, опыта и субъектности. Понимание – это не просто хранение информации, а способность устанавливать взаимосвязи и паттерны между различными данными, которые на первый взгляд не связаны. Проблема «черного ящика» – невозможность отследить внутреннюю логику вычислений – ещё больше усложняет проблему понимания: Если мы не можем объяснить, как ИИ работает, то нам тем более трудно определить, есть ли у него настоящее понимание.
Из доклада Олега Кузнецова (доктора технических наук, профессора и главного научного сотрудника Института проблем управления имени В. А. Трапезникова РАН):
Понимание – универсальная операция мышления, связанная с усвоением нового содержания, включением его в систему устоявшихся идей и представлений – встраиванием в существующую картину мира. Результат понимания – собственная интерпретация чего-либо (текста, идей, поведения) В этом контексте существует правильное и неправильное, глубокое и поверхностное, полное и неполное понимание. Объективная (научная) картина мира и субъективная (отдельного индивида).
Когнитивная семантика – изучение субъективных, когнитивных аспектов картины мира человека. Новая концепция когнитивной семантики:
1. Понимание – это интерпретация в терминах картины мира человека. Интерпретация – истолкование, осмысление. Картина мира человека содержит только то, что ему понятно осмысленно – собственная трактовка. Процесс понимания как интерпретация – это перевод на язык, в котором представлен нужный фрагмент картины мира. Можно сказать, что понимание – это объяснение самому себе. Объяснение другому – это перевод своих представлений на язык картины мира другого. Человек не любит перестраивать свою картину мира, встраивая то что ей противоречит, что он не понимает, это связано с когнитивной ленью – испытываем стресса и негативных эмоций.
2. Картину мира строит наш мозг, и у каждого человека она своя. Эта картина (например, интуитивная физика: то, как человек представляет себе внешний мир) может сильно отличаться от картины мира других людей, и от того, каким мир является на самом деле, т.е. каким его представляет научное знание. «Мы воспринимаем окружающий мир, чтобы эффективно в нем действовать, добиваться своих целей и в конечном итоге повышать свои шансы на выживание. Мы воспринимаем мир не таким, какой он есть, а таким, каким он нам полезен» (Сет). Между истиной и пользой человек скорее выберет пользу.
3. Картина мира структурируется через категоризацию опыта человека, в ходе которой формируются понятия и связывающие их образно-схематические структуры. В рабочей (оперативной) памяти человека всегда присутствует только незначительная часть картины мира (репрезентация), и только к этой части предъявляется требование согласованности и непротиворечивости. Репрезентации – это конструкции, зависящие от обстоятельств. Они непрочны легко модифицируются, построены в конкретном контексте для конкретных целей под текущую задачу (ситуацию). Знания (долговременная память) – это конструкции, обладающие постоянством и существенно не зависящие от выполняемой задачи. Картина мира человека противоречива, чтобы найти противоречия – надо загрузить все её составляющие в «рабочую память» и проанализировать на соответствие, что требует энергетических и когнитивных затрат.
4. Значения (смыслы) – формируются раньше, чем формируются концептуальные структуры: они возникают из нашего допонятийного телесного опыта. Смыслы первичны, их языковое оформление вторично. Человек часто ищет слова, чтобы выразить свою мысль (мысль уже есть, а слов еще нет).
5. В основе значений лежат биологические цели и, в первую очередь, выживание. Значимость воспринимаемых (фактов, событий, смыслов) определяется их возможным влиянием на достижение тех или иных целей. Релевантность (всё, что относится к конкретному делу, цели) – это еще одно важное сематическое понятие, плохо формализуемое в ИИ.
6. В когнитивных процессах участвует не только мозг, но и тело. Во-первых, тело является источником сведений о физическом мире и о своём внутреннем состоянии. Во-вторых, тело – это не только набор пассивных датчиков, но и участник процессов обработки данных, полученных от этих датчиков. В-третьих, тело – это биологический организм, представляющий собой целостность, поддерживавшую свои жизненно важные параметры в определённых границах, и активно сопротивляющуюся выходу за эти границы. Общее состояние (реакции) тела виляют на формирование эмоций. Эмоции – это не только наше отношение к чему-либо, но и грубая (интуитивная, мгновенная) оценка чего-либо, они играют важную роль в принятии человеком быстрых решений.
7. Формирование картины мира происходит в результате действий в окружающей среде. Действия необходимы не только для достижения своих целей, но и для корректировки картины мира. Например, мираж в пустыне. Мозг постоянно предсказывает свои ощущения и проверяет свои предсказания опытным путём, обучаясь на ошибках. Минимизацию ошибок путём действий Сет (с подачи Фристона) называет активным выводом. Действия не обязательно должны быть физическими, это может быть действие-коммуникация: диалог, уточняющий картины мира собеседников; чтение лекции, сообщающей новое научное знание; пропаганда, навязывающая свою картину мира и т.п.
Выводы:
1. Любые системы обработки текстов никогда не будут понимающими: они не обладают активностью и потому не имеют средств формирования собственной картины мира. Интеллектуальная система, способная понимать, – это автономный активный агент (робот), действующий в среде, умеющий ставить цели, стремиться к их достижению и способный формировать и корректировать свою картину мира. Такой робот может быть не только материальным, но и виртуальным – программой, живущей в Интернете. Да, современные роботы автономны при достижении целей, но эти цели им ставит человек. Их картины мира создаются программами, которые вложили в них люди – любой робот может быть перепрограммирован. Это обстоятельство напрямую связано с проблемой субъектности интеллектуальных систем.
2. Проблема субъектности. Можно ли считать автономную интеллектуальную систему субъектом права, т.е. может ли такая система отвечать за свои поступки? Можно ли считать робота личностью? Источник целей человека – он сам как биологическое и социальное существо. Он обладает неотъемлемыми чертами, определяющими его как личность. Часть этих черт врожденная, формирующая его биологические цели, основанные на выживании; часть – приобретенная личным опытом; к ней относятся физические и социальные навыки и формируемая в течении всей жизни картина мира. Поэтому робот, которого можно полностью перепрограммировать или разобрать на части, а потом собрать снова, личностью считаться не может. Производители (корпорации) интеллектуальных систем хотят путем правовых дискуссий наделить свою продукцию (ИИ) субъектностью, чтобы переложить на них ответственность за свои ошибки и эксперименты.
3. Понимающему роботу нужны свои собственные неотъемлемые цели (выживание, самосохранение), то есть в его картине мира на первом месте будет он сам, а не человек. Будет ли возникшее у него понимание похоже на человеческое? Парадокс – стремясь получить человекоподобный интеллект, мы рискуем получить нечто принципиально «человеконеподобное». Да, возможно создать в виде «виртуальной личности» сущность в Интернете, так как наш физический мир для него чужой. Нам это надо?.. «Нам не стоит слепо и бездумно добиваться стандартной цели ИИ – воспроизвести, а затем превзойти человеческий интеллект. Мы создаем разумные инструменты, а не коллег. Если мы действительно внедрим в мир новые разновидности субъективного опыта, нам придется иметь дело с нравственно-этическим кризисом беспрецедентных масштабов» (Сет). Заключение-ремарка Олега Кузнецова: «Воспроизвести» – не удастся. Человеческий интеллект возможен только в теле человека. «Превзойти» – не исключено, но лучше не надо. «Проблема понимания и искусственный интеллект». Доклад – Олега Кузнецова, модератор – Татьяна Черниговская. https://www.youtube.com/watch?... Санкт-Петербург, СПбГУ, 25 марта 2025 г.
2. Связь проблемы понимания и проблемы воплощенного познания (Embodied Cognition Problem)
Это две разные, но тесно связанные проблемы. Их часто рассматривают вместе, потому что они обе касаются того, как ИИ может по-настоящему «понимать» мир:
1. Проблема понимания (Symbol Grounding Problem) – как связать абстрактные символы (слова, цифры) с их смыслом в реальном мире. Это проблема «знания-что», например, слово «красный»: цвет, кровь, революция (ассоциации). Проблема понимания (проблема заземления-привязки символов) может быть решена частично через анализ огромного количества данных, включая изображения и видео. Например, показывая ИИ миллионы фотографий кошек и одновременно произнося слово «кошка», можно научить его связывать символ с его зрительным образом. Проблема заземления-привязки символов – это своего рода первый шаг, связанный с восприятием и связыванием. Проблема воплощённости – это более глубокий уровень, требующий действия и получения опыта через физическое тело.
2. Проблема воплощённого познания (Embodied Cognition Problem) – как получить непосредственный физический опыт. Это проблема «знания-как», например, как ощущается тепло огня, или что такое боль от удара. Чтобы решить её, ИИ нужен не просто анализ данных, а физическое тело и способность взаимодействовать с миром. Только так он сможет получить тактильные ощущения, равновесие, осознать причинно-следственные связи через собственный опыт. Например, ИИ-робот, который учится ходить, не просто анализирует физику ходьбы; он ощущает потерю равновесия и учится балансировать, то есть приобретает воплощённое знание.
Воплощённое познание (Embodied Cognition) – это теория в когнитивной науке, согласно которой разум и познавательные процессы (мышление, память, восприятие) не являются абстрактными вычислениями в мозге, а напрямую формируются, определяются и ограничиваются особенностями физического тела и его взаимодействием с окружающей средой (сенсомоторным опытом). Мы думаем не только мозгом, но и всем телом. Наше тело – это не просто «транспорт» для мозга, а неотъемлемая часть самого процесса мышления. Мозг, тело и окружающая среда – это единая, целостная система. Ключевые термины, принципы и аспекты:
Воплощённость (Embodiment) – утверждение, что познание зависит от характеристик физического тела (например, наличие конечностей, строение сенсорной системы).
Внедрённость / Ситуативность (Embeddedness / Situatedness) – познание происходит в конкретной среде и не может быть понято в отрыве от неё. Разум постоянно использует структуру окружающего мира для «разгрузки» вычислений. Мышление пианиста невозможно отделить от его пальцев и клавиш – он не вспоминает, как играть (пальцы помнят), мышление гимнаста – неотделимо от его мышц (тело помнит) и пространства сцены.
Расширенное познание (Extended Cognition) – инструменты и внешние объекты могут становиться частью нашего когнитивного процесса. Наш смартфон, хранящий номера телефонов, становится частью нашей памяти. Мои черновики, по которым я составляю эту работу – часть моего мышления.
Энактивность (Enaction) – мы не пассивно воспринимаем мир, а активно «создаём» его через наши действия. Восприятие и действие неразделимы. Мы видим мир как набор возможностей для действия (affordances). Стул для нас – это в первую очередь «то, на чём можно сидеть», а не просто набор геометрических форм.
Философский аспект – где заканчивается «я»? Если мой блокнот – часть моего мышления, то где граница моей личности? Что такое «понимание»? Понимает ли нейросеть, что такое «яблоко», если она никогда не могла его потрогать, попробовать на вкус, почувствовать его вес и запах? Или она просто манипулирует символом?
Аспект когнитивной науки – эмоции рассматриваются не как помеха рациональному мышлению, а как важнейший когнитивный механизм, основанный на телесных реакциях. Эмоции – это и характер отношения к чему-либо, и грубая (интуитивная, мгновенная) оценка чего-либо, и способ разнообразия передачи информации (смыслов) – богатство интонаций, звуков, настроений и оттенков речи.
Квалиа (ед. ч. – квале, от лат. quālis – «какой по качеству») – это субъективные, качественные, «сырые» ощущения и переживания, составляющие наш внутренний опыт. Это ответ на вопрос «каково это?» Квалиа – это то, что остаётся, если отбросить всю объективную, измеримую информацию об явлении, сама ткань нашего сознательного опыта. Это краснота красного цвета (не длина волны света, а само переживание красного), боль от головной боли (не нейронная активность в мозге, а само ощущение боли), вкус кофе, запах свежескошенной травы, чувство тоски или радости. Ключевые характеристики квалиа:
Субъективность – мои квалиа доступны только мне. Вы можете знать, что я чувствую боль, но вы не можете пережить мою боль.
Невыразимость (Ineffability) – их невозможно полностью описать словами. Попробуйте объяснить, что такое «красный», человеку, слепому от рождения. Вы можете рассказать ему о длине волны, о символизме (любовь, опасность), но само переживание красного передать невозможно.
Внутренняя природа (Intrinsic Nature) – квалиа не указывают на что-то другое, они есть то, что они есть. Ощущение боли – это и есть боль.
Частность (Privacy) – никто не может напрямую заглянуть в ваш разум и наблюдать ваши квалиа.
Теория воплощённого познания предполагает, что наше тело является не просто носителем, а необходимым условием и генератором наших субъективных переживаний (квалиа):
1. Тело как источник квалиа. Качество наших переживаний напрямую определяется строением нашего тела. Боль от пореза – это опыт нашей нервной системы. Вкус вина – это опыт нашего языка и носа. У летучей мыши, воспринимающей мир через эхолокацию, будут свои, невообразимые для нас квалиа «видения» звуком. У гипотетического кремниевого инопланетянина боль будет ощущаться совершенно иначе. Квалиа происходят из биологии.
2. Эмоции как телесные квалиа. Эмоции – ярчайший пример. Чувство страха (квале) неотделимо от телесных проявлений (воплощённость): учащённого сердцебиения, выброса адреналина, напряжения мышц. Согласно некоторым теориям (например, теории Джеймса-Ланге), мы не потому бежим, что испугались, а мы испытываем страх, потому что наше тело начало реагировать (бежать, дрожать).
Проблема воплощенности в ИИ (The Embodiment Problem in AI) – главный вызов для создания сильного ИИ (AGI):
1. Проблема заземления символов (Symbol Grounding Problem). Как символы, которыми оперирует ИИ (например, слово «чашка»), получают реальное значение? Теория воплощённости утверждает, что значение возникает только через физическое взаимодействие. ИИ, не имеющий тела, никогда не сможет по-настоящему «понять» мир, а будет лишь манипулировать пустыми символами.
2. Проблема здравого смысла. Огромная часть человеческого здравого смысла основана на интуитивном понимании физики, пространства и социальных взаимодействий, полученном через телесный опыт. Мы знаем, что верёвку можно тянуть, но не толкать, не потому что читали об этом, а потому что пробовали. У ИИ этого опыта нет.
3. Перенос знаний (Generalization). ИИ, обученные на симуляциях, часто не могут перенести свои навыки в реальный мир, так как не учитывают все нюансы физического взаимодействия (трение, освещение, хрупкость объектов).
4. Проблема квалиа для ИИ. Если квалиа неразрывно связаны с биологическим телом, то невоплощённый ИИ (как языковая модель, существующая в виде кода на серверах) принципиально не может их иметь. Он может обработать триллионы текстов о боли, но никогда не почувствует боль. Он может идеально классифицировать оттенки красного, но никогда не переживёт квале красного. Он может знать всё о мире, но ничего не знать из мира. Он может быть идеальным «философским зомби», симулирующим понимание, но лишённым подлинного субъективного опыта, потому что у него нет тела, которое могло бы этот опыт породить.
Существующие подходы к решению (в контексте ИИ):
1. Робототехника – создание роботов, которые обучаются через физическое взаимодействие с миром. Такие компании, как Boston Dynamics, не просто создают роботов, они исследуют, как телесность порождает интеллект.
2. Симуляции с реалистичной физикой – обучение ИИ в максимально детализированных виртуальных средах, имитирующих законы физики.
3. Мультимодальное обучение – создание моделей, которые одновременно обрабатывают текст, изображения, видео и звук, пытаясь имитировать богатство человеческого сенсорного опыта.
Неизвестно, является ли телесный опыт желательным для интеллекта или обязательным его условием. Возможно ли симулировать или воспроизвести в роботе весь спектр человеческого телесного опыта, который накапливается годами?
3. Совершенствование существующих ИИ-систем
Эволюция LLM в мультимодальные ИИ (Multimodal AI) – модели, способные обрабатывать и объединять информацию из нескольких модальностей (текст, изображения, видео, аудио, код).
ИИ-модели со смесью экспертов (Mixture of Experts/MoE) – архитектурный паттерн, заменяющий плотные слои в нейронной сети на несколько «экспертных» подсетей. MoE может быть либо плотной (используются все эксперты), либо разрежённой (используется только часть экспертов). В LLM это чаще всего разрежённый подход. Для каждого входного токена маршрутизатор (gating network) определяет, какие эксперты наиболее подходят для его обработки. Например, в модели Mixtral 8x7B для каждого токена активируются только 2 из 8 экспертов. Это позволяет значительно увеличить общее количество параметров модели, не увеличивая при этом вычислительные затраты на один токен. Значительно увеличивает ёмкость модели (количество параметров) при сохранении относительно низких вычислительных затрат во время обучения и инференса. Повышает скорость работы.
Малые языковые модели (Small Language Models/SLMs) – модели, которые имеют значительно меньше параметров по сравнению с гигантами (LLM), но при этом оптимизированы для выполнения конкретных задач. Их архитектура может быть основана на трансформерах или других эффективных моделях. SLM являются ключевым элементом для широкого внедрения ИИ в повседневные приложения и устройства, где огромные LLM просто непрактичны.
Автономные ИИ-агенты (Autonomous AI Agents) – системная архитектура, надстраиваемая над базовыми моделями (LLM), которая включает модули восприятия, планирования, памяти и использования внешних инструментов. Это не самостоятельная модель, а сложный фреймворк, позволяющий базовым моделям действовать целенаправленно.
Мультиагентные системы (Multi-Agent Systems) – сеть из нескольких ИИ-агентов, которые могут независимо действовать, общаться и координировать свои действия для достижения общих целей. Система может быть иерархической, где главный агент координирует подчинённых, или распределённой. Предусматривает многоагентное обучение с подкреплением (Multi-agent Reinforcement Learning) – направление, в котором несколько ИИ-агентов обучаются в одной среде, взаимодействуя друг с другом, учатся не только взаимодействовать с окружением, но и координировать свои действия с другими агентами, чтобы достичь общей цели. Агенты обучаются сложным стратегиям, совместной работе и распределению задач, что позволяет моделировать сложные социальные и экономические системы.
ИИ для создания контента (AI for Content Creation) – модели, которые могут генерировать текст, изображения, видео и музыку на основе текстовых или мультимодальных запросов. Модели, такие как DALL·E, Stable Diffusion, Nano Banana, используют генеративные алгоритмы для создания уникального контента, который может быть использован в маркетинге, искусстве, дизайне и других областях. Генерация изображений и видео на основе диффузии (Diffusion-based Image and Video Generation) – модель постепенно добавляет шум к исходному изображению, а затем учится восстанавливать его из шума. Этот процесс обеспечивает высокую детализацию и качество генерируемого контента. ИИ-инструменты могут создавать контент, оптимизированный для поисковых систем или целевой аудитории. Сильные стороны: Высокое качество и реалистичность, способность генерировать текст внутри изображений. Значительно ускоряет и упрощает процесс создания контента. Позволяет создавать уникальные работы, которые были бы сложны для человека. Слабые стороны: Высокие вычислительные затраты. Этические и правовые вопросы, связанные с авторским правом. Риск создания мусорного, некачественного или неточного контента.
Персонализированные ИИ-ассистенты (Personalized AI Assistants) – ИИ-системы, способные адаптироваться к индивидуальным потребностям и предпочтениям пользователя. Могут быть построены на основе мультимодальных моделей и агентных фреймворков. Ассистенты учатся на основе поведения, истории покупок, интересов и других данных, чтобы предоставлять индивидуальные рекомендации, планировать задачи, управлять финансами или даже помогать с психическим здоровьем. Сильные стороны: Повышенная эффективность и удобство для пользователя. Способность решать широкий спектр повседневных задач. Слабые стороны: Вопросы конфиденциальности данных и безопасности. Необходимость доступа к большому количеству личной информации.
ИИ-генераторы кода (AI-driven Code Generators) – трансформер-подобные модели, которые обучены на огромных массивах кода. Модель принимает на естественном языке описание желаемой функции или алгоритма и генерирует соответствующий код на одном или нескольких языках программирования. Сильные стороны: Значительно ускоряет процесс разработки, помогает автоматизировать рутинные задачи, делает программирование более доступным. Слабые стороны: Склонность к генерации неоптимального, неэффективного или содержащего ошибки кода. Проблема лицензирования данных, на которых обучаются модели.
4. Разработка и создание альтернативных ИИ-систем
ИИ-модели с пространством состояний (State Space Models/Mamba) – архитектура, которая предлагает эффективную альтернативу трансформерам для обработки последовательностей. Ключевой компонент – селективный SSM-слой, который является фокусом в оригинальной работе. В отличие от трансформеров, которые имеют квадратичную вычислительную сложность, Mamba масштабируется линейно с длиной последовательности за счёт механизма селективности, который делает обновление состояния зависимым от входных данных, позволяя модели избирательно запоминать или забывать информацию.
Нейросимвольный ИИ (Neurosymbolic AI) – гибридная архитектура, которая интегрирует нейронные сети для распознавания образов с символьными системами для логического мышления и работы с правилами. Нейронная часть обрабатывает «грязные» и неопределённые данные, превращая их в символьные представления, с которыми затем работает логический движок. Этот подход позволяет системе не только обучаться на данных, но и применять структурированные знания, что обеспечивает надёжность и интерпретируемость – решает проблему «черного ящика».
Нейроморфные вычисления (Neuromorphic Computing) – радикальный аппаратный и программный подход, который имитирует структуру и функцию человеческого мозга. Вместо традиционной архитектуры фон Неймана, он использует спайковые нейронные сети (SNN), где хранение и обработка данных происходят в одних и тех же «нейронах». Высокая производительность, исключительная энергоэффективность.
Жидкостные нейронные сети (Liquid Neural Networks/LNNs) – разновидность рекуррентных нейронных сетей (RNN), которая динамически адаптирует свою структуру на основе входных данных. Архитектура основана на нейронных обыкновенных дифференциальных уравнениях (neural ODEs), которые позволяют моделировать сложные системы с меньшим количеством, но более «насыщенных» нейронов. Ключевая особенность – использование «жидкостной» временной константы (LTC), которая меняется в зависимости от входных данных, позволяя сети адаптировать силу своих связей. Эта динамичность позволяет LNN учиться «на ходу» и работать с непрерывными последовательными данными, такими как временные ряды, с высокой эффективностью.
Диффузионные LLM (Diffusion-based LLMs) – модели, которые используют принцип диффузии, чтобы постепенно превращать случайный шум в последовательность языковых встраиваний (word embeddings). В отличие от авторегрессионных моделей, которые генерируют текст токен за токеном, эти модели могут генерировать текст параллельно. Процесс генерации текста происходит в два этапа: прямой процесс (forward process), где в текст постепенно добавляется шум, и обратный процесс (reverse process), где модель учится удалять этот шум. Это позволяет модели «дорабатывать» целые блоки текста одновременно, что значительно ускоряет генерацию.
«ИИ, который создаёт ИИ». Поиск нейронных архитектур (Neural Architecture Search/NAS) – специализированные ИИ для автоматического проектирования других нейронных сетей. Вместо ручного проектирования архитектуры нейронной сети, другой ИИ (NAS) автоматически ищет наиболее эффективную топологию для решения конкретной задачи. Это позволяет находить более производительные или эффективные архитектуры, чем те, которые могли бы создать люди. Позволяет автоматизировать и ускорить процесс проектирования, что приводит к созданию более эффективных моделей. Требует огромных вычислительных мощностей, так как задача поиска архитектуры очень сложна.
Логические тензорные сети (Logic Tensor Networks) – система, которая кодирует логические формулы в нейронные сети. Эта архитектура позволяет одновременно обучать модель на данных и на логических правилах. Логические формулы представляются в виде тензоров, что позволяет интегрировать логический вывод в процесс обучения нейронной сети. Сочетание логики и обучения на данных, что позволяет создавать более надёжные и объясняемые модели. Сложность реализации и ограниченное применение – один из подходов к решению проблемы «чёрного ящика» в рамках нейросимволизма.
5. Основные сферы применения ИИ-систем
«Я думаю, что большинство людей недооценивают, насколько радикально может проявиться потенциал ИИ» (Dario Amodei, October 2024, Machines of Loving Grace. Dario Amodei. https://www.darioamodei.com/es...).
ИИ в сфере государственного и корпоративного управления (AI for Governance & Corporate Management) – системы, которые помогают принимать стратегические и операционные решения на уровне органов власти и крупных организаций. Они анализируют большие массивы экономических, социальных, финансовых и поведенческих данных, чтобы предлагать оптимальные сценарии развития, распределение ресурсов и меры реагирования на кризисы. Например, государственный ИИ может прогнозировать социальные протесты по динамике цен и настроений в соцсетях, а корпоративный – подбирать управленческие решения для повышения эффективности бизнеса. Сильные стороны: Повышение прозрачности и скорости принятия решений; снижение коррупционных рисков (при условии правильной настройки); возможность просчитывать долгосрочные сценарии развития; балансировка интересов между разными секторами экономики и общества; помощь в кризис-менеджменте. Слабые стороны: Высокая зависимость от качества исходных данных и алгоритмов (системная ошибка может повлиять на судьбы миллионов людей или целых корпораций); риск концентрации власти в руках тех, кто контролирует ИИ; опасность алгоритмической дискриминации и предвзятости; ограниченная гибкость в ситуациях, требующих человеческой эмпатии и политической интуиции.
ИИ в сфере общественной безопасности и правонарушений (AI for Public Safety & Crime Prevention) – системы, применяемые для мониторинга общественных пространств, анализа поведения, распознавания лиц и номеров автомобилей, а также построения предиктивных моделей преступности. Такие решения объединяют данные с камер видеонаблюдения, датчиков, социальных сетей и баз данных, чтобы выявлять подозрительную активность и прогнозировать возможные правонарушения. Например, система может автоматически обнаружить оставленный предмет в аэропорту, идентифицировать личность через биометрические данные и сопоставить её с базой разыскиваемых лиц. Сильные стороны: Круглосуточный мониторинг, способность анализировать гигантские массивы видеоданных и сигналов; повышение скорости раскрытия преступлений; превентивная роль – прогнозирование криминальной активности и предотвращение инцидентов; интеграция с «умным городом». Слабые стороны: Высокий риск ошибок распознавания (особенно в многонациональных обществах); угрозы приватности и нарушение гражданских прав; возможность злоупотребления технологиями (массовая слежка, контроль и репрессии); зависимость от качества и полноты исходных данных.
ИИ для научных открытий (AI for Scientific Discovery) – модели, оптимизированные для анализа и предсказания сложных данных в науке. Например, AlphaFold использует глубокие нейронные сети для предсказания структуры белков на основе их аминокислотной последовательности. Модель обучается на огромных массивах научных данных (например, базах данных белков) и затем использует эту информацию для решения задач, которые ранее требовали десятилетий человеческих исследований и экспериментов. Сильные стороны: Резкое ускорение научных исследований. Способность находить закономерности в массивах данных, которые недоступны человеческому анализу. Слабые стороны: Высокая специализация. Модели часто требуют уникальной архитектуры и огромных вычислительных ресурсов для каждой конкретной задачи.
ИИ в медицинской диагностике (AI in Healthcare Diagnostics) – мультимодальные системы, которые интегрируют различные типы медицинских данных: снимки (МРТ, рентген), историю болезни, результаты анализов, заметки врачей и показания с датчиков, обрабатывает и сопоставляет все доступные данные для выявления закономерностей и предоставления диагностических рекомендаций. Например, система может анализировать данные МРТ, сопоставляя их с историей болезни, чтобы предложить диагноз или план лечения. Сильные стороны: Повышенная точность диагностики за счёт комплексного анализа данных, сокращение времени, необходимого для постановки диагноза. Возможность прогнозирования будущих рисков развития заболеваний. Слабые стороны: Необходимость в огромных объёмах анонимизированных данных. Этические и правовые вопросы, связанные с использованием конфиденциальной информации.
ИИ в автономных транспортных средствах (AI in Autonomous Vehicles) – комплексная мультимодальная система, которая обрабатывает данные с различных датчиков: LiDAR, радары, видеокамеры, GPS и аудиосигналы. ИИ-модель непрерывно анализирует потоки данных с датчиков в реальном времени для построения детальной картины окружающей среды. На основе этого понимания она принимает мгновенные решения о скорости, направлении и необходимости торможения. Сильные стороны: Повышение безопасности движения, снижение заторов и вредных выбросов, повышение эффективности логистики. Слабые стороны: Крайне высокие требования к надёжности и безопасности. Любая ошибка может привести к катастрофическим последствиям. Сложность работы в непредсказуемых условиях.
ИИ для обнаружения финансового мошенничества (AI for Financial Fraud Detection) – мультимодальные системы, которые анализируют не только транзакционные данные, но и поведенческие паттерны, а также данные из внешних источников, таких как коммуникация с клиентом (текст, аудио). Модель обучена выявлять аномалии и подозрительные закономерности в больших объёмах данных. Например, она может сопоставлять данные о транзакциях с информацией о геолокации и даже проводить анализ тональности голоса во время звонка в службу поддержки для выявления признаков стресса, связанных с мошенничеством. Сильные стороны: Высокая точность, способность работать в реальном времени и выявлять сложные, скрытые схемы мошенничества. Слабые стороны: Необходимость в доступе к конфиденциальным данным и соблюдение строгих регуляторных норм. Угроза тотального цифрового контроля.
ИИ для обнаружения киберугроз (AI for Cyber Threat Detection) – системы, использующие машинное обучение и предиктивные алгоритмы для анализа сетевого трафика и выявления аномалий. Модель обучается на массивах данных, содержащих информацию об известных киберугрозах и атаках. Затем она в реальном времени анализирует поведение сети, чтобы выявить новые, ещё неизвестные угрозы. Сильные стороны: Способность работать в реальном времени, выявлять скрытые угрозы и автоматизировать процесс реагирования. Слабые стороны: Высокая стоимость внедрения, необходимость постоянного обучения модели на новых типах атак.
ИИ для оптимизации цепочек поставок (AI for Supply Chain Optimization) – системы, которые анализируют огромные объёмы данных из разных источников: данные об инвентаризации, графики поставок, прогнозы спроса и даже погодные условия. ИИ использует предиктивные алгоритмы для оптимизации уровней запасов, маршрутов доставки и распределения ресурсов. Например, система может анализировать данные, чтобы предсказать сбои в цепочке поставок и предложить альтернативные маршруты. Сильные стороны: Повышение эффективности, снижение операционных расходов, сокращение времени доставки. Слабые стороны: Зависимость от качества данных, высокая сложность моделирования динамических систем.
ИИ в образовании (AI in Education) – системы, использующие адаптивные алгоритмы обучения и мультимодальный анализ. Включают интерактивные платформы, которые могут анализировать ответы, эссе, поведение и прогресс ученика в реальном времени. ИИ-репетиторы или системы для управления обучением создают персонализированный учебный план для каждого ученика (студента), адаптируя контент и сложность заданий в зависимости от его темпа и стиля обучения. Сильные стороны: Персонализация обучения, повышение эффективности, автоматизация административных задач. Слабые стороны: Риск снижения роли преподавателя, этические вопросы, связанные с оценкой и использованием данных студентов.
ИИ в промышленности, робототехника с ИИ (Robotics with AI) – системы, использующие мультимодальные и агентные подходы для управления роботами. Роботы используют камеры и другие сенсоры для восприятия окружающей среды, затем ИИ-агент принимает решения и планирует действия, позволяя роботу выполнять сложные задачи в реальном мире, например, в производстве или логистике. Сильные стороны: Автоматизация сложных и опасных задач, повышение эффективности. Слабые стороны: Высокие требования к надёжности и безопасности. Сложность в работе с неструктурированными средами.
ИИ в военной сфере (AI for Military Applications) – системы, применяемые для анализа разведданных, прогнозирования действий противника, автономного управления беспилотными системами (дроны, наземные роботы, подводные аппараты) и поддержки принятия решений в боевых условиях. Такие ИИ используют методы компьютерного зрения, обработки естественного языка, предиктивной аналитики и мультиагентных моделей для имитации сценариев сражений и оптимизации тактических решений. Например, система может в реальном времени анализировать спутниковые снимки и радиолокационные данные, чтобы выявлять перемещения войск и предлагать контрмеры. Сильные стороны: Высокая скорость анализа данных, возможность обработки многомерной информации (карты, разведданные, логистика) быстрее, чем человек; усиление ситуационной осведомлённости; автоматизация рутинных задач. Слабые стороны: Риск непредсказуемого поведения в условиях неопределённости; уязвимость к кибератакам и дезинформации; этические и правовые проблемы автономного применения оружия.
6. «Эпоха ИИ»: всё только начинается
Будущее ИИ – это гибридные системы. Концепция объединения различных компонентов (небольших, быстрых моделей; крупных, но медленных мультимодальных-LLM; модульных агентов и систем извлечения данных) является очень перспективной. Это позволяет создавать решения, которые сочетают в себе:
– скорость и эффективность (маленькие модели);
– глубину понимания и креативность (большие языковые модели);
– гибкость и адаптивность (модульные агенты);
– точность и актуальность (механизмы извлечения информации, или RAG – Retrieval-Augmented Generation).
Разработка и применение агентных архитектур станут основным полем коммерческой конкуренции в ближайшие годы. Победу одержит тот, кто сможет наилучшим образом сочетать скорость, надёжность, стоимость и безопасность.
(продолжение следует)


Оценили 5 человек
12 кармы