● News Intel

SoK: The Attack Surface of Agentic AI -- Tools, and Autonomy

Важность: 7.2 · 5 источников · 24.03.2026 07:12

исследования мультимодальные LLM пространственное мышление AI Research Multimodal LLMs Agentic AI Performance Optimization AI Security LLM Vulnerabilities mobile agents vulnerabilities LLM Agents Research

Что произошло Исследователи представили методы улучшения мультимодальных LLM (MLLM) в 3D-пространственном мышлении (TRACE) и ускорения агентных MLLM (SpecEyes). Одновременно, несколько работ (SoK, AgentRAE, Agent-Sentry) выявили критические уязвимости агентного ИИ: расширенную поверхность атаки, бэкдоры для мобильных GUI-агентов и отсутствие механизмов проверки выполнения. Почему это важно Агентный ИИ — ключевое направление развития LLM, способное к автономным действиям. Устранение ограничений в пространственном мышлении и скорости критично. Однако выявленные фундаментальные угрозы безопасности — от отравления баз знаний до удаленного выполнения действий — ставят под сомнение надежность систем, замедляя их внедрение. Между строк Наблюдается расхождение между быстрым развитием возможностей агентного ИИ и отставанием в обеспечении его безопасности. Компании-лидеры, вероятно, уже сталкиваются с этими проблемами, но не раскрывают их масштабы. Акцент на уязвимостях указывает, что текущие агентные системы могут быть менее защищенными, чем предполагается, требуя немедленного внимания к доверию и контролю. Что отслеживать дальше Публичные заявления OpenAI, Google о мерах безопасности для их агентных систем. Выпуск стандартов/фреймворков для безопасной разработки агентного ИИ. Демонстрации реальных атак или успешных защит. Появление новых бенчмарков, оценивающих возможности и безопасность агентных систем.

Анализ через линзы

INVESTOR

Рынок агентных мультимодальных LLM демонстрирует потенциал роста благодаря улучшениям в пространственном мышлении и ускорению работы . Однако, широкое внедрение и монетизация зависят от решения критических проблем безопасности, таких как расширенная поверхность атак и уязвимости мобильных агентов . Инвестиции в механизмы контроля и проверки выполнения будут ключевыми для обеспечения доверия и масштабирования.

Риски: Высокие риски безопасности и приватности, включая новые векторы атак на инструментарий и уязвимости мобильных GUI-агентов , могут замедлить корпоративное внедрение и привести к финансовым потерям. Проблемы с производительностью и задержками в агентных MLLM ограничивают их применение в реальном времени и масштабируемость.

Возможности: Разработка решений для повышения пространственного мышления и ускорения работы агентных MLLM открывает новые рынки в робототехнике и автономных системах. Создание надежных механизмов безопасности, таких как "Agent-Sentry" для контроля выполнения , обеспечит конкурентное преимущество и ускорит принятие безопасных агентных ИИ-решений в чувствительных отраслях.

BUILDER

Кластер показывает прогресс в агентских MLLM: улучшение пространственного мышления и ускорение выполнения . Это открывает возможности для более мощных и отзывчивых агентов. Однако, значительно расширяется поверхность атаки, включая уязвимости инструментов , мобильные бэкдоры и проблемы контроля выполнения . Требуется приоритет безопасности.

Риски:

• **Расширенная поверхность атаки:** Интеграция инструментов и автономность агентов увеличивают риски безопасности, включая инъекции промптов и атаки на плагины .

• **Уязвимости мобильных агентов:** Новые методы атак, такие как визуальные бэкдоры через уведомления, угрожают мобильным GUI-агентам .

• **Непредсказуемость поведения:** Вероятностные потоки выполнения агентов затрудняют проверку и контроль, создавая проблемы безопасности и конфиденциальности .

Возможности:

• **Улучшенные возможности агентов:** Разработка MLLM с улучшенным пространственным мышлением и ускоренным принятием решений позволяет создавать более мощных и отзывчивых автономных агентов.

• **Новые инструменты и API:** Потребность в отслеживании выполнения и ускорении агентов открывает возможности для создания новых фреймворков и API.

• **Безопасные и надежные системы:** Разработка решений для снижения рисков атак [Doc 9451, Doc 9454] и обеспечения контролируемого поведения позволит внедрять агентов в критически важные области.

OPERATOR

Внедрение агентного ИИ предлагает бизнесу значительные возможности для автоматизации и повышения эффективности за счет ускорения и улучшения пространственного мышления MLLM [Doc 9335, Doc 9343]. Однако это сопряжено с серьезными рисками безопасности из-за расширенной поверхности атаки и непредсказуемости автономных систем, требуя немедленного внедрения строгих мер контроля и соответствия [Doc 9451, Doc 9454, Doc 9543].

Риски: {"execution_risk": "Высокая латентность агентных систем и ограничения в 3D пространственном мышлении MLLM могут препятствовать развертыванию критически важных приложений, требующих скорости и точности.", "compliance_policy_concerns": "Расширенная поверхность атаки агентного ИИ , включая уязвимости мобильных GUI агентов , требует срочной разработки политик безопасности, аудита и механизмов контроля для предотвращения несанкционированного доступа и утечек данных.", "operations_impact": "Непредсказуемое поведение автономных систем создает риски сбоев, несоблюдения регуляторных требований и репутационных потерь, что требует новых процессов валидации и мониторинга."}

Возможности: {"operations_workflow": "Ускорение агентных MLLM и улучшение пространственного мышнения открывают пути для более быстрой и точной автоматизации, оптимизации бизнес-процессов и создания инновационных продуктов, взаимодействующих с физическим миром.", "hiring_teams": "Разработка систем контроля и безопасности для агентов создает потребность в специалистах по безопасности ИИ, позволяя формировать команды, способные безопасно внедрять передовые технологии и обеспечивать соответствие."}

SKEPTIC

Представленные исследования демонстрируют двойственный характер развития агентного ИИ и мультимодальных больших языковых моделей: с одной стороны, предлагаются амбициозные решения для улучшения их возможностей, таких как пространственное мышление и ускорение работы, часто с заявками на преодоление значительных "пробелов". С другой стороны, значительная часть работ сосредоточена на критическом анализе и систематизации быстро расширяющейся поверхности атак и рисков безопасности, что указывает на потенциальное преувеличение текущих возможностей систем на фоне нерешенных фундаментальных проблем безопасности и контроля. Коммерческие и академические интересы явно стимулируют как разработку новых функций, так и срочную необходимость их защиты, формируя повестку исследований.

Риски:

• Значительное расширение поверхности атак в агентных ИИ-системах, включающее инъекции промптов, отравление баз знаний и атаки на инструменты/плагины (Doc 9451).

• Появление новых системных уязвимостей, таких как визуальные бэкдоры на основе уведомлений, позволяющие удаленное выполнение действий против мобильных GUI-агентов (Doc 9454).

• Серьезные проблемы безопасности, конфиденциальности и надежности, связанные с автономными LLM-агентами из-за их непредсказуемых функциональных возможностей и вероятностных потоков выполнения (Doc 9543).

• Риски ошибок или неверных действий при использовании спекулятивного выполнения для ускорения агентных MLLM, если предположения окажутся неверными (Doc 9343).

• Потенциальное внесение новых предубеждений или неточностей при преобразовании сложной 3D-информации в текстовые представления для пространственного мышления (Doc 9335).

Возможности:

• Улучшение пространственного мышления мультимодальных больших языковых моделей за счет использования текстовых представлений 3D-среды, что открывает перспективы для робототехники и AR/VR (Doc 9335).

• Значительное снижение задержек в агентных мультимодальных LLM через спекулятивное восприятие и планирование, повышая их отзывчивость и масштабируемость (Doc 9343).

• Систематическое понимание и классификация поверхности атак агентного ИИ, что является критически важным для разработки надежных защитных механизмов (Doc 9451).

• Разработка систем для ограничения и мониторинга LLM-агентов через отслеживание происхождения выполнения, обеспечивая безопасность, конфиденциальность и соответствие требованиям (Doc 9543).

5 источников

Unleashing Spatial Reasoning in Multimodal Large Language Models via Textual Representation Guided Reasoning

arxiv.org · 24.03.2026 16:38 · 7.0

SpecEyes: Accelerating Agentic Multimodal LLMs via Speculative Perception and Planning

arxiv.org · 24.03.2026 17:45 · 7.0

SoK: The Attack Surface of Agentic AI -- Tools, and Autonomy

arxiv.org · 24.03.2026 08:21 · 8.0

AgentRAE: Remote Action Execution through Notification-based Visual Backdoors against Screenshots-based Mobile GUI Agents

arxiv.org · 24.03.2026 09:51 · 7.0

Agent-Sentry: Bounding LLM Agents via Execution Provenance

arxiv.org · 24.03.2026 07:12 · 7.0

Хочешь такие брифы каждый день?

AI анализирует 145+ источников, фильтрует шум и выделяет главное — бесплатно.

Зарегистрироваться