Microsoft выпустила инструментарий с открытым исходным кодом для безопасности во время выполнения ИИ-агентов

8 апреля Microsoft выпустил инструментарий с открытым исходным кодом для безопасности во время выполнения ИИ-агентов, доступный на github.com/microsoft/agent-governance-toolkit. Решение закрывает важный пробел в корпоративной безопасности: когда автономные агенты на базе больших языковых моделей выполняют код и обращаются к корпоративным сетям, традиционные средства защиты оказываются бессильны.

Как это работает

Инструментарий вставляет движок применения политик между языковой моделью и корпоративной сетью. Когда агент пытается вызвать внешнюю функцию — например, запросить систему инвентаризации — инструментарий перехватывает запрос и проверяет его на соответствие централизованным правилам. Если действие нарушает политику, вызов блокируется, а событие фиксируется для проверки человеком.

Подход приоритизирует перехват во время выполнения над статическим анализом. Традиционное сканирование уязвимостей перед деплоем не справляется с недетерминированным поведением LLM, где даже базовая галлюцинация или внедрение скрытых инструкций в запрос может заставить агента перезаписать базу данных.

Ключевые возможности

Блокировка действий в реальном времени, аудит каждого автономного решения, отделение политик безопасности от промптов модели, защита унаследованных систем, лимиты потребления токенов и ресурсов. Microsoft выбрал лицензирование с открытым исходным кодом, чтобы инструментарий работал с любым стеком - будь то локальные модели с открытыми весами, Anthropic или гибридные конфигурации.

Если бы Microsoft сохранил это проприетарным, команды разработки просто обходили бы инструмент ради скорости. Открытый исходный код позволяет сообществу кибербезопасности вносить вклад и создаёт основу для коммерческих решений.

Model	SWE-bench
Claude Opus 4.6	80.8%
Claude Sonnet 4.6	79.6%
GPT-5.4	~80%
Gemini 3.1 Pro	80.6%
DeepSeek V3.2	72%

Microsoft выпустила инструментарий с открытым исходным кодом для безопасности во время выполнения ИИ-агентов

Как это работает

Ключевые возможности

Читайте также

Google Gemma 4: кибербезопасность на краю сети под угрозой

Anthropic запустила Project Glasswing: крупнейшие IT-компании объединяются против ИИ-уязвимостей

Claude Code утек 33 набора секретов в публичные репозитории npm