Компания Anthropic выпустила три новые функции для платформы Claude Managed Agents. Обновление включает режим "мечтаний" (dreaming), систему оценки результатов (outcomes) и мультиагентную оркестровку (multiagent orchestration).
Функция dreaming работает как процесс самообучения агентов. Система анализирует прошлые сессии работы, находит закономерности и улучшает память агента между сессиями. Пользователь может выбрать степень контроля: dreaming способен обновлять память автоматически или предоставлять изменения на проверку перед применением.
Функция outcomes позволяет описать критерии успешного выполнения задачи. Пользователь составляет рубрику с описанием того, как должен выглядеть результат, а агент работает над его достижением. Отдельный оценивающий модуль проверяет выводы по заданным критериям в собственном контекстном окне, чтобы не быть предвзятым. Если что-то не так, оценивающий указывает на проблему, и агент делает еще одну попытку.
Мультиагентная оркестровка дает возможность главному агенту разделять задачу на части и делегировать каждую специализированному агенту со своими моделью, промптом и инструментами. Например, главный агент может вести расследование, пока суб-агенты параллельно анализируют историю деплоя, логи ошибок, метрики и тикеты поддержки.
Специализированные агенты работают в параллели на общей файловой системе и добавляют информацию в общий контекст главного агента. События сохраняются постоянно, поэтому каждый агент помнит, что уже сделал. Главный агент может проверять состояние других агентов в любой момент рабочего процесса.
Netflix уже использует мультиагентную оркестровку в работе своей платформенной команды. Платформа Claude Managed Agents была запущена Anthropic в прошлом месяце и значительно упростила создание и развертывание облачных AI-агентов.
Как отмечают в Anthropic, вместе память и режим dreaming формируют надежную систему для самообучающихся агентов. Память позволяет каждому агенту фиксировать, что он узнал в процессе работы, а dreaming уточняет эту память между сессиями, извлекая общие выводы и поддерживая актуальность данных.