Компания Moonshot выпустила Kimi K2.6 - новую модель с открытым исходным кодом, которая показывает заметный прогресс в агентном программировании и долгом выполнении сложных задач. Модель уже доступна на Kimi.com, в приложении Kimi, через API и в Kimi Code.
Kimi K2.6 показывает сильные улучшения в задачах долгого программирования с надёжной генерализацией в разных языках, включая Rust, Go и Python, а также в разных типах задач - от интерфейсной разработки до инфраструктурной оптимизации производительности. На внутреннем тесте Kimi Code Bench модель заметно превосходит Kimi K2.5.
Примеры долгосрочного выполнения
Модель успешно загрузила и развернула Qwen3.5-0.8B локально на Mac, реализовав и оптимизировав инференс на Zig. За 12 часов непрерывной работы и 14 итераций Kimi K2.6 увеличила пропускную способность с примерно 15 до 193 токенов в секунду, что на 20% быстрее LM Studio.
Другой пример: Kimi K2.6 автономно переработала exchange-core - восьмилетний финансовый движок с открытым исходным кодом для сопоставления заявок. За 13 часов модель выполнила более 1000 вызовов инструментов, изменила более 4000 строк кода и увеличила пропускную способность на 185%.
Рой агентов и группы Claw
Рой агентов Kimi K2.6 масштабируется до 300 субагентов, выполняющих 4000 скоординированных шагов одновременно. Это существенное расширение по сравнению с K2.5, где было 100 агентов и 1500 шагов. Система может превращать PDF, таблицы и презентации в переиспользуемые навыки, сохраняя структурную и стилистическую ДНК документов.
Новая функция группы Claw позволяет объединять агентов с разных устройств и моделей в единую операционную среду. Kimi K2.6 выступает адаптивным координатором, динамически распределяя задачи между агентами на основе их профилей навыков и доступных инструментов.
В бенчмарках Kimi K2.6 показывает конкурентоспособные результаты: 66,7% на Terminal-Bench 2.0, 58,6% на SWE-Bench Pro, 83,2% на BrowseComp. Модель также сильна в визуальных задачах — 93,2% на MathVision с использованием Python.