Moonshot открыла исходный код Kimi K2.6: новый уровень агентного программирования

Компания Moonshot выпустила Kimi K2.6 - новую модель с открытым исходным кодом, которая показывает заметный прогресс в агентном программировании и долгом выполнении сложных задач. Модель уже доступна на Kimi.com, в приложении Kimi, через API и в Kimi Code.

Kimi K2.6 показывает сильные улучшения в задачах долгого программирования с надёжной генерализацией в разных языках, включая Rust, Go и Python, а также в разных типах задач - от интерфейсной разработки до инфраструктурной оптимизации производительности. На внутреннем тесте Kimi Code Bench модель заметно превосходит Kimi K2.5.

Примеры долгосрочного выполнения

Модель успешно загрузила и развернула Qwen3.5-0.8B локально на Mac, реализовав и оптимизировав инференс на Zig. За 12 часов непрерывной работы и 14 итераций Kimi K2.6 увеличила пропускную способность с примерно 15 до 193 токенов в секунду, что на 20% быстрее LM Studio.

Другой пример: Kimi K2.6 автономно переработала exchange-core - восьмилетний финансовый движок с открытым исходным кодом для сопоставления заявок. За 13 часов модель выполнила более 1000 вызовов инструментов, изменила более 4000 строк кода и увеличила пропускную способность на 185%.

Рой агентов и группы Claw

Рой агентов Kimi K2.6 масштабируется до 300 субагентов, выполняющих 4000 скоординированных шагов одновременно. Это существенное расширение по сравнению с K2.5, где было 100 агентов и 1500 шагов. Система может превращать PDF, таблицы и презентации в переиспользуемые навыки, сохраняя структурную и стилистическую ДНК документов.

Новая функция группы Claw позволяет объединять агентов с разных устройств и моделей в единую операционную среду. Kimi K2.6 выступает адаптивным координатором, динамически распределяя задачи между агентами на основе их профилей навыков и доступных инструментов.

В бенчмарках Kimi K2.6 показывает конкурентоспособные результаты: 66,7% на Terminal-Bench 2.0, 58,6% на SWE-Bench Pro, 83,2% на BrowseComp. Модель также сильна в визуальных задачах — 93,2% на MathVision с использованием Python.

Model	SWE-bench
Claude Opus 4.6	80.8%
Claude Sonnet 4.6	79.6%
GPT-5.4	~80%
Gemini 3.1 Pro	80.6%
DeepSeek V3.2	72%

Moonshot открыла исходный код Kimi K2.6: новый уровень агентного программирования

Примеры долгосрочного выполнения

Рой агентов и группы Claw

Читайте также

Waypoint-1.5: интерактивные миры для обычных видеокарт

DeepSeek-V4: открытая модель с миллионным контекстом для агентов

OpenAI запустила Daybreak - платформу кибербезопасности на базе GPT-5.5