Молния

Google показал TurboQuant на ICLR 2026: KV-кэш больше не узкое место

15 апреля 2026 г. 19:39 Обн. 15 апр., 20:11

Исследователи Google представили TurboQuant на конференции ICLR 2026. Алгоритм значительно снижает потребление памяти KV-кэша, одного из главных узких мест при запуске больших языковых моделей. Если технология дойдёт до продакшена, это может серьёзно удешевить инференс и ускорить переход к моделям, оптимизированным на эффективность.

Другие молнии

08:49 Anthropic опубликовала принципы безопасных ИИ-агентов → 08:48 Anthropic провела эксперимент: Claude-агенты торговали на рынке и зарабатывали → 08:47 Anthropic запускает ежемесячный опрос о влиянии ИИ на работу → 21:40 Разработка Anthropic представил Claude Design: визуальный редактор прототипов и презентаций на базе Claude Opus 4.7 → 13:42 Релизы Claude Code получил рутины: автоматизация задач без участия разработчика → 13:42 Безопасность OpenAI выпустила GPT-5.4-Cyber для защиты от киберугроз → 13:36 Релизы Google выпустил нативное приложение Gemini для Mac → 19:39 Релизы Gemini Flash-Lite: Google снизил цену до $0.25 за миллион токенов →

Рейтинг моделей

Model	SWE-bench
Claude Opus 4.6	80.8%
Claude Sonnet 4.6	79.6%
GPT-5.4	~80%
Gemini 3.1 Pro	80.6%
DeepSeek V3.2	72%

Полное сравнение