Исследователи Google представили TurboQuant на конференции ICLR 2026. Алгоритм значительно снижает потребление памяти KV-кэша, одного из главных узких мест при запуске больших языковых моделей. Если технология дойдёт до продакшена, это может серьёзно удешевить инференс и ускорить переход к моделям, оптимизированным на эффективность.
Молния
Google показал TurboQuant на ICLR 2026: KV-кэш больше не узкое место
Другие молнии
Anthropic опубликовала принципы безопасных ИИ-агентов → Anthropic провела эксперимент: Claude-агенты торговали на рынке и зарабатывали → Anthropic запускает ежемесячный опрос о влиянии ИИ на работу → Разработка Anthropic представил Claude Design: визуальный редактор прототипов и презентаций на базе Claude Opus 4.7 → Релизы Claude Code получил рутины: автоматизация задач без участия разработчика → Безопасность OpenAI выпустила GPT-5.4-Cyber для защиты от киберугроз → Релизы Google выпустил нативное приложение Gemini для Mac → Релизы Gemini Flash-Lite: Google снизил цену до $0.25 за миллион токенов →