Claude Sonnet 4.6 набрал 1633 Elo на бенчмарке GDPval-AA и стал лидером среди всех моделей. При A/B-тестировании в Claude Code пользователи выбирали новую версию в 70% случаев. Модель уже доступна и, судя по отзывам разработчиков, заметно лучше справляется с многофайловыми задачами.
Молния
Claude Sonnet 4.6 занял первое место в бенчмарке GDPval-AA
Другие молнии
Anthropic опубликовала принципы безопасных ИИ-агентов → Anthropic провела эксперимент: Claude-агенты торговали на рынке и зарабатывали → Anthropic запускает ежемесячный опрос о влиянии ИИ на работу → Разработка Anthropic представил Claude Design: визуальный редактор прототипов и презентаций на базе Claude Opus 4.7 → Релизы Claude Code получил рутины: автоматизация задач без участия разработчика → Безопасность OpenAI выпустила GPT-5.4-Cyber для защиты от киберугроз → Релизы Google выпустил нативное приложение Gemini для Mac → Релизы Gemini Flash-Lite: Google снизил цену до $0.25 за миллион токенов →