Claude Sonnet 4.6 набрал 1633 Elo на бенчмарке GDPval-AA и стал лидером среди всех моделей. При A/B-тестировании в Claude Code пользователи выбирали новую версию в 70% случаев. Модель уже доступна и, судя по отзывам разработчиков, заметно лучше справляется с многофайловыми задачами.
Claude Sonnet 4.6 занял первое место в бенчмарке GDPval-AA
Другие молнии
Релизы iOS 27 открывает доступ к Claude, Gemini и ChatGPT через единый фреймворк → Релизы OpenAI представила голосовые модели с рассуждениями в API → Регуляция Microsoft, Google и xAI открыли правительству США доступ к ИИ-моделям для проверки нацбезопасности → Бизнес Anthropic привлекла $30 млрд и оценивается в $380 млрд → Регуляция Белый дом рассматривает проверку AI-моделей перед публичным релизом → Бизнес Microsoft: у Copilot более 20 миллионов платных пользователей → Релизы Google тестирует Ask YouTube — разговорный поиск по видео → Регуляция Китай заблокировал поглощение Meta стартапа Manus →