Opus 4.7 - самая мощная общедоступная модель Anthropic на сегодня. Она заточена под три вещи: написание кода, корпоративные рабочие процессы и длительные агентные задачи. Если вы уже работаете с Claude Code, переход на 4.7 не сводится к простому обновлению версии. Это другая модель с другими настройками, и чтобы получить от неё максимум, стоит разобраться в нюансах.

В этом гайде разберём всё по порядку: что реально изменилось, как правильно выстраивать сессии, какие effort-уровни выбирать и как управлять мышлением модели через промпты.

Что изменилось по сравнению с Opus 4.6

Opus 4.7 - не инкрементальный апдейт, а серьёзный шаг вперёд в нескольких направлениях. Вот главные улучшения, которые вы заметите сразу:

  • Работа с неоднозначностью. Раньше при размытом ТЗ модель часто останавливалась и просила уточнений. Opus 4.7 сама принимает обоснованные решения, когда контекста достаточно для разумного выбора.
  • Поиск багов и код-ревью. Модель глубже копает при анализе кода и находит проблемы, которые предыдущая версия пропускала. Особенно заметно на больших кодовых базах.
  • Удержание контекста между сессиями. Opus 4.7 лучше помнит, о чём шла речь в предыдущих итерациях. Меньше повторных объяснений, больше непрерывной работы.
  • Самостоятельное рассуждение. Даже когда задача поставлена в общих чертах, модель выстраивает цепочки рассуждений и действует последовательно.

Под капотом два технических изменения: обновлённый токенизатор и усиленное внутреннее мышление на высоких уровнях effort в поздних ходах длинных сессий. Оба влияют на расход токенов. Если просто подставить 4.7 вместо 4.6 без настройки - потребление может вырасти. Но при правильной конфигурации качество результата с лихвой окупает затраты.

Как структурировать интерактивные сессии

Первое, что нужно понять: Opus 4.7 ведёт себя по-разному в зависимости от формата взаимодействия. В интерактивных многоходовых сессиях модель после каждого вашего сообщения выделяет дополнительные ресурсы на рассуждение. Это повышает связность, качество кода и точность следования инструкциям, но увеличивает расход токенов.

Ключевой принцип: относитесь к Claude как к сильному инженеру, которому делегируете задачу. Не как к пар-программисту, которого ведёте за руку строка за строкой. Чем чётче постановка на входе, тем лучше результат на выходе.

Давайте полный контекст в первом сообщении

Самая частая ошибка - «растягивание» задачи на множество мелких ходов. Каждое ваше сообщение запускает дополнительный цикл рассуждений. Вместо цепочки вроде «Открой файл X» → «Найди функцию Y» → «Измени параметр Z» → «А ещё добавь валидацию» - дайте всё сразу одним блоком:

TEXT
В файле src/api/handlers.ts функция processOrder не валидирует
входящие данные. Добавь проверку полей amount и currency с
возвратом 400-ошибки при невалидных значениях.

Критерий приёмки: существующие тесты проходят, новые edge cases покрыты.

Такой подход экономит токены и, что важнее, повышает качество. Модель видит полную картину и принимает лучшие решения. По опыту, одно хорошо сформулированное сообщение даёт лучший результат, чем десять уточняющих.

Сокращайте количество промежуточных сообщений

Каждый пользовательский ход добавляет накладные расходы на рассуждение. Если нужно задать несколько вопросов - задавайте их пачкой. Если у вас есть контекст, который поможет модели - давайте его заранее, а не ждите, пока она сама спросит. Это не про скупость, а про эффективность: модель работает лучше, когда у неё сразу есть всё необходимое.

Авто-режим и уведомления

Для задач, где модель может действовать без постоянных проверок, авто-режим сокращает время цикла. Переключается через Shift+Tab и доступен в research preview для пользователей Claude Code Max. Особенно хорош для длительных задач с полным контекстом, предоставленным заранее.

Практический совет: попросите Claude воспроизвести звук по завершении задачи. Модель может самостоятельно создать хук-уведомление. Запустили задачу, переключились на другую работу, услышали звук - вернулись к результату. Простая вещь, которая экономит кучу времени.

Настройка уровней effort: какой выбрать и когда

Одно из самых важных нововведений Opus 4.7 - уровень xhigh, занимающий промежуточную позицию между high и max. Именно он стал значением по умолчанию, и с ним рекомендуется работать в большинстве случаев. На графике ниже видно, как разные уровни effort влияют на производительность модели в агентных задачах кодирования:

Производительность Claude Opus 4.7 в агентных задачах кодирования по уровням effort

Разбор каждого уровня

low / medium - для ситуаций, когда бюджет ограничен, задача чётко определена и важна скорость. Сюда попадает форматирование кода, простые рефакторинги, генерация бойлерплейта. Важный момент: даже на этих уровнях Opus 4.7 превосходит Opus 4.6, иногда при меньшем расходе токенов.

high - баланс между интеллектом и стоимостью. Хороший выбор, если запускаете несколько параллельных сессий или хотите контролировать расходы без заметного падения качества.

xhigh (по умолчанию, рекомендуется) - оптимальный уровень для основной разработки. Проектирование API и схем, миграция legacy-кода, ревью больших кодовых баз - всё это территория xhigh. Сильная автономия и интеллект без неконтролируемого расхода токенов.

max - для действительно сложных проблем, где нужно выжать из модели максимум. Но будьте готовы к убывающей отдаче: модель склонна к overthinking, а разница с xhigh не всегда оправдывает двойной расход. Используйте max только когда стоимость не критична, а задача действительно на пределе возможностей.

Три совета по настройке effort

  1. Не переносите настройки с Opus 4.6. Если раньше вы вручную выставляли effort для 4.6, эти значения скорее всего неоптимальны для 4.7. Начните с xhigh и отклоняйтесь только при явной необходимости.
  2. Переключайте уровни прямо в процессе. Начали сложную архитектурную задачу на xhigh, перешли к рутинному коду - снизьте до high. Вернулись к нетривиальной логике - поднимите обратно. Effort - гибкий инструмент, а не константа.
  3. Если не меняли effort вручную - ничего делать не нужно. Вас автоматически обновят до xhigh, и для большинства задач это правильное значение.

Адаптивное мышление: модель сама решает, когда думать

В Opus 4.7 больше нет Extended Thinking с фиксированным бюджетом на размышления. Вместо этого работает адаптивное мышление: на каждом шаге модель сама решает, нужно ли «подумать» глубже или можно ответить сразу. Это фундаментальное изменение, которое влияет на весь рабочий процесс.

На практике это выглядит так: простой вопрос про синтаксис - мгновенный ответ без раздумий. Сложная задача на рефакторинг с кучей зависимостей - модель инвестирует в глубокий анализ. За длинный агентный прогон суммарный расход токенов на мышление распределяется гораздо эффективнее, чем при фиксированном бюджете. Плюс в 4.7 модель стала менее склонна к overthinking - это была проблема более ранних версий.

Как управлять глубиной мышления через промпты

Иногда нужно явно подтолкнуть модель в одну или другую сторону. Если задача сложнее, чем кажется на первый взгляд, и вы боитесь, что модель поспешит с ответом:

TEXT
Think carefully and step-by-step before responding;
this problem is harder than it looks.

Если же вы на простом шаге и хотите сэкономить токены:

TEXT
Prioritize responding quickly rather than thinking deeply.
When in doubt, respond directly.

Важно понимать компромисс: снижение мышления экономит токены, но может снизить точность на нетривиальных шагах. Используйте этот приём осмысленно, а не на автомате.

Изменения в поведении, о которых стоит знать

При переходе на Opus 4.7 вы столкнётесь с несколькими неочевидными изменениями в поведении модели. Лучше знать о них заранее, чем гадать, почему всё работает «не так, как раньше».

Ответы калибруются под сложность

Opus 4.7 по умолчанию менее многословен, чем 4.6. Простой вопрос - короткий ответ. Открытый аналитический запрос - развёрнутый. Если вам нужен конкретный формат или длина, укажите это явно. Совет от Anthropic: положительные примеры желаемого стиля работают лучше, чем запреты. «Пиши в таком тоне» эффективнее, чем «Не пиши так».

Меньше вызовов инструментов

Модель стала реже обращаться к инструментам, предпочитая рассуждать. В большинстве случаев это улучшает результат. Но если вам нужно, чтобы Claude активнее использовал поиск по файлам или чтение кода - скажите об этом прямо, объясните когда и зачем обращаться к конкретным инструментам.

Меньше субагентов

Opus 4.7 стал избирательнее в делегировании задач субагентам. Обычно это правильное решение, но если параллельные субагенты полезны в вашем кейсе (веерный анализ множества файлов, обработка независимых элементов), пропишите это в инструкциях явно. Вот хороший шаблон:

TEXT
Не создавай субагента для работы, которую можешь выполнить
напрямую в одном ответе. Создавай несколько субагентов
в одном ходе при веерной обработке независимых элементов
или чтении нескольких файлов.

С чего начать: пошаговый чек-лист

Opus 4.7 особенно силён в задачах, где раньше узким местом был человеческий контроль: сложные изменения в нескольких файлах, отладка неоднозначных багов, код-ревью целого сервиса, многошаговые агентные задачи. Вот план для быстрого старта:

  1. Установите effort на xhigh - это оптимальный стартовый уровень
  2. Сформулируйте задачу целиком в первом сообщении: намерение, ограничения, критерии приёмки, пути к файлам
  3. Дайте модели работать - не вмешивайтесь без необходимости, используйте авто-режим для безопасных задач
  4. Настройте звуковое уведомление о завершении, чтобы не следить за процессом вручную
  5. Переключайте effort-уровни по ходу работы в зависимости от сложности текущего шага
  6. Калибруйте мышление через промпты: подталкивайте к глубокому анализу на сложных участках и к быстрым ответам на простых

Главная рекомендация Anthropic предельно проста: оставьте effort на xhigh и посмотрите, как далеко вас продвинет хорошо сформулированный первый ход. Начните с одной реальной задачи - и вы быстро почувствуете разницу.