Компания OpenAI представила GPT-5.5 - новую флагманскую модель, которую компания называет следующим шагом к тому, чтобы ИИ лучше справлялся с реальной работой за компьютером. Модель уже доступна пользователям тарифов Plus, Pro, Business и корпоративной подписки в ChatGPT и Codex.

Главное отличие GPT-5.5 от предыдущих версий — способность понимать намерения пользователя быстрее и брать на себя больше работы самостоятельно. Модель отлично справляется с написанием и отладкой кода, онлайн-исследованиями, анализом данных, созданием документов и таблиц, а также управлением программным обеспечением до полного завершения задачи. Вместо тщательного контроля каждого шага пользователь может дать GPT-5.5 сложную задачу из нескольких частей и доверить ей планирование, использование инструментов, проверку результатов и навигацию в условиях неопределенности.

HGn0U6GXoAE6BhN.png

Прорыв в агентном программировании

В тестах на агентное программирование GPT-5.5 показывает рекордные результаты. На бенчмарке Terminal-Bench 2.0, который оценивает сложные сценарии работы в командной строке, требующие планирования и координации инструментов, модель достигает точности 82,7%. На SWE-Bench Pro, измеряющем способность решать реальные задачи из GitHub, результат составляет 58,6%. При этом GPT-5.5 использует меньше токенов для выполнения тех же задач по сравнению с GPT-5.4.

Ранние тестировщики отмечают, что модель лучше понимает архитектуру систем: она точнее определяет причины сбоев, находит нужные места для исправлений и предсказывает, какие части кодовой базы будут затронуты изменениями. Один из инженеров NVIDIA описал опыт использования так: «Потеря доступа к GPT-5.5 ощущается как потеря важного инструмента — будто лишился руки».

Научные исследования и кибербезопасность

Модель GPT-5.5 показывает значительный прогресс в научной работе, где важно не только давать ответы, но и проводить исследование идей, собирать доказательства, проверять гипотезы и принимать решения о дальнейших действиях. На GeneBench, новом бенчмарке для многоступенчатого анализа данных в генетике, модель значительно превосходит GPT-5.4. Внутренняя версия модели помогла обнаружить новое доказательство о числах Рамсея — классической задаче комбинаторики.

В сфере кибербезопасности GPT-5.5 получила более строгие классификаторы рисков по сравнению с GPT-5.4. OpenAI расширяет доступ к моделям с продвинутыми кибервозможностями через программу Trusted Access for Cyber, начиная с Codex. Это позволяет верифицированным специалистам по безопасности использовать модель для легитимных задач защиты инфраструктуры с меньшим количеством ограничений.

Для разработчиков API gpt-5.5 скоро станет доступен в Responses и Chat Completions API по цене $5 за 1 млн входных токенов и $30 за 1 млн выходных токенов. Версия gpt-5.5-pro обойдется в $30 и $180 соответственно.