OpenAI выпустила GPT-5.5: новая модель для реальной работы

Компания OpenAI представила GPT-5.5 - новую флагманскую модель, которую компания называет следующим шагом к тому, чтобы ИИ лучше справлялся с реальной работой за компьютером. Модель уже доступна пользователям тарифов Plus, Pro, Business и корпоративной подписки в ChatGPT и Codex.

Главное отличие GPT-5.5 от предыдущих версий — способность понимать намерения пользователя быстрее и брать на себя больше работы самостоятельно. Модель отлично справляется с написанием и отладкой кода, онлайн-исследованиями, анализом данных, созданием документов и таблиц, а также управлением программным обеспечением до полного завершения задачи. Вместо тщательного контроля каждого шага пользователь может дать GPT-5.5 сложную задачу из нескольких частей и доверить ей планирование, использование инструментов, проверку результатов и навигацию в условиях неопределенности.

Прорыв в агентном программировании

В тестах на агентное программирование GPT-5.5 показывает рекордные результаты. На бенчмарке Terminal-Bench 2.0, который оценивает сложные сценарии работы в командной строке, требующие планирования и координации инструментов, модель достигает точности 82,7%. На SWE-Bench Pro, измеряющем способность решать реальные задачи из GitHub, результат составляет 58,6%. При этом GPT-5.5 использует меньше токенов для выполнения тех же задач по сравнению с GPT-5.4.

Ранние тестировщики отмечают, что модель лучше понимает архитектуру систем: она точнее определяет причины сбоев, находит нужные места для исправлений и предсказывает, какие части кодовой базы будут затронуты изменениями. Один из инженеров NVIDIA описал опыт использования так: «Потеря доступа к GPT-5.5 ощущается как потеря важного инструмента — будто лишился руки».

Научные исследования и кибербезопасность

Модель GPT-5.5 показывает значительный прогресс в научной работе, где важно не только давать ответы, но и проводить исследование идей, собирать доказательства, проверять гипотезы и принимать решения о дальнейших действиях. На GeneBench, новом бенчмарке для многоступенчатого анализа данных в генетике, модель значительно превосходит GPT-5.4. Внутренняя версия модели помогла обнаружить новое доказательство о числах Рамсея — классической задаче комбинаторики.

В сфере кибербезопасности GPT-5.5 получила более строгие классификаторы рисков по сравнению с GPT-5.4. OpenAI расширяет доступ к моделям с продвинутыми кибервозможностями через программу Trusted Access for Cyber, начиная с Codex. Это позволяет верифицированным специалистам по безопасности использовать модель для легитимных задач защиты инфраструктуры с меньшим количеством ограничений.

Для разработчиков API gpt-5.5 скоро станет доступен в Responses и Chat Completions API по цене $5 за 1 млн входных токенов и $30 за 1 млн выходных токенов. Версия gpt-5.5-pro обойдется в $30 и $180 соответственно.

Model	SWE-bench
Claude Opus 4.6	80.8%
Claude Sonnet 4.6	79.6%
GPT-5.4	~80%
Gemini 3.1 Pro	80.6%
DeepSeek V3.2	72%

OpenAI выпустила GPT-5.5: новая модель для реальной работы

Прорыв в агентном программировании

Научные исследования и кибербезопасность

Читайте также

ChatGPT научился уведомлять доверенных людей при риске членовредительства

GPT-5.5 Instant: ChatGPT поумнел и стал короче отвечать

OpenAI запустила Daybreak - платформу кибербезопасности на базе GPT-5.5