Новость

Cтавка на долгие агентные сценарии и профессиональную автоматизацию — OpenAI представила GPT-5.2

Компания OpenAI анонсировала новое поколение своих фронтир-моделей. GPT-5.2 позиционируется как инструмент для сложной профессиональной работы, включая агентные пайплайны, многочасовые задачи с длинным контекстом и мультимодальные сценарии.

На бенчмарке SWE-Bench Pro, одном из наиболее строгих тестов для разработки, модель GPT-5.2 Thinking демонстрирует результат в 55,6% решенных задач против 50,8% у предыдущей версии GPT-5.1. На упрощенной версии SWE-Bench Verified показатель достигает 80%. Это означает меньше ручной доработки патчей, более стабильную работу с большими репозиториями и переход от вспомогательного ассистента к инструменту, способному почти автономно закрывать функциональные задачи и исправлять ошибки.

Ранние тестировщики особенно отмечают улучшения в области фронтенд-разработки: модель эффективно работает со сложными интерфейсами, нетривиальными 3D-элементами и генерацией пользовательских интерфейсов по одному большому промпту. Фактически GPT-5.2 впервые выглядит как полноценный инструмент для full-stack задач, а не просто кодогенератор.

GPT-5.2 Thinking демонстрирует значительно улучшенную работу с контекстами до 256 тысяч токенов. На тесте MRCRv2 модель почти идеально извлекает необходимую информацию, даже если она находится среди сотен тысяч токенов текста. Практический эффект позволяет загружать длинные договоры, многофайловые проекты, объемные отчеты или переписки без потери контекста, при этом ответы остаются консистентными. Через новый compact-режим GPT-5.2 способна «думать» и за пределами основного контекстного окна, что особенно важно для долгосрочных агентных сценариев.

На тесте Tau2-bench Telecom GPT-5.2 достигает 98,7% успешного использования инструментов, причем даже в быстром режиме reasoning.effort='none' точность значительно возросла. Несколько компаний уже сообщили о возможности замены набора мелких агентов одним «мега-агентом» с более чем 20 инструментами.

Модель также стала лучше понимать изображения, включая графики, дашборды, интерфейсы и технические схемы. Количество ошибок при интерпретации графических интерфейсов сократилось почти вдвое. На задачах по анализу диаграмм GPT-5.2 работает заметно аккуратнее.

Количество фактических ошибок (галлюцинаций) сократилось примерно на треть, что особенно важно для аналитики, резюмирования документов и деловой переписки.

GPT-5.2 доступна в ChatGPT для подписчиков тарифов Plus, Pro, Business и Enterprise. В API модель представлена под именами gpt-5.2 и gpt-5.2-chat-latest, а самая мощная версия выпущена как gpt-5.2-pro.

Стоимость использования в API повышена относительно GPT-5.1:
• Input: 1,75 $ за миллион токенов
• Output: 14 $ за миллион токенов
• Cached input: скидка 90%

OpenAI подчеркивает, что итоговые расходы часто оказываются ниже благодаря меньшему количеству «лишних» токенов, поскольку GPT-5.2 выполняет ту же работу короче и эффективнее.

OpenAI

Источник

12 Декабря 2025 в 14:00