OpenAI представила свою новейшую флагманскую языковую модель GPT-5, которая уже стала доступной как для пользователей ChatGPT, так и для разработчиков через API.
В компании утверждают, что новая модель демонстрирует лучшую точность, более высокую скорость ответов и значительно меньше ошибок. Несмотря на то, что аудитория ChatGPT уже приближается к 700 миллионам еженедельных пользователей, OpenAI не имела самой мощной модели на рынке с момента выпуска GPT-4. Теперь в компании надеются, что GPT-5 позволит вернуть лидерство, особенно в ключевых отраслях.
Версии GPT-5 и доступ
GPT-5 уже интегрирован в ChatGPT. Пользователям с бесплатными аккаунтами модель доступна с определенными ограничениями — после превышения лимита запросов будет происходить автоматическое переключение на облегченную версию GPT-5 mini.
Для разработчиков предусмотрено три варианта:
- GPT-5
- GPT-5 mini
- GPT-5 nano
Они отличаются мощностью и стоимостью использования. Кроме того, ChatGPT получил новые "личности" для моделей — Cynic (Циник), Robot (Робот), Listener (Слушатель) и Nerd (Ботаник), а также возможность настраивать цветовую тему интерфейса для каждого отдельного чата.
Что нового может GPT-5
В OpenAI отмечают, что GPT-5 открывает новую эпоху — так называемое "программное обеспечение по требованию". В тестах модель превзошла конкурентов на ряде ведущих бенчмарков для программистов, таких как SWE-Bench, SWE-Lancer и Aider Polyglot.
Во время демонстрации на пресс-брифинге руководитель департамента постобучения OpenAI Янн Дюбуай продемонстрировал, как GPT-5 создает полноценный сайт для изучения французского языка за считанные секунды. Модель самостоятельно написала сотни строк кода, и все работало без ошибок в реальном времени.
С момента запуска в 2022 году ChatGPT обрабатывает более 1,7 миллиона запросов в минуту. OpenAI ставит себе амбициозную цель — сделать чат-бота частью жизни каждого восьмого жителя планеты.
Результаты тестирования
GPT-5 показала высокие результаты в различных задачах:
SWE-Bench Verified (реальные задачи из GitHub): 74,9% успешных решений с первой попытки — лучше, чем Claude Opus 4.1 (74,5%) и Gemini 2.5 Pro (59,6%).
"Последний экзамен человечества": в версии GPT-5 Pro модель получила 42%, что немного ниже, чем Grok 4 Heavy от xAI (44,4%).
GPQA Diamond (PhD-уровень): 89,4%, что выше Claude Opus 4.1 (80,9%) и Grok 4 Heavy (88,9%).
HealthBench Hard Hallucinations (точность ответов в теме здравоохранения): GPT-5 ошибалась только в 1,6% случаев, значительно лучше предыдущих версий GPT-4o (12,9%) и o3 (15,8%).
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F30%2F2004dd651e7c8edc27a3a065957f022a.jpg)
Tau-bench: в задачах, симулирующих навигацию по веб-сайтам, GPT-5 показала смешанные результаты — 63,5% на сайтах авиакомпаний (несколько хуже o3) и 81,1% на торговых платформах (меньше, чем Claude Opus 4.1 с 82,4%).
OpenAI также отмечает, что GPT-5 лучше справляется с творческими задачами, написанием текстов и является "более безопасной", меньше подверженной дезинформации и манипуляциям. Кроме того, модель лучше распознает злонамеренные намерения пользователей.
Ранее сообщалось о том, что OpenAI объявила о введении новой политики для ChatGPT: отныне чат-бот не будет давать окончательных советов в сложных личных вопросах, в частности не будет рекомендовать пользователям разрывать отношения с партнерами.