OpenAI добавила в GPT-4o улучшенную генерацию изображений — теперь в ChatGPT по умолчанию

26 марта, 14:28

OpenAI представила долгожданное улучшение генерации изображений. Теперь вместо отдельной модели, например DALL-E, новый усовершенствованный генератор изображений является частью GPT-4o.

На рынке существует множество ИИ-моделей для создания впечатляющих визуальных сцен, но они часто испытывают трудности с отображением текста, логотипов и других элементов, которые нередко встречаются в повседневной жизни.

OpenAI утверждает, что ее новая генерация изображений GPT-4o решает эти недостатки. Она может точно воспроизводить текст и лучше следовать инструкциям благодаря своей базе знаний и контексту чата. Кроме того, новая модель позволяет редактировать загруженные изображения или создавать новые, используя загруженное изображение в качестве визуального вдохновения.

Доступность и новые возможности

Обновленный генератор изображений в GPT-4o уже начинает разворачиваться для всех пользователей ChatGPT Plus, Pro, Team и Free. Поскольку эта модель станет стандартной для генерации изображений в ChatGPT, пользователям больше не нужно будет выбирать ее вручную перед вводом запроса.

Пользователи могут настраивать изображения, указывая соотношение сторон, точные цвета (HEX-коды) или даже прозрачный фон. В ближайшие недели новый генератор появится и для пользователей ChatGPT Enterprise и Edu.

Новую модель также можно использовать в Sora для создания изображений или через специальный DALL-E GPT. Для разработчиков поддержка генерации изображений через API GPT-4o появится в ближайшие недели.

Спецпроекты

Ограничения модели

Несмотря на многочисленные улучшения, у модели все еще есть некоторые ограничения:

Время генерации — из-за повышенной детализации создание изображения может занимать до одной минуты.
Кадрирование — длинные изображения, например постеры, могут обрезаться слишком плотно, особенно в нижней части.
Придумывание деталей — в запросах с недостаточной контекстной информацией модель может «домысливать» детали.
Ограничение знаний — при создании сложных концепций (например, полной периодической таблицы) модель может неточно воспроизводить более чем 10-20 объектов одновременно.
Трудности с нелатинскими языками — символы могут отображаться некорректно или искажаться.
Редактирование частей изображения — исправление отдельных деталей (например, орфографических ошибок) не всегда работает без побочных изменений в изображении.
Проблемы с детализацией на малых размерах — модель может некорректно отображать мелкие детали.

OpenAI планирует исправлять эти ограничения в ближайшие недели и месяцы.

Все изображения, созданные с помощью этого генератора, будут содержать C2PA-метаданные, а внутренний инструмент OpenAI сможет проверять их происхождение.

Несмотря на некоторые ограничения, новый генератор изображений GPT-4o значительно улучшает точность и гибкость создания изображений. OpenAI обещает дальнейшие усовершенствования, поэтому пользователей ждет еще более качественный и удобный инструмент для работы с изображениями.

Недавно OpenAI запустила GPT-4.5, но с ограниченным доступом — потому что «закончились GPU».

Спецпроекты

Источник: neowin

OpenAI добавила в GPT-4o улучшенную генерацию изображений — теперь в ChatGPT по умолчанию - Фото 2

Источник материала

ITC

Поделиться сюжетом

Технологии

Наука Космос Гаджеты Игры Интернет Другие

Відбудеться вебінар щодо участі у земельних аукціонах Прозорро.Продажі

AgroNews

9 минут назад

Лучше солнечных панелей: в Германии придумали микроветряные турбины. Как работают

Фокус

20 минут назад

Первая за полвека высадка на Луну: Китай может обогнать США и стать главной страной в космосе

Фокус

53 минуты назад

Общая аудитория PlayStation и Xbox сокращается: Эксперты назвали ключевые проблемы консолей — есть тревожные тенденции

GameMag

1 час назад

Украина уничтожила гигантский телескоп, который использовали для связи с инопланетянами

Фокус

3 часа назад

Будут катастрофические последствия для всего мира: чего нельзя допустить на Земле

Comments UA

4 часа назад

OpenAI добавила в GPT-4o улучшенную генерацию изображений — теперь в ChatGPT по умолчанию

Доступность и новые возможности

Ограничения модели

Технологии

Відбудеться вебінар щодо участі у земельних аукціонах Прозорро.Продажі

Лучше солнечных панелей: в Германии придумали микроветряные турбины. Как работают

Первая за полвека высадка на Луну: Китай может обогнать США и стать главной страной в космосе

Общая аудитория PlayStation и Xbox сокращается: Эксперты назвали ключевые проблемы консолей — есть тревожные тенденции

Неизвестный сухопутный мост мог соединять Азию и Европу еще в плейстоцене

Новинка серед тракторів 50 к.с. – ДТЗ 504U: баланс сили й надійності

Стало відомо, які товари можуть відчутно подорожчати у 2026 р

Украина уничтожила гигантский телескоп, который использовали для связи с инопланетянами

Будут катастрофические последствия для всего мира: чего нельзя допустить на Земле

Технологии

Відбудеться вебінар щодо участі у земельних аукціонах Прозорро.Продажі

Лучше солнечных панелей: в Германии придумали микроветряные турбины. Как работают

Первая за полвека высадка на Луну: Китай может обогнать США и стать главной страной в космосе

Общая аудитория PlayStation и Xbox сокращается: Эксперты назвали ключевые проблемы консолей — есть тревожные тенденции

Неизвестный сухопутный мост мог соединять Азию и Европу еще в плейстоцене

Новинка серед тракторів 50 к.с. – ДТЗ 504U: баланс сили й надійності

Стало відомо, які товари можуть відчутно подорожчати у 2026 р

Украина уничтожила гигантский телескоп, который использовали для связи с инопланетянами

Будут катастрофические последствия для всего мира: чего нельзя допустить на Земле