OpenAI прокачала генерацию картинок: ИИ больше не путается в тексте
Компания представила новую модель генерации изображений — ChatGPT Images 2.0, которая заметно продвинулась в одном из самых слабых мест ИИ-графики — работе с текстом.
Компания представила новую модель генерации изображений — ChatGPT Images 2.0, которая заметно продвинулась в одном из самых слабых мест ИИ-графики — работе с текстом.
Компания представила новую модель генерации изображений — ChatGPT Images 2.0, которая заметно продвинулась в одном из самых слабых мест ИИ-графики — работе с текстом.
По данным разработчиков, модель научилась точно передавать мелкие детали — от типографики и интерфейсов до сложных инфографик. «Images 2.0 обеспечивает беспрецедентный уровень точности и детализации. Модель способна корректно отображать сложные элементы, включая мелкий текст, иконки и плотные композиции», — говорится в заявлении OpenAI.
Ключевое отличие новой версии — режим «thinking capabilities». Модель не просто генерирует картинку по запросу, а сначала анализирует задачу, может искать информацию в интернете и проверять результат. Генерация превращается из быстрого рендера в более сложный процесс с элементами рассуждения.
Модель также стала намного лучше работать с неанглоязычным текстом. Теперь она корректно генерирует надписи на японском, корейском, китайском, хинди и других языках, причем текст не просто вставляется в изображение, а органично становится частью дизайна.
Еще одно важное обновление — возможность создавать сразу несколько изображений по одному запросу. Система может генерировать до восьми связанных визуалов с единым стилем и персонажами, что упрощает создание комиксов, презентаций и маркетинговых материалов.
Новая модель уже доступна пользователям ChatGPT и Codex, а также через API под названием gpt-image-2. Более продвинутые функции, включая «thinking»-режим, доступны в платных подписках.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.