Николай Чикишев 26 сакавіка 2025, 12:03

OpenAI дадала новы генератар выяў у ChatGPT

Кампанія абвясціла пра буйное абнаўленне ў ChatGPT, укараніўшы новую функцыю генерацыі выяў на базе перадавой мультымадальнай мадэлі GPT-4o. Гэтая інтэграцыя робіць стварэнне і рэдагаванне выяў даступным непасрэдна ў інтэрфейсе чат-бота для ўсіх карыстальнікаў.

Пакінуць каментарый

Новая функцыя атрымала назву 4o Image Generation (Images in ChatGPT). Яна значна лепш разумее кантэкст і дакладней інтэрпрэтуе складаныя запыты. У адрозненні ад DALL·E 3, GPT-4o дэманструе істотныя паляпшэнні ў злучэнні атрыбутаў з аб’ектамі, карэктна апрацоўваючы вялікую колькасць элементаў на выяве.

Калі папярэднія мадэлі маглі блытаць колеры і формы пры працы з 5-8 аб’ектамі, то GPT-4o здольны без памылак апрацоўваць да 15-20. Акрамя таго, новая мадэль значна палепшыла генерацыю чытэльнага тэксту непасрэдна на выявах, што раней было сур’ёзнай праблемай.

Распрацоўшчыкі выкарысталі аўтарэгрэсіўны падыход да генерацыі выяў: сістэма стварае выяву паступова, злева направа і зверху ўніз. Гэты метад, які адрозніваецца ад дыфузійнага падыходу DALL-E, дзе выява ствараецца цалкам, мяркуецца, забяспечвае больш дакладны кантроль над дэталямі, асабліва пры працы з тэкстам і складанымі сцэнамі.

Акрамя генерацыі новых выяў, 4o Image Generation прапануе магчымасць рэдагаваць ужо загружаныя карыстальнікам выявы. Па тэкставым запыце можна дадаваць або выдаляць аб’екты. Таксама палепшаная праца з празрыстым фонам для стварэння лагатыпаў, стыкераў і элементаў інтэрфейсу.

Усе згенераваныя выявы будуць утрымліваць метаданыя C2PA, якія паказваюць на іх паходжанне. Сістэма таксама блакуе генерацыю дыпфэйкаў, сцэн гвалту і матэрыялаў, звязаных з эксплуатацыяй дзяцей. Кампанія падкрэсліла, што былі прыняты меры для прадухілення злоўжыванняў, асабліва што тычыцца дыпфэйкаў.

Нягледзячы на адсутнасць бачных вадзяных знакаў, OpenAI мае інструменты для адсочвання паходжання выяў. Кампанія паведамляе, што таксама надае форму адмовы для аўтараў, якія хочуць выключыць свае працы з навучальных дадзеных, і ўлічвае запыты на забарону збору дадзеных з пэўных сайтаў.

Функцыя 4o Image Generation ужо даступная ўсім карыстальнікам ChatGPT, у тым ліку тым, хто выкарыстоўвае бясплатны тарыф. Для бясплатных карыстальнікаў устаноўлены ліміт у 3 выявы на дзень, аналагічны ліміту DALL·E 3.

OpenAI зрабіла галасавыя зносіны з ChatGPT больш прыемнымі і натуральнымі

Па тэме

OpenAI зрабіла галасавыя зносіны з ChatGPT больш прыемнымі і натуральнымі

Карыстальнік спытаў ChatGPT пра сябе. Чат-бот абвінаваціў яго ў забойстве дзяцей

Па тэме

Карыстальнік спытаў ChatGPT пра сябе. Чат-бот абвінаваціў яго ў забойстве дзяцей

ChatGPT на macOS теперь может напрямую редактировать код

Па тэме

ChatGPT на macOS теперь может напрямую редактировать код

Читать на dev.by