OpenAI палепшыла генерацыю карцінак: ШІ больш не блытаецца ў тэксце
Кампанія прадставіла новую мадэль генерацыі выяваў — ChatGPT Images 2.0, якая значна прасунулася ў адным з самых слабых месцаў ШІ-графікі — працы з тэкстам.
Кампанія прадставіла новую мадэль генерацыі выяваў — ChatGPT Images 2.0, якая значна прасунулася ў адным з самых слабых месцаў ШІ-графікі — працы з тэкстам.
Кампанія прадставіла новую мадэль генерацыі выяваў — ChatGPT Images 2.0, якая значна прасунулася ў адным з самых слабых месцаў ШІ-графікі — працы з тэкстам.
Паводле дадзеных распрацоўшчыкаў, мадэль навучылася дакладна перадаваць дробныя дэталі — ад тыпаграфікі і інтэрфейсаў да складаных інфаграфік. «Images 2.0 забяспечвае беспрэцэдэнтны ўзровень дакладнасці і дэталізацыі. Мадэль здольная карэктна адлюстроўваць складаныя элементы, у тым дробны тэкст, іконкі і шчыльныя кампазіцыі», — гаворыцца ў заяве OpenAI.
Ключавое адрозненне новай версіі — рэжым «thinking capabilities». Мадэль не проста генеруе выяву па запыце, а спачатку аналізуе задачу, можа шукаць інфармацыю ў інтэрнэце і правяраць вынік. Генерацыя ператвараецца з хуткага рэндэру ў больш складаны працэс з элементамі разважання.
Мадэль таксама стала значна лепш працаваць з неангламоўным тэкстам. Цяпер яна карэктна генеруе надпісы на японскай, карэйскай, кітайскай, хіндзі ды іншых мовах, прычым тэкст не проста ўстаўляецца ў выяву, а арганічна становіцца часткай дызайну.
Яшчэ адно важнае абнаўленне — магчымасць ствараць адразу некалькі выяў па адным запыце. Сістэма можа генераваць да васьмі звязаных візуалаў з адзіным стылем і персанажамі, што спрашчае стварэнне коміксаў, прэзентацый і маркетынгавых матэрыялаў.
Новая мадэль ужо даступная карыстальнікам ChatGPT і Codex, а таксама праз API пад назвай gpt-image-2. Больш прасунутыя функцыі, уключаючы «thinking»-рэжым, даступныя ў платных падпісках.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.