Николай Чикишев 14 лістапада 2023, 14:24

GPT-5 усё ж такі распрацоўваюць. Навошта яна патрэбная?

Кіраўнік OpenAI Сэм Альтман заявіў, што кампанія распрацоўвае новае пакаленне сваёй моўнай мадэлі, хоць яшчэ паўгода таму казаў, што праца прыпыненая. Мы высветлілі, навошта GPT-5 патрэбная стартапу, колькі гэта каштуе і што пра будучую мадэль думаюць эксперты.

Пакінуць каментарый

GPT-5 усё ж такі распрацоўваюць. Навошта яна патрэбная?

Кіраўнік OpenAI Сэм Альтман заявіў, што кампанія распрацоўвае новае пакаленне сваёй моўнай мадэлі, хоць яшчэ паўгода таму казаў, што праца прыпыненая. Мы высветлілі, навошта GPT-5 патрэбная стартапу, колькі гэта каштуе і што пра будучую мадэль думаюць эксперты.

Вынік непрадказальны. Гендырэктар OpenAI Сэм Альтман у інтэрв’ю Financial Times заявіў, што новая мадэль будзе больш прасунутай у параўнанні з GPT-4. Аднак распрацоўшчыкам пакуль складана прадказаць, у якіх аспектах яна перасягне папярэднюю версію. Альтман не назваў даты выхаду мадэлі, але ўдакладніў, што для яе навучання спатрэбіцца больш даных, ніж пры наладжванні ранейшых мадэляў OpenAI.

Як GPT-5 будзе навучацца? Распрацоўшчыкі плануюць навучаць мадэль на агульнадаступных даных і базах ад іншых кампаній. Напрыклад, OpenAI запусціла партнёрскую ініцыятыву OpenAI Data Partnerships, у рамках якой іншыя арганізацыі змогуць даваць масівы даных для навучання ўласных праектаў у галіне АІ. Іншая мэта ініцыятывы — стварыць набор даных штучнага інтэлекту з адкрытым зыходным кодам, які будзе бясплатным для распрацоўшчыкаў.

А што адбываецца цяпер? Кампанія ўжо паказала мадэль GPT-4 Turbo — прасунутую версію сваёй флагманскай вялікай моўнай мадэлі GPT-4. Новая версія вучылася на даных аж да красавіка 2023 года, тады як GPT-4, якая выйшла ў сакавіку, знала падзеі толькі да верасня 2021-га. Таксама паказаная мадэль будзе ў тры разы таннейшай для распрацоўшчыкаў, ніж папярэднія. GPT-4 Turbo атрымала сваю «краму праграм» і некалькі «агентаў» — плагінаў для паляпшэння тэксту, стварэння выяў, тлумачэння мемаў і г. д.

Факталагічная ацэнка мадэляў GPT па катэгорыях ведаў. Дакладнасць 1,0 азначае, што адказы мадэлі супадаюць з ідэальнымі адказамі чалавека на ўсе пытанні тэсту. Крыніца: OpenAI.

Планы OpenAI. Канчатковай мэтай намаганняў OpenAI называе распрацоўку моцнага штучнага інтэлекту агульнага прызначэння (AGI). Гэта гіпатэтычная форма АІ, здольная выконваць шырокі спектр задач і навучацца на ўзроўні, блізкім да чалавечага інтэлекту. Альтман падкрэслівае, што такія буйныя мадэлі, як GPT-5, маюць вырашальнае значэнне для стварэння AGI, хоць гэта вельмі складаная задача.

Колькі гэта каштуе? Цяпер OpenAI не з’яўляецца прыбытковай кампаніяй, аднак яе гадавы даход значна вырас: у кастрычніку ён дасягнуў $1,3 мільярда ў параўнанні з $1 мільярдам двума месяцамі раней і $28 мільёнамі ў папярэднім годзе. Microsoft ужо інвеставала ў распрацоўкі OpenAI $10 мільярдаў пры ацэнцы кампаніі ў $29 мільярдаў. OpenAI разглядае магчымасць другаснага продажу актываў інвестарамі пры ацэнцы ў $86 мільярдаў.

Хуткасць распрацоўкі ўпіраецца ў жалеза. Распрацоўка буйнамаштабных моўных мадэляў, такіх як GPT-5, патрабуе значных выдаткаў, у прыватнасці, на набыццё высокапрадукцыйных графічных працэсараў. Напрыклад, флагманская мадэль Nvidia H100, якую выкарыстоўвае распрацоўшчык, каштуе каля $40 тысяч. Нягледзячы на дэфіцыт паставак, OpenAI пачала атрымліваць графічныя працэсары H100, неабходныя для распрацоўкі новай мадэлі, і чакае паляпшэння паставак налета. На думку Альтмана, залежнасць ад Nvidia наўрад ці будзе доўжыцца доўга, паколькі іншыя гульцы — Google, Microsoft, AMD і Intel — рыхтуюцца выпусціць канкурэнтныя чыпы для АІ.

Кампанія падабаецца не ўсім. Шматлікія крытыкі адзначаюць, што кампанія супярэчыць сама сабе — і замест заяўленай адкрытасці не спяшаецца дзяліцца падрабязнасцямі працэсу сваіх распрацовак. Яшчэ падчас прэзентацыі GPT-4 OpenAI шырока паказала вынікі тэстаў і прыклады работ, але практычна нічога не расказала пра тое, якія датасэты выкарыстоўваліся для навучання, якія былі энергазатраты, абсталяванне і метады пры распрацоўцы. У адказ сузаснавальнік стартапа Ілля Суцкевер заявіў, што кампанія абмяжоўвае інфармацыю праз канкурэнцыю.

А што ў канкурэнтаў? У ліпені Meta выпусціла вялікую моўную мадэль Llama 2 як праект з адкрытым зыходным кодам, што дазваляе наладжваць яе пад канкрэтныя задачы. Пры выкарыстанні GPT-4 даводзіцца спадзявацца толькі на тонкае наладжванне запытаў да мадэлі. У версіі Turbo функцыянал пашырылі і дадалі «агентаў», якія прасцей ствараць, чым даналаджваць мадэлі з адкрытым зыходным кодам. Яшчэ адзін канкурэнт — гэта мадэль Claude 2 ад Google і Amazon, якая мае доступ да кантэкстнага акна ў 100 тысяч токенаў. Turbo мае доступ да 128 тысяч токенаў.

Што думаюць эксперты? Спецыялісты сыходзяцца ў меркаванні, што прадбачыць магчымасці GPT-5 немагчыма, але можна выказаць здагадку перавагі мадэлі, зыходзячы з магчымасцяў ужо вядомых прадуктаў.

Менш «галюцынацый». У GPT-4 у параўнанні з GPT-3.5 факталагічнасць адказаў вышэйшая. Эксперты чакаюць, што GPT-5 яшчэ больш знізіць узровень «галюцынацый» (генерацыі недакладнай або недарэчнай інфармацыі) да менш як 10%, што павысіць надзейнасць моўных мадэляў.
Таннейшае стварэнне. Хоць дакладныя лічбы невядомыя, кошт стварэння GPT-4 быў вялікім у першую чаргу праз дарагую інфраструктуру. Спецыялісты спадзяюцца, што пры стварэнні GPT-5 выдаткі знізяцца, а эфектыўнасць павысіцца без шкоды прадукцыйнасці.
З’яўленне мультымадальнасці. GPT-5 можа значна пашырыць магчымасць генерацыі кантэнту: не толькі тэксту, але і аўдыя і відэа. Цяпер версія GPT-4 Turbo ўжо мае інтэграцыю з DALL-E — гэта значыць, што распрацоўшчыкі плануюць дадаць іншыя мультымедыйныя функцыі ў наступную версію.
Даўжэйшая памяць. Паводле прагнозаў экспертаў, GPT-5 будзе мець павялічаную даўжыню кантэксту, што дазволіць нейрасетцы запамінаць і спасылацца на ўзаемадзеянне з карыстальнікамі на працягу даўжэйшага часу. АІ будзе лепш разумець кантэкст пры аналізе натуральнай мовы і эмоцый.