GPT-5 усё ж такі распрацоўваюць. Навошта яна патрэбная?
Кіраўнік OpenAI Сэм Альтман заявіў, што кампанія распрацоўвае новае пакаленне сваёй моўнай мадэлі, хоць яшчэ паўгода таму казаў, што праца прыпыненая. Мы высветлілі, навошта GPT-5 патрэбная стартапу, колькі гэта каштуе і што пра будучую мадэль думаюць эксперты.
Кіраўнік OpenAI Сэм Альтман заявіў, што кампанія распрацоўвае новае пакаленне сваёй моўнай мадэлі, хоць яшчэ паўгода таму казаў, што праца прыпыненая. Мы высветлілі, навошта GPT-5 патрэбная стартапу, колькі гэта каштуе і што пра будучую мадэль думаюць эксперты.
Вынік непрадказальны. Гендырэктар OpenAI Сэм Альтман у інтэрв’ю Financial Times заявіў, што новая мадэль будзе больш прасунутай у параўнанні з GPT-4. Аднак распрацоўшчыкам пакуль складана прадказаць, у якіх аспектах яна перасягне папярэднюю версію. Альтман не назваў даты выхаду мадэлі, але ўдакладніў, што для яе навучання спатрэбіцца больш даных, ніж пры наладжванні ранейшых мадэляў OpenAI.
Сэм Альтман, генеральны дырэктар OpenAI
«Колькасць рэчаў, якія нам трэба высветліць, перш як мы створым мадэль, якую назавем GPT-5, усё яшчэ вельмі вялікая. <…> Гэта не падобна да інжынернага праекта, пра які мы можам сказаць, што ён гарантавана спрацуе».
Як GPT-5 будзе навучацца? Распрацоўшчыкі плануюць навучаць мадэль на агульнадаступных даных і базах ад іншых кампаній. Напрыклад, OpenAI запусціла партнёрскую ініцыятыву OpenAI Data Partnerships, у рамках якой іншыя арганізацыі змогуць даваць масівы даных для навучання ўласных праектаў у галіне АІ. Іншая мэта ініцыятывы — стварыць набор даных штучнага інтэлекту з адкрытым зыходным кодам, які будзе бясплатным для распрацоўшчыкаў.
Сэм Альтман, генеральны дырэктар OpenAI
«Пакуль мы не прыступім да навучання гэтай мадэлі, для нас гэта будзе падобна да пацешнай гульні ва ўгадайку. Мы спрабуем стаць лепшымі, бо з пункта гледжання бяспекі важна прагназаваць магчымасці. Але я не магу сказаць, што менавіта GPT-5 будзе рабіць такога, чаго не рабіла GPT-4».
А што адбываецца цяпер? Кампанія ўжо паказала мадэль GPT-4 Turbo — прасунутую версію сваёй флагманскай вялікай моўнай мадэлі GPT-4. Новая версія вучылася на даных аж да красавіка 2023 года, тады як GPT-4, якая выйшла ў сакавіку, знала падзеі толькі да верасня 2021-га. Таксама паказаная мадэль будзе ў тры разы таннейшай для распрацоўшчыкаў, ніж папярэднія. GPT-4 Turbo атрымала сваю «краму праграм» і некалькі «агентаў» — плагінаў для паляпшэння тэксту, стварэння выяў, тлумачэння мемаў і г. д.
Факталагічная ацэнка мадэляў GPT па катэгорыях ведаў. Дакладнасць 1,0 азначае, што адказы мадэлі супадаюць з ідэальнымі адказамі чалавека на ўсе пытанні тэсту. Крыніца: OpenAI.
Планы OpenAI. Канчатковай мэтай намаганняў OpenAI называе распрацоўку моцнага штучнага інтэлекту агульнага прызначэння (AGI). Гэта гіпатэтычная форма АІ, здольная выконваць шырокі спектр задач і навучацца на ўзроўні, блізкім да чалавечага інтэлекту. Альтман падкрэслівае, што такія буйныя мадэлі, як GPT-5, маюць вырашальнае значэнне для стварэння AGI, хоць гэта вельмі складаная задача.
Сэм Альтман, генеральны дырэктар OpenAI
«Людзі кажуць: „У вас ёсць гэтая даследчая лабараторыя, у вас ёсць гэты API, у вас ёсць партнёрства з Microsoft, у вас ёсць гэтая штука ChatGPT, а цяпер і крама GPT“. Але насамрэч гэта не нашыя прадукты. Гэта каналы да нашага адзінага прадукту — штучнага інтэлекту».
Колькі гэта каштуе? Цяпер OpenAI не з’яўляецца прыбытковай кампаніяй, аднак яе гадавы даход значна вырас: у кастрычніку ён дасягнуў $1,3 мільярда ў параўнанні з $1 мільярдам двума месяцамі раней і $28 мільёнамі ў папярэднім годзе. Microsoft ужо інвеставала ў распрацоўкі OpenAI $10 мільярдаў пры ацэнцы кампаніі ў $29 мільярдаў. OpenAI разглядае магчымасць другаснага продажу актываў інвестарамі пры ацэнцы ў $86 мільярдаў.
Хуткасць распрацоўкі ўпіраецца ў жалеза. Распрацоўка буйнамаштабных моўных мадэляў, такіх як GPT-5, патрабуе значных выдаткаў, у прыватнасці, на набыццё высокапрадукцыйных графічных працэсараў. Напрыклад, флагманская мадэль Nvidia H100, якую выкарыстоўвае распрацоўшчык, каштуе каля $40 тысяч. Нягледзячы на дэфіцыт паставак, OpenAI пачала атрымліваць графічныя працэсары H100, неабходныя для распрацоўкі новай мадэлі, і чакае паляпшэння паставак налета. На думку Альтмана, залежнасць ад Nvidia наўрад ці будзе доўжыцца доўга, паколькі іншыя гульцы — Google, Microsoft, AMD і Intel — рыхтуюцца выпусціць канкурэнтныя чыпы для АІ.
Кампанія падабаецца не ўсім. Шматлікія крытыкі адзначаюць, што кампанія супярэчыць сама сабе — і замест заяўленай адкрытасці не спяшаецца дзяліцца падрабязнасцямі працэсу сваіх распрацовак. Яшчэ падчас прэзентацыі GPT-4 OpenAI шырока паказала вынікі тэстаў і прыклады работ, але практычна нічога не расказала пра тое, якія датасэты выкарыстоўваліся для навучання, якія былі энергазатраты, абсталяванне і метады пры распрацоўцы. У адказ сузаснавальнік стартапа Ілля Суцкевер заявіў, што кампанія абмяжоўвае інфармацыю праз канкурэнцыю.
А што ў канкурэнтаў? У ліпені Meta выпусціла вялікую моўную мадэль Llama 2 як праект з адкрытым зыходным кодам, што дазваляе наладжваць яе пад канкрэтныя задачы. Пры выкарыстанні GPT-4 даводзіцца спадзявацца толькі на тонкае наладжванне запытаў да мадэлі. У версіі Turbo функцыянал пашырылі і дадалі «агентаў», якія прасцей ствараць, чым даналаджваць мадэлі з адкрытым зыходным кодам. Яшчэ адзін канкурэнт — гэта мадэль Claude 2 ад Google і Amazon, якая мае доступ да кантэкстнага акна ў 100 тысяч токенаў. Turbo мае доступ да 128 тысяч токенаў.
Што думаюць эксперты? Спецыялісты сыходзяцца ў меркаванні, што прадбачыць магчымасці GPT-5 немагчыма, але можна выказаць здагадку перавагі мадэлі, зыходзячы з магчымасцяў ужо вядомых прадуктаў.
Менш «галюцынацый». У GPT-4 у параўнанні з GPT-3.5 факталагічнасць адказаў вышэйшая. Эксперты чакаюць, што GPT-5 яшчэ больш знізіць узровень «галюцынацый» (генерацыі недакладнай або недарэчнай інфармацыі) да менш як 10%, што павысіць надзейнасць моўных мадэляў.
Таннейшае стварэнне. Хоць дакладныя лічбы невядомыя, кошт стварэння GPT-4 быў вялікім у першую чаргу праз дарагую інфраструктуру. Спецыялісты спадзяюцца, што пры стварэнні GPT-5 выдаткі знізяцца, а эфектыўнасць павысіцца без шкоды прадукцыйнасці.
З’яўленне мультымадальнасці. GPT-5 можа значна пашырыць магчымасць генерацыі кантэнту: не толькі тэксту, але і аўдыя і відэа. Цяпер версія GPT-4 Turbo ўжо мае інтэграцыю з DALL-E — гэта значыць, што распрацоўшчыкі плануюць дадаць іншыя мультымедыйныя функцыі ў наступную версію.
Даўжэйшая памяць. Паводле прагнозаў экспертаў, GPT-5 будзе мець павялічаную даўжыню кантэксту, што дазволіць нейрасетцы запамінаць і спасылацца на ўзаемадзеянне з карыстальнікамі на працягу даўжэйшага часу. АІ будзе лепш разумець кантэкст пры аналізе натуральнай мовы і эмоцый.
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.