Рэліз мадэлі OpenAI o3 паказаў, што выдаткі на распрацоўку АІ значна растуць

Новая мадэль штучнага інтэлекту о3 ад OpenAI значна палепшыла прадукцыйнасць дзякуючы маштабаванню ў часе тэсціравання, аднак гэта дасягаецца за кошт істотнага павелічэння вылічальных выдаткаў, што ставіць пытанні наконт яе практычнага прымянення.

Пакінуць каментарый

Мадэль о3 ад OpenAI выклікала вялікую цікавасць у свеце АІ, паколькі яна паказвае, што прагрэс у маштабаванні АІ не дасягнуў сваёй мяжы. o3 значна пераўзыходзіць іншыя мадэлі ў часе тэстаў, такіх як ARC-AGI (AI Readiness Challenge for Artificial General Intelligence). Гэта набор складаных тэстаў і задач, створаных для праверкі здольнасці мадэляў АІ вырашаць шырокі спектр праблем, якія патрабуюць гнуткага мыслення і адаптацыі, набліжаных да чалавечага ўзроўню інтэлекту.

Паводле даных TechCrunch, мадэль o3 набрала 88% у тэсце ARC-AGI, а папярэдняя мадэль o1 набрала ўсяго 32%. Таксама на складаным тэсце па матэматыцы о3 паказала 25%, а іншыя мадэлі не перавысілі 2%.

Маштабаванне ў часе тэсціравання азначае, што OpenAI выкарыстоўвае больш вылічальных рэсурсаў у часе фазы вываду (inference), то-бок пасля таго, як карыстальнік уводзіць запыт. Гэты працэс можа ўключаць выкарыстанне большай колькасці вылічальных магчымасцяў або даўжэйшага часу апрацоўкі перад выдачай адказу, часам ад 10 да 15 хвілін.

Прадукцыйнасць о-серыі OpenAI згодна з тэстам ARC-AGI. Крыніца: ARC Prize.

Ноам Браун, адзін з распрацоўшчыкаў o-серыі мадэляў OpenAI, адзначыў, што o3 была паказаная ўсяго праз тры месяцы пасля o1, што з’яўляецца вельмі кароткім прамежкам часу для такога скачка ў прадукцыйнасці. Джэк Кларк, сузаснавальнік Anthropic, заявіў, што o3 з’яўляецца сведчаннем таго, што прагрэс у АІ будзе хутчэйшым у 2025 годзе, чым у 2024 годзе. Кларк таксама мяркуе, што налета будуць аб’яднаныя метады маштабавання ў часе тэсціравання і традыцыйнае папярэдняе навучанне для далейшага паляпшэння мадэляў.

Высокапрадукцыйная версія o3 выкарыстоўвала больш за $1000 долараў вылічальных рэсурсаў на кожную задачу, а для праходжання тэсту ARC-AGI спатрэбілася рэсурсаў больш чым на $10 тысяч, што робіць яе дарагой. Для параўнання: мадэль o1 выкарыстала каля $5 долараў вылічальных рэсурсаў на задачу, а o1-mini — усяго некалькі цэнтаў.

Стваральнік тэсту ARC-AGI Франсуа Шале лічыць o3 прарывам у развіцці АІ: мадэль здольная хутка адаптавацца да новых задач і набліжацца да чалавечага ўзроўню прадукцыйнасці. Тым не менш Шале адзначае, што o3 не з’яўляецца AGI (агульны штучны інтэлект) і па-ранейшаму не спраўляецца з некаторымі простымі задачамі, якія лёгка вырашаюцца чалавекам. Акрамя таго, o3 не вырашае праблемы «галюцынацый», якая прысутнічае ў вялікіх моўных мадэлях.

Праз высокі кошт вылічальных рэсурсаў o3 наўрад ці стане паўсядзённым інструментам. Хутчэй за ўсё, яна можа быць карысная для вырашэння складаных задач, якія патрабуюць высокай дакладнасці, напрыклад, для буйных кампаній або навуковых даследаванняў. Прафесар Уортанскай школы бізнэсу Ітан Молік адзначыў, што o3, верагодна, будзе даступная толькі арганізацыям з вялікімі бюджэтамі, па меншай меры на пачатковым этапе.

OpenAI представила модель o3 — она первой в мире обошла людей в тесте на общий ИИ 
По теме
OpenAI представила модель o3 — она первой в мире обошла людей в тесте на общий ИИ
WSJ: OpenAI тратит огромное количество денег и времени на разработку GPT-5. Результаты не впечатляют
По теме
WSJ: OpenAI тратит огромное количество денег и времени на разработку GPT-5. Результаты не впечатляют
Microsoft внедряет другие модели ИИ в Copilot 365, чтобы снизить зависимость от OpenAI
По теме
Microsoft внедряет другие модели ИИ в Copilot 365, чтобы снизить зависимость от OpenAI

Читать на dev.by