OpenAI выпусціла мадэль o3-pro, якая апярэджвае Gemini
Кампанія анансавала o3-pro, значна ўдасканаленую версію сваёй мадэлі штучнага інтэлекту o3, якую называе самай перадавой на сённяшні дзень.
Мадэль o3, запушчаная раней сёлета, прызначаная для пакрокавага вырашэння складаных задач і дэманструе высокія вынікі ў такіх галінах, як фізіка, матэматыка і праграмаванне. Новая o3-pro грунтуецца на гэтай базе, прапануючы палепшаную прадукцыйнасць і пашыраныя магчымасці.
Мадэль будзе даступная для падпісчыкаў ChatGPT Pro і Team, замяняючы папярэднюю мадэль o1-pro. Карыстальнікі Enterprise і Edu атрымаюць доступ на наступным тыдні. Акрамя таго, o3-pro цяпер даступная праз API для распрацоўшчыкаў. Кошт выкарыстання API складае $20 за мільён уваходных токенаў і $80 за мільён выходных токенаў.
Паводле дадзеных OpenAI, o3-pro пераўзыходзіць сваю папярэдніцу ва ўсіх ацэненых катэгорыях, асабліва ў такіх ключавых галінах, як навука, адукацыя, праграмаванне, бізнес і дапамога ў напісанні тэкстаў. Ацэнкі незалежных экспертаў падкрэсліваюць перавагу o3-pro у яснасці, паўнаце, дакладным выкананні інструкцый і дакладнасці.
Мадэль таксама мае прасунутыя інструменты, якія дазваляюць ёй шукаць інфармацыю ў інтэрнэце, аналізаваць файлы, разважаць пра візуальныя даныя, выконваць код на Python і персаналізаваць адказы з выкарыстаннем памяці. Аднак адказы o3-pro могуць апрацоўвацца даўжэй, чым у o1-pro, што з’яўляецца кампрамісам дзеля яе пашыраных магчымасцей.
Таксама o3-pro дэманструе добрыя вынікі на стандартных галінавых тэстах: у AIME 2024, тэсце матэматычных здольнасцей, o3-pro пераўзышла мадэль Google Gemini 2.5 Pro. У GPQA Diamond, тэсце ведаў у галіне навукі ўзроўню PhD, o3-pro абышла нядаўна выпушчаную мадэль Anthropic Claude 4 Opus.
Нягледзячы на свае дасягненні, o3-pro мае некаторыя абмежаванні: часовыя чаты ў ChatGPT адключаныя з-за тэхнічнай праблемы, генерацыя выяў не падтрымліваецца, а Canvas — функцыя працоўнай прасторы OpenAI на базе ШІ, несумяшчальная з o3-pro.
Читать на dev.by