OpenAI запусціла свой адказ DeepSeek — мадэль, якая «разважае», упершыню стала даступная без падпіскі

OpenAI паказала o3-mini — найноўшую ў сямействе АІ-мадэляў o, што разважаюць. Рэліз адбыўся неўзабаве па абяцаннях гендырэктара кампаніі Сэма Альтмана моцна адказаць нашумеламу кітайскаму стартапу DeepSeek.

Пакінуць каментарый

Новая мадэль ужо даступная ўсім карыстальнікам ChatGPT бясплатна. Ва ўладальнікаў падпіскі Plus і Team будзе вышэйшым дзённы ліміт запытаў — 150 штук. Для падпісчыкаў Pro доступ неабмежаваны. Выбраць навінку платныя карыстальнікі могуць у выпадальным меню ChatGPT. Бясплатным трэба націснуць на кнопку «Абгрунтуй» у дыялогавым акне або на кнопку змены мадэлі ва ўжо выдадзеным адказе.

Таксама o3-mini даступная некаторым распрацоўшчыкам праз API, але першапачаткова без падтрымкі выяў. Распрацоўшчыкі могуць выбраць адзін з трох узроўняў прадукцыйнасці мадэлі (low, medium, high) у залежнасці ад сваіх патрэб і ўпадабанай затрымкі.

o3-mini заточаная пад STEM-задачы па праграмаванні, матэматыцы ды іншых навуках. Паводле слоў OpenAI, o3-mini ў цэлым не саступае сваім папярэдніцам o1 і o1-mini ў плане здольнасцяў, але яна хутчэйшая і таннейшая.

Кампанія сцвярджае, што ў ходзе выпрабаванняў іншыя карыстальнікі аддавалі перавагу адказам o3-mini перад адказамі o1-mini больш як у палове выпадкаў. Таксама o3-mini на 39% радзей груба памыляецца ў складаных пытаннях пра рэальны свет у A/B-тэстах, а таксама дае выразнейшыя адказы і працуе на 24% хутчэй за o1-mini.

«Разумовыя» здольнасці o3-mini ў ChatGPT па змаўчанні наладжаныя на сярэдні ўзровень, які дае баланс паміж якасцю і хуткасцю працы. Платныя юзеры могуць выбраць варыянт o3-mini-high — ён «разумнейшы», але думае даўжэй.

Цана o3-mini — 55 цэнтаў за 1 млн уваходных токенаў і $4,4 за 1 млн выходных токенаў (1 млн токенаў прыкладна складае 750 тысяч слоў). Гэта на 63% менш у параўнанні з о1-mini і бліжэй да расцэнак DeepSeek. Кітайскі стартап бярэ 14 цэнтаў і $2,19 адпаведна за доступ да мадэлі R1 праз API.

Што тычыцца параўнання магчымасцяў, у тэстах AIME 2024 на разуменне інструкцый o3-mini лепшая за R1 — дакладней, толькі версія «high». Таксама яна лепшая за R1 у задачах на праграмаванне SWE-bench Verified, але толькі на 0,1 пункта і толькі на «максімалках». Версія «low» з разумовымі здольнасцямі ніжэйшымі за сярэдняе прайграе R1 у задачах узроўню PhD па фізіцы, біялогіі і хіміі з бэнчмарка GPQA Diamond.

Якая іронія: OpenAI знайшла доказы таго, што DeepSeek навучаў свой АІ на яе мадэлях
Па тэме
Якая іронія: OpenAI знайшла доказы таго, што DeepSeek навучаў свой АІ на яе мадэлях
OpenAI запусціла АІ-агента, які можа купіць прадукты і зарэзерваваць квіткі замест карыстальніка
Па тэме
OpenAI запусціла АІ-агента, які можа купіць прадукты і зарэзерваваць квіткі замест карыстальніка
Амерыканскія тэхнагіганты страцілі больш за $1 трыльён капіталізацыі за дзень, але пачалі аднаўляцца
Па тэме
Амерыканскія тэхнагіганты страцілі больш за $1 трыльён капіталізацыі за дзень, але пачалі аднаўляцца

Читать на dev.by