Дапамажыце dev.by 🤍
Падтрымаць

Развіццё разважаючага ШІ хутка дасягне столі, лічаць эксперты

Разважаючыя мадэлі ШІ, такія як o3 ад OpenAI, хутка прагрэсу́юць, асабліва ў вырашэнні задач па матэматыцы і праграмаванні. Аднак даследаванне Epoch AI паказвае, што іх імклівы рост можа запаволіцца ўжо праз год з-за абмежаванняў у вылічальных рэсурсах і дадзеных.

Пакінуць каментарый
Развіццё разважаючага ШІ хутка дасягне столі, лічаць эксперты

Разважаючыя мадэлі ШІ, такія як o3 ад OpenAI, хутка прагрэсу́юць, асабліва ў вырашэнні задач па матэматыцы і праграмаванні. Аднак даследаванне Epoch AI паказвае, што іх імклівы рост можа запаволіцца ўжо праз год з-за абмежаванняў у вылічальных рэсурсах і дадзеных.

OpenAI паведаміла, што мадэль o3 выкарыстоўвае ў 10 разоў больш вылічэнняў для навучання разважанню, чым яе папярэдніца o1, выпушчаная ўсяго чатыры месяцы таму. Гэта дазволіла o3 істотна палепшыць вынікі ў тэстах, такіх як AIME і задачах па праграмаванні ад METR.

Аднак такія скачкі кожныя некалькі месяцаў не могуць працягвацца доўга. Паводле ацэнкі Epoch AI, калі цяперашнія тэмпы росту захаваюцца, то вылічэнні, неабходныя для навучання разважанню, дасягнуць мяжы — каля 1e26 FLOP — ужо да 2026 года. Пасля гэтага рост запаволіцца да 4-кратнага на год, як і ў астатняй індустрыі ШІ.

Магчымая траекторыя росту вылічэнняў для навучання разважанню, калі маштабаванне, падобнае да скачка паміж o1 і o3, працягнецца. Крыніца: Epoch AI.

Мадэлі разважання ствараюцца ў два этапы: спачатку іх навучаюць на велізарных наборах дадзеных, а затым выкарыстоўваюць навучанне з падмацаваннем (RL), дзе мадэлі атрымліваюць зваротную сувязь за рашэнне складаных задач. Гэты RL-этап патрабуе значных вылічальных рэсурсаў.

Напрыклад, мадэль DeepSeek-R1 выкарыстала каля 6e23 FLOP (прыкладна $1 мільён) на RL-навучанне, што склала 20% ад выдаткаў на яе папярэдняе навучанне. Для параўнання: іншыя мадэлі, такія як Llama-Nemotron Ultra ад Nvidia (1e23 FLOP) і Phi-4-reasoning ад Microsoft (менш за 1e20 FLOP), патрабуюць розны ўзровень вылічэнняў, але іх навучанне абапіраецца на сінтэтычныя дадзеныя, што ўскладняе параўнанне.

Існуюць і іншыя перашкоды. Гэта недахоп дадзеных: для RL-навучання патрэбны разнастайныя складанныя задачы, але іх стварэнне ці генерацыя ў дастатковай колькасці — складаная задача. Таксама ёсць праблема абагульнення: мадэлі выдатна спраўляюцца з матэматыкай і кодам, але іх эфектыўнасць у творчых ці неадназначных задачах пад пытаннем.

Да гэтага часу ўсе мадэлі ШІ схільныя да «галюцынацый»: разважаючыя мадэлі часцей даюць выдуманыя або памылковыя адказы, чым звычайныя ШІ. Распрацоўшчыкі таксама сутыкаюцца з прыхаванымі выдаткамі, напрыклад, даследаванні і эксперыменты па наладжванні мадэляў могуць каштаваць даражэй, чым само навучанне.

Гендырэктар Anthropic Дарыа Амадэй у студзені адзначыў, што выдаткі на RL-навучанне пакуль што невялікія — каля $1–10 мільёнаў, але кампаніі ўжо арыентуюцца на сотні мільёнаў. Гэта сведчыць аб тым, што o1 і o3 яшчэ не дасягнулі мяжы вылічэнняў, але набліжаюцца да яе.

Даследчыкі OpenAI, у тым ліку Дэн Робертс, упэўненыя, што далейшае павелічэнне вылічэнняў палепшыць мадэлі. Аднак калі вылічэнні ўпруцца ў столь, прагрэс можа залежаць ад новых алгарытмаў або дадзеных. Эксперты мяркуюць, што наступны год стане ключавым для разумення таго, як далёка могуць зайсці мадэлі разважання.

Трамп скасаваў забарону Байдэна на экспарт чыпаў для ШІ
Трамп скасаваў забарону Байдэна на экспарт чыпаў для ШІ
Па тэме
Трамп скасаваў забарону Байдэна на экспарт чыпаў для ШІ
Палова — што дасць буст траціна — што забярэ працу: беларусы выказаліся пра ШІ
Палова — што дасць буст, траціна — што забярэ працу: беларусы выказаліся пра ШІ
Па тэме
Палова — што дасць буст, траціна — што забярэ працу: беларусы выказаліся пра ШІ
OpenAI: ШІ навучыўся самастойна генераваць новыя веды
OpenAI: ШІ навучыўся самастойна генераваць новыя веды
Па тэме
OpenAI: ШІ навучыўся самастойна генераваць новыя веды
Чытайце таксама
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Искусственный интеллект уже стал повседневностью: голосовой помощник включает музыку, робот-пылесос сканирует пространство и убирает квартиру, алгоритм ранжирования настраивает ленту в TikTok, а беспилотные такси уже свободно курсируют по городам. Получить профессию в сфере ИИ с зарплатой от $100k в год тоже стало проще — собрали 5 интересных курсов от Udacity. 
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
2 каментарыя
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
1 каментарый

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.