Дапамажыце dev.by 🤍
Падтрымаць

Чаму ШІ хутчэй навучаецца пісаць код, чым лісты: што такое "разрыў падмацавання"

ШІ імкліва разумнее, але не ва ўсім аднолькава. За апошнія месяцы мадэлі кшталту GPT-5, Gemini 2.5 і Sonnet 4.5 зрабілі гіганцкі скачок у праграмаванні — цяпер яны не проста дапамагаюць пісаць код, а здольныя браць на сябе цэлыя кавалкі працы.

А вось генератары лістоў, здаецца, застылі на месцы ў параўнанні з тым, што было год таму — ці чат-боты, якім даводзіцца жангліраваць дзясяткам розных задач, піша TechCrunch.

Пакінуць каментарый

ШІ імкліва разумнее, але не ва ўсім аднолькава. За апошнія месяцы мадэлі кшталту GPT-5, Gemini 2.5 і Sonnet 4.5 зрабілі гіганцкі скачок у праграмаванні — цяпер яны не проста дапамагаюць пісаць код, а здольныя браць на сябе цэлыя кавалкі працы.

А вось генератары лістоў, здаецца, застылі на месцы ў параўнанні з тым, што было год таму — ці чат-боты, якім даводзіцца жангліраваць дзясяткам розных задач, піша TechCrunch.

Даследчыкі называюць гэта «разрывам падмацавання» (reinforcement gap). Гэта розніца паміж тым, чаму ШІ можа навучыцца хутка, і тым, дзе прагрэс ідзе марудна.

Прычына простая, і яна ў тым, што код лёгка правяраць. Для мадэляў ёсць маса гатовых тэстаў, якія дазваляюць імгненна зразумець, працуе праграма ці не. Гэта ідэальнае асяроддзе для навучання праз падмацаванне — механізма, які сёння рухае ШІ наперад. Калі сістэма можа атрымліваць зразумелую «ацэнку» (прайшоў тэст — не прайшоў), яе можна трэніраваць без спынення.

З тэкстамі так не атрымаецца. Што лічыць «добрым лістом» ці «ўдалым адказам чат-бота» — часта пытанне густу. Тут няма ніякага аўтаматычнага тэсту, і мадэль вучыцца павольней. Таму навыкі кшталту адладкі кода ці матэматычных разлікаў растуць сямімільнымі крокамі, а напісанне тэкстаў ці зносіны — міліметровымі.

«Разрыў падмацавання» становіцца ключавым фактарам, які вызначае, якія ШІ-навыкі будуць развівацца хутчэй. Распрацоўка ПЗ для гэтага — амаль ідэальны палігон. Яшчэ да ШІ праграмісты жылі тэстамі: юніт-тэстамі, інтэграцыйнымі, нагрузачнымі — каб упэўніцца, што код не зламаецца пры запуску. Цяпер тыя ж тэсты — сістэматычныя і маштабаваныя — правяраюць код, напісаны ШІ.

А вось праверыць «якасць ліста» ці «ўдалую прэзентацыю» немагчыма без чалавека. Хоць і тут не ўсё так адназначна, адзначае выданне: кампаніі, у якіх ёсць рэсурсы і фантазія, могуць стварыць уласныя тэсты нават для складаных абласцей кшталту фінансавай аналітыкі і бухгалтэрыі.

Часам тэставанымі аказваюцца нават тыя рэчы, якія, здавалася б, не паддаюцца аўтаматызаванай праверцы — напрыклад, Sora 2 ад OpenAI. Яе ролікі сталі нашмат больш рэалістычнымі, палепшана фізіка, і гэта — вынік таго ж навучання з падмацаваннем, толькі ўжытага да відэа.

Калі ў будучыні з’явяцца новыя падыходы да навучання ШІ, «разрыў падмацавання» можа знікнуць. Але пакуль менавіта ён вызначае, якія прафесіі і задачы паддаюцца аўтаматызацыі, а якія — яшчэ трымаюцца. Калі працэс можна вымераць і пратэставаць, яго амаль напэўна можна будзе аўтаматызаваць.

Распрацоўшчыкі губляюць кантроль над кодам створаным ШІ — меркаванне экспертаў
Распрацоўшчыкі губляюць кантроль над кодам, створаным ШІ — меркаванне экспертаў
Па тэме
Распрацоўшчыкі губляюць кантроль над кодам, створаным ШІ — меркаванне экспертаў
Кампаніі нясуць страты ад укаранення ШІ — прыбыткаў пакуль не відаць
Кампаніі нясуць страты ад укаранення ШІ — прыбыткаў пакуль не відаць
Па тэме
Кампаніі нясуць страты ад укаранення ШІ — прыбыткаў пакуль не відаць
Чытайце таксама
Беларусам будуць лячыць зубы з дапамогай ШІ
Беларусам будуць лячыць зубы з дапамогай ШІ
Беларусам будуць лячыць зубы з дапамогай ШІ
ШІ прымушае людзей думаць, што яны разумнейшыя, чым ёсць насамрэч
ШІ прымушае людзей думаць, што яны разумнейшыя, чым ёсць насамрэч
ШІ прымушае людзей думаць, што яны разумнейшыя, чым ёсць насамрэч
«Бацька інтэрнэту» распавёў пра сем фаз эвалюцыі сеціва. Мы зараз у чацвёртай
«Бацька інтэрнэту» распавёў пра сем фаз эвалюцыі сеціва. Мы зараз у чацвёртай
«Бацька інтэрнэту» распавёў пра сем фаз эвалюцыі сеціва. Мы зараз у чацвёртай
Кіраўнік OpenAI прызнаўся ў адной недарэчнай памылцы карыстальнікам ChatGPT
Кіраўнік OpenAI прызнаўся ў адной недарэчнай памылцы карыстальнікам ChatGPT
Кіраўнік OpenAI прызнаўся ў адной недарэчнай памылцы карыстальнікам ChatGPT

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.