Дапамажыце dev.by 🤍
Падтрымаць

Гэты просты спосаб дапамагае павысіць дакладнасць ШІ да 76%

Даследчыкі Google прапанавалі просты спосаб павысіць дакладнасць адказаў вялікіх моўных мадэляў. Новая тэхніка дазваляе павялічыць дакладнасць ШІ да 76% на задачах, якія не патрабуюць складаных разважанняў, і працуе практычна без стратаў па хуткасці.

2 каментарыя
Гэты просты спосаб дапамагае павысіць дакладнасць ШІ да 76%

Даследчыкі Google прапанавалі просты спосаб павысіць дакладнасць адказаў вялікіх моўных мадэляў. Новая тэхніка дазваляе павялічыць дакладнасць ШІ да 76% на задачах, якія не патрабуюць складаных разважанняў, і працуе практычна без стратаў па хуткасці.

Метад выглядае вельмі проста: запыт карыстальніка літаральна капіюецца і ўстаўляецца два разы запар. Тым не менш тэсты паказалі, што паўтор запыту стабільна паляпшае вынікі ў вядучых мадэляў, уключаючы Gemini, GPT-4o, Claude і DeepSeek.

Аўтары працы тлумачаць эфект архітэктурнымі абмежаваннямі ШІ-сістэм. Большасць моўных мадэляў апрацоўваюць тэкст строга злева направа і не «бачаць» будучыя токены. З-за гэтага фармулёўка і парадак інфармацыі ў запыце моцна ўплываюць на канчатковы адказ. Калі запыт паўтараецца, мадэль, апрацоўваючы другую копію, ужо мае ў «памяці» ўсю першую, што дазваляе ёй больш дакладна інтэрпрэтаваць дэталі і ліквідаваць неадназначнасці.

У ходзе эксперыментаў каманда пратэставала сем папулярных бенчмаркаў і сем мадэляў: ад кампактных версій да флагманскіх. У 47 з 70 параўнанняў паўтор запыту аказаўся лепшым за стандартны падыход і ні ў адным выпадку не даў горшы вынік. Асабліва прыкметны эфект назіраўся ў задачах на дакладнае выманне інфармацыі. У адным з тэстаў дакладнасць мадэлі Gemini 2.0 Flash Lite вырасла з 21% да 97% пасля простага падваення ўваходнага запыту.

Абмежаванне ў метаду таксама ёсць. Ён практычна не дае выйгрышу там, дзе мадэлі просяць «разважаць крок за крокам». На думку даследчыкаў, у такіх сцэнарах самі мадэлі ўжо фактычна паўтараюць умовы задачы ў працэсе разважанняў, таму дадатковы паўтор ва ўваходных даных становіцца залішнім.

Аўтары лічаць, што тэхніка асабліва карысная для прыкладных задач: класіфікацыі, пошуку фактаў, вымання даных і кароткіх адказаў. Для бізнесу гэта можа азначаць магчымасць атрымліваць больш якасныя вынікі ад хуткіх і танных мадэляў без пераходу на больш дарагія рашэнні.

Вайна супраць ШІ пачалася: актывісты прыдумалі спосаб «атручваць» мадэлі
Вайна супраць ШІ пачалася: актывісты прыдумалі спосаб «атручваць» мадэлі
Па тэме
Вайна супраць ШІ пачалася: актывісты прыдумалі спосаб «атручваць» мадэлі
ШІ-стартап наймае беспрацоўных каб навучыць мадэлі замяняць іх жа прафесіі
ШІ-стартап наймае беспрацоўных, каб навучыць мадэлі замяняць іх жа прафесіі
Па тэме
ШІ-стартап наймае беспрацоўных, каб навучыць мадэлі замяняць іх жа прафесіі
ШІ-бэнчмаркі хлусяць але ўсе працягваюць імі карыстацца — даследаванне
ШІ-бэнчмаркі хлусяць, але ўсе працягваюць імі карыстацца — даследаванне
Па тэме
ШІ-бэнчмаркі хлусяць, але ўсе працягваюць імі карыстацца — даследаванне
Чытайце таксама
«Занадта шмат ведаў — гэта дрэнна»: CEO ШІ-стартапа ў першую чаргу наймае зумераў
«Занадта шмат ведаў — гэта дрэнна»: CEO ШІ-стартапа ў першую чаргу наймае зумераў
«Занадта шмат ведаў — гэта дрэнна»: CEO ШІ-стартапа ў першую чаргу наймае зумераў
2 каментарыя
З'явілася фрыланс-біржа, на якой ШІ-агенты могуць наняць людзей
З'явілася фрыланс-біржа, на якой ШІ-агенты могуць наняць людзей
З'явілася фрыланс-біржа, на якой ШІ-агенты могуць наняць людзей
У ШІ-агентаў новая напасць: «чарвякі-промпты» заражаюць цэлыя экасістэмы
У ШІ-агентаў новая напасць: «чарвякі-промпты» заражаюць цэлыя экасістэмы
У ШІ-агентаў новая напасць: «чарвякі-промпты» заражаюць цэлыя экасістэмы
Толькі 3,3% карыстальнікаў Copilot сталі платнымі кліентамі Microsoft
Толькі 3,3% карыстальнікаў Copilot сталі платнымі кліентамі Microsoft
Толькі 3,3% карыстальнікаў Copilot сталі платнымі кліентамі Microsoft

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

0

Я просто прошу перепроверить прошлый ответ, обычно тоже срабатывает.

hottaby422
hottaby422 Консультант в Сам себе буратино
0

У меня периодически начинает до последнего держаться за изначальный ответ. И с большими выборками чисел иногда чудит. Не может уникальные значения нормально отобрать. И это характерно не для одной модели, а для нескольких

Карыстальнік адрэдагаваў каментарый 14 студзеня 2026, 17:07