Дапамажыце dev.by 🤍
Падтрымаць

Гэты просты спосаб дапамагае павысіць дакладнасць ШІ да 76%

Даследчыкі Google прапанавалі просты спосаб павысіць дакладнасць адказаў вялікіх моўных мадэляў. Новая тэхніка дазваляе павялічыць дакладнасць ШІ да 76% на задачах, якія не патрабуюць складаных разважанняў, і працуе практычна без стратаў па хуткасці.

2 каментарыя
Гэты просты спосаб дапамагае павысіць дакладнасць ШІ да 76%

Даследчыкі Google прапанавалі просты спосаб павысіць дакладнасць адказаў вялікіх моўных мадэляў. Новая тэхніка дазваляе павялічыць дакладнасць ШІ да 76% на задачах, якія не патрабуюць складаных разважанняў, і працуе практычна без стратаў па хуткасці.

Метад выглядае вельмі проста: запыт карыстальніка літаральна капіюецца і ўстаўляецца два разы запар. Тым не менш тэсты паказалі, што паўтор запыту стабільна паляпшае вынікі ў вядучых мадэляў, уключаючы Gemini, GPT-4o, Claude і DeepSeek.

Аўтары працы тлумачаць эфект архітэктурнымі абмежаваннямі ШІ-сістэм. Большасць моўных мадэляў апрацоўваюць тэкст строга злева направа і не «бачаць» будучыя токены. З-за гэтага фармулёўка і парадак інфармацыі ў запыце моцна ўплываюць на канчатковы адказ. Калі запыт паўтараецца, мадэль, апрацоўваючы другую копію, ужо мае ў «памяці» ўсю першую, што дазваляе ёй больш дакладна інтэрпрэтаваць дэталі і ліквідаваць неадназначнасці.

У ходзе эксперыментаў каманда пратэставала сем папулярных бенчмаркаў і сем мадэляў: ад кампактных версій да флагманскіх. У 47 з 70 параўнанняў паўтор запыту аказаўся лепшым за стандартны падыход і ні ў адным выпадку не даў горшы вынік. Асабліва прыкметны эфект назіраўся ў задачах на дакладнае выманне інфармацыі. У адным з тэстаў дакладнасць мадэлі Gemini 2.0 Flash Lite вырасла з 21% да 97% пасля простага падваення ўваходнага запыту.

Абмежаванне ў метаду таксама ёсць. Ён практычна не дае выйгрышу там, дзе мадэлі просяць «разважаць крок за крокам». На думку даследчыкаў, у такіх сцэнарах самі мадэлі ўжо фактычна паўтараюць умовы задачы ў працэсе разважанняў, таму дадатковы паўтор ва ўваходных даных становіцца залішнім.

Аўтары лічаць, што тэхніка асабліва карысная для прыкладных задач: класіфікацыі, пошуку фактаў, вымання даных і кароткіх адказаў. Для бізнесу гэта можа азначаць магчымасць атрымліваць больш якасныя вынікі ад хуткіх і танных мадэляў без пераходу на больш дарагія рашэнні.

Вайна супраць ШІ пачалася: актывісты прыдумалі спосаб «атручваць» мадэлі
Вайна супраць ШІ пачалася: актывісты прыдумалі спосаб «атручваць» мадэлі
Па тэме
Вайна супраць ШІ пачалася: актывісты прыдумалі спосаб «атручваць» мадэлі
ШІ-стартап наймае беспрацоўных каб навучыць мадэлі замяняць іх жа прафесіі
ШІ-стартап наймае беспрацоўных, каб навучыць мадэлі замяняць іх жа прафесіі
Па тэме
ШІ-стартап наймае беспрацоўных, каб навучыць мадэлі замяняць іх жа прафесіі
ШІ-бэнчмаркі хлусяць але ўсе працягваюць імі карыстацца — даследаванне
ШІ-бэнчмаркі хлусяць, але ўсе працягваюць імі карыстацца — даследаванне
Па тэме
ШІ-бэнчмаркі хлусяць, але ўсе працягваюць імі карыстацца — даследаванне
Чытайце таксама
Ці забярэ ШІ вашу працу? Ёсць адзін індыкатар, які знізіць трывогу
Ці забярэ ШІ вашу працу? Ёсць адзін індыкатар, які знізіць трывогу
Ці забярэ ШІ вашу працу? Ёсць адзін індыкатар, які знізіць трывогу
Інвестар, які прадказаў крах 2008 года: ШІ зніжае прыбытковасць бігтэхаў
Інвестар, які прадказаў крах 2008 года: ШІ зніжае прыбытковасць бігтэхаў
Інвестар, які прадказаў крах 2008 года: ШІ зніжае прыбытковасць бігтэхаў
У Нідэрландах анулявалі шлюб з-за ChatGPT
У Нідэрландах анулявалі шлюб з-за ChatGPT
У Нідэрландах анулявалі шлюб з-за ChatGPT
Цяпер Slack сам шукае файлы і рыхтуе сустрэчы — з ШІ ад Anthropic
Цяпер Slack сам шукае файлы і рыхтуе сустрэчы — з ШІ ад Anthropic
Цяпер Slack сам шукае файлы і рыхтуе сустрэчы — з ШІ ад Anthropic

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

0

Я просто прошу перепроверить прошлый ответ, обычно тоже срабатывает.

hottaby422
hottaby422 Консультант в Сам себе буратино
0

У меня периодически начинает до последнего держаться за изначальный ответ. И с большими выборками чисел иногда чудит. Не может уникальные значения нормально отобрать. И это характерно не для одной модели, а для нескольких

Пользователь отредактировал комментарий 14 января 2026, 17:07