Гэты просты спосаб дапамагае павысіць дакладнасць ШІ да 76%
Даследчыкі Google прапанавалі просты спосаб павысіць дакладнасць адказаў вялікіх моўных мадэляў. Новая тэхніка дазваляе павялічыць дакладнасць ШІ да 76% на задачах, якія не патрабуюць складаных разважанняў, і працуе практычна без стратаў па хуткасці.
Даследчыкі Google прапанавалі просты спосаб павысіць дакладнасць адказаў вялікіх моўных мадэляў. Новая тэхніка дазваляе павялічыць дакладнасць ШІ да 76% на задачах, якія не патрабуюць складаных разважанняў, і працуе практычна без стратаў па хуткасці.
Метад выглядае вельмі проста: запыт карыстальніка літаральна капіюецца і ўстаўляецца два разы запар. Тым не менш тэсты паказалі, што паўтор запыту стабільна паляпшае вынікі ў вядучых мадэляў, уключаючы Gemini, GPT-4o, Claude і DeepSeek.
Аўтары працы тлумачаць эфект архітэктурнымі абмежаваннямі ШІ-сістэм. Большасць моўных мадэляў апрацоўваюць тэкст строга злева направа і не «бачаць» будучыя токены. З-за гэтага фармулёўка і парадак інфармацыі ў запыце моцна ўплываюць на канчатковы адказ. Калі запыт паўтараецца, мадэль, апрацоўваючы другую копію, ужо мае ў «памяці» ўсю першую, што дазваляе ёй больш дакладна інтэрпрэтаваць дэталі і ліквідаваць неадназначнасці.
У ходзе эксперыментаў каманда пратэставала сем папулярных бенчмаркаў і сем мадэляў: ад кампактных версій да флагманскіх. У 47 з 70 параўнанняў паўтор запыту аказаўся лепшым за стандартны падыход і ні ў адным выпадку не даў горшы вынік. Асабліва прыкметны эфект назіраўся ў задачах на дакладнае выманне інфармацыі. У адным з тэстаў дакладнасць мадэлі Gemini 2.0 Flash Lite вырасла з 21% да 97% пасля простага падваення ўваходнага запыту.
Абмежаванне ў метаду таксама ёсць. Ён практычна не дае выйгрышу там, дзе мадэлі просяць «разважаць крок за крокам». На думку даследчыкаў, у такіх сцэнарах самі мадэлі ўжо фактычна паўтараюць умовы задачы ў працэсе разважанняў, таму дадатковы паўтор ва ўваходных даных становіцца залішнім.
Аўтары лічаць, што тэхніка асабліва карысная для прыкладных задач: класіфікацыі, пошуку фактаў, вымання даных і кароткіх адказаў. Для бізнесу гэта можа азначаць магчымасць атрымліваць больш якасныя вынікі ад хуткіх і танных мадэляў без пераходу на больш дарагія рашэнні.
У меня периодически начинает до последнего держаться за изначальный ответ. И с большими выборками чисел иногда чудит. Не может уникальные значения нормально отобрать. И это характерно не для одной модели, а для нескольких
Пользователь отредактировал комментарий 14 января 2026, 17:07
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
Я просто прошу перепроверить прошлый ответ, обычно тоже срабатывает.
У меня периодически начинает до последнего держаться за изначальный ответ. И с большими выборками чисел иногда чудит. Не может уникальные значения нормально отобрать. И это характерно не для одной модели, а для нескольких
Пользователь отредактировал комментарий 14 января 2026, 17:07