Што эфектыўней: адзін ШІ-агент альбо некалькі? Адказ не такі відавочны
Папулярны падыход з выкарыстаннем некалькіх ШІ-агентаў не заўжды эфектыўнейшы, чым праца адной мадэлі. Пры роўных вылічальных рэсурсах адзіночны агент часцей за ўсё паказвае такія ж або лепшыя вынікі.
Папулярны падыход з выкарыстаннем некалькіх ШІ-агентаў не заўжды эфектыўнейшы, чым праца адной мадэлі. Пры роўных вылічальных рэсурсах адзіночны агент часцей за ўсё паказвае такія ж або лепшыя вынікі.
Шматагентныя сістэмы — адзін з ключавых трэндаў у ШІ: некалькі мадэляў дзеляць задачу, абменьваюцца прамежкавымі вынікамі і правяраюць адна адну. Мяркуецца, што такі «калектыўны інтэлект» лепш спраўляецца са складанымі задачамі.
Аднак, як высветлілі навукоўцы Стэнфардскага ўніверсітэта, перавага такіх сістэм у многім тлумачыцца проста большым аб’ёмам вылічэнняў.
У межах эксперымента даследчыкі параўналі працу аднаго агента і некалькіх агентных камандаў на задачах са шматкрокавым разважаннем. Былі пратэставаныя мадэлі з трох сямействаў — Qwen3, DeepSeek і Gemini 2.5, а тэставанне праводзілася на бенчмарках FRAMES і MuSiQue, якія ўключаюць складаныя пытанні з некалькімі лагічнымі крокамі.
Вынік аказаўся адназначным: пры аднолькавым вылічальным бюджэце адзіночны агент амаль заўжды альбо пераўзыходзіў каманды, альбо паказваў супастаўляльныя вынікі, пры гэтым патрабуючы менш рэсурсаў.
Разраб прыдумаў спосаб знізіць выдаткі на токены ў разы
Адно з тлумачэнняў — страты інфармацыі пры перадачы дадзеных паміж агентамі. Кожны этап можа скажаць або спрашчаць прамежкавыя высновы. У адрозненне ад гэтага, адзіночная мадэль захоўвае бесперапынны працэс разважання.
Пры гэтым даследаванне выявіла і слабыя бакі такога падыходу. Адзіночныя мадэлі горш спраўляюцца з доўгім кантэкстам: па меры росту аб’ёму інфармацыі яны пачынаюць губляць важныя дэталі — эфект, вядомы як «размыванне кантэксту».
Менавіта ў такіх умовах шматагентныя сістэмы могуць быць эфектыўнейшымі. У эксперыментах са скажонымі дадзенымі каманды лепш фільтравалі інфармацыю і часцей знаходзілі правільныя рашэнні. Асабліва прыкметна гэта перавага праяўлялася пры выкарыстанні больш слабых мадэляў.
У цэлым аўтары адзначаюць, што ўніверсальнага рашэння няма: адзіночныя агенты эфектыўнейшыя пры абмежаваных рэсурсах і выразных задачах, тады як каманды ШІ могуць даваць перавагу ў складаных і «шумных» сцэнарыях. Даследаванне пры гэтым абмежавана тэкставымі задачамі і не ўлічвае працу з выявамі або вонкавымі інструментамі.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.