🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

Что эффективнее: один ИИ-агент или несколько? Ответ не так очевиден

Популярный подход с использованием нескольких ИИ-агентов не всегда эффективнее, чем работа одной модели. При равных вычислительных ресурсах одиночный агент чаще всего показывает такие же или лучшие результаты.

Оставить комментарий
Что эффективнее: один ИИ-агент или несколько? Ответ не так очевиден

Популярный подход с использованием нескольких ИИ-агентов не всегда эффективнее, чем работа одной модели. При равных вычислительных ресурсах одиночный агент чаще всего показывает такие же или лучшие результаты.

Многоагентные системы — один из ключевых трендов в ИИ: несколько моделей делят задачу, обмениваются промежуточными результатами и проверяют друг друга. Предполагается, что такой «коллективный интеллект» лучше справляется со сложными задачами.

Однако, как выяснили ученые Стэнфордского университета, преимущество таких систем во многом объясняется просто большим объемом вычислений.

В рамках эксперимента исследователи сравнили работу одного агента и нескольких агентных команд на задачах с многошаговым рассуждением. Были протестированы модели из трех семейств — Qwen3, DeepSeek и Gemini 2.5, а тестирование проводилось на бенчмарках FRAMES и MuSiQue, включающих сложные вопросы с несколькими логическими шагами.

Результат оказался однозначным: при одинаковом вычислительном бюджете одиночный агент почти всегда либо превосходил команды, либо показывал сопоставимые результаты, при этом требуя меньше ресурсов.

Разраб придумал способ снизить расходы на токены в разы
Разраб придумал способ снизить расходы на токены в разы
По теме
Разраб придумал способ снизить расходы на токены в разы

Одно из объяснений — потери информации при передаче данных между агентами. Каждый этап может искажать или упрощать промежуточные выводы. В отличие от этого, одиночная модель сохраняет непрерывный процесс рассуждения.

При этом исследование выявило и слабые стороны такого подхода. Одиночные модели хуже справляются с длинным контекстом: по мере роста объема информации они начинают терять важные детали — эффект, известный как «размывание контекста».

Именно в таких условиях многоагентные системы могут быть эффективнее. В экспериментах с искаженными данными команды лучше фильтровали информацию и чаще находили правильные решения. Особенно заметно это преимущество проявлялось при использовании более слабых моделей.

В целом авторы отмечают, что универсального решения нет: одиночные агенты эффективнее при ограниченных ресурсах и четких задачах, тогда как команды ИИ могут давать преимущество в сложных и «шумных» сценариях. Исследование при этом ограничено текстовыми задачами и не учитывает работу с изображениями или внешними инструментами.

Anthropic представила сервис для запуска ИИ-агентов обещает ускорение в 10 раз
Anthropic представила сервис для запуска ИИ-агентов, обещает ускорение в 10 раз
По теме
Anthropic представила сервис для запуска ИИ-агентов, обещает ускорение в 10 раз
В сети завирусился «кнут для ИИ» который заставляет агентов ускоряться
В сети завирусился «кнут для ИИ», который заставляет агентов ускоряться
По теме
В сети завирусился «кнут для ИИ», который заставляет агентов ускоряться
Anthropic закрыла Claude для OpenClaw — доступ для агентов стал платным
Anthropic закрыла Claude для OpenClaw — доступ для агентов стал платным
По теме
Anthropic закрыла Claude для OpenClaw — доступ для агентов стал платным
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Больше ИИ-агентов не всегда значит лучше — исследование
Больше ИИ-агентов не всегда значит лучше — исследование
Больше ИИ-агентов не всегда значит лучше — исследование
Anthropic: индустрия ошиблась с ИИ-агентами — прорыв даст другой подход
Anthropic: индустрия ошиблась с ИИ-агентами — прорыв даст другой подход
Anthropic: индустрия ошиблась с ИИ-агентами — прорыв даст другой подход
3 комментария
В Perplexity появился режим, где модели проверяют друг друга
В Perplexity появился режим, где модели проверяют друг друга
В Perplexity появился режим, где модели проверяют друг друга
«Мозг плавится»: если использовать слишком много ИИ-инструментов сразу, продуктивность падает
«Мозг плавится»: если использовать слишком много ИИ-инструментов сразу, продуктивность падает
«Мозг плавится»: если использовать слишком много ИИ-инструментов сразу, продуктивность падает

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.