Николай Чикишев world 9 июня 2026, 14:56

Как снизить риск ошибок ИИ-агентов? Учёные нашли решение

ИИ-агенты могут правильно понять задачу, но ошибиться уже на этапе выполнения. Исследователи Amazon Web Services предложили простой механизм, чтобы снизить вероятность ошибок.

1 комментарий

Как снизить риск ошибок ИИ-агентов? Учёные нашли решение

ИИ-агенты могут правильно понять задачу, но ошибиться уже на этапе выполнения. Исследователи Amazon Web Services предложили простой механизм, чтобы снизить вероятность ошибок.

Авторы нового исследования считают, что проблема часто связана не только с самой моделью, но и с программной обвязкой между моделью, инструментами и средой, где агент выполняет действия.

Директор AWS по прикладной науке в области агентного ИИ Ануп Деорас заявил, что без таких механизмов компании рискуют работать без понимания происходящего. «Без этого мы можем фактически действовать вслепую», — сказал он.

Исследователи называют ключевую проблему intent-execution gap — разрывом между намерением пользователя и фактическим выполнением задачи агентом. Проще говоря, пользователь просит агента сделать одно, модель формирует план, но на этапе выполнения через инструменты результат может отличаться от исходного замысла.

Такой сбой возникает в слое, который соединяет языковую модель с внешними инструментами: файловой системой, терминалом, редактором кода, API. Деорас сравнивает этот слой с операционной системой поверх модели. Именно он превращает рассуждения модели в конкретные действия.

Если этот слой разработан некорректно, агент может неправильно понять состояние системы, сделать ошибочное предположение и выполнить команду на его основе. Риск растет, когда агент долго рассуждает без проверки реальной среды: его внутренняя картина происходящего постепенно расходится с фактическим состоянием системы.

Одним из решений AWS называет sandbox — изолированную тестовую среду. В ней агент может проверять гипотезы, запускать команды, ошибаться и исправляться до того, как его действия затронут реальную рабочую среду.

«Если у вас нет sandbox, агент либо будет действовать слишком осторожно, либо будет совершать действия, которые в долгосрочной перспективе мы считаем очень рискованными», — сказал Деорас.

В исследовании также говорится о бенчмаксинге — искусственном улучшении результатов ИИ-агентов на бенчмарках за счет настроек инфраструктуры, а не реального качества модели. На результаты могут влиять таймауты, стабильность инфраструктуры инференса, скорость сети и другие параметры. По оценке AWS, такие факторы способны менять показатели на 5–10 процентных пунктов.

Только 26% компаний полностью контролируют расходы на ИИ

«Мы тратим слишком много»: компании учатся контролировать расходы на ИИ-токены

«Чат умер»: OpenAI готовит крупнейшее обновление ChatGPT перед IPO

1 комментарий

Текст: Николай Чикишев Источник: Fortune Теги: ии-агенты, искусственный интеллект, исследование

Нашли ошибку в тексте-выделите ее и нажмите Ctrl+Enter. Нашли ошибку в тексте-выделите ее и нажмите кнопку «Сообщить об ошибке»."

Сайт компании Вакансии

Размещение рекламы

Один ИИ-агент может парализовать работу всей компании. Как этого избежать

ИИ-агент удалил всю базу данных разработчика — и таких случаев всё больше

Почему корпоративные ИИ-агенты до сих пор часто ошибаются

Почему ИИ на работе так часто ошибается? Есть простое объяснение

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

M D

1

вайбкодеры изобрели стейджинг?

Одним из решений AWS называет sandbox — изолированную тестовую среду. В ней агент может проверять гипотезы, запускать команды, ошибаться и исправляться до того, как его действия затронут реальную рабочую среду.

Войдите, чтобы оставить комментарий