ИИ научили самостоятельно переписывать свои правила работы, буст производительности — до 60%
Китайские исследователи из Шанхайской лаборатории искусственного интеллекта представили фреймворк Self-Harness. Эта технология позволяет ИИ-агентам самостоятельно анализировать собственные ошибки и переписывать правила своего системного окружения (harness), что увеличивает их эффективность в работе на 33-60%, пишет VentureBeat.
Китайские исследователи из Шанхайской лаборатории искусственного интеллекта представили фреймворк Self-Harness. Эта технология позволяет ИИ-агентам самостоятельно анализировать собственные ошибки и переписывать правила своего системного окружения (harness), что увеличивает их эффективность в работе на 33-60%, пишет VentureBeat.
Если раньше разработчики настраивали поведение ИИ вручную методом тыка, опираясь на интуицию, то новая система заменяет догадки инженеров на математически точный анализ: нейросеть сама тестирует свои действия, находит системные сбои и внедряет точечные исправления. Например, модель Qwen отучили от бесконечных повторов одной и той же команды при ошибке, а модель MiniMax научили вовремя останавливаться и менять подход, если задача зацикливается.
Главный плюс Self-Harness для бизнеса — возможность создавать автономных цифровых сотрудников, которые сами подстраиваются под изменения. Если компания обновит внутреннюю документацию, обычный ИИ-агент сломается из-за неверного контекста, тогда как самообучающаяся система проанализирует лог сбоя, точечно обновит свои алгоритмы и продолжит работу без привлечения программистов.
Обратной стороной технологии стали скрытые расходы на вычислительные мощности. Из-за того, что ИИ вынужден постоянно генерировать варианты улучшений и проводить параллельные тесты, расходы на токены и нагрузка на ИТ-инфраструктуру резко возрастают. Кроме того, фреймворк требует строгих и однозначных критериев оценки, поэтому сейчас его можно безопасно внедрять только в программировании, автоматизации рабочих процессов и девопсе. В сферах вроде медицины или юриспруденции, где ошибка критична, а оценка субъективна, автоматизацию правил применять нельзя.
По мнению авторов исследования, появление таких систем изменит саму суть ИТ-профессий. Инженерам больше не придётся вручную дописывать инструкции к промптам или копаться в коде мелких функций. Роль человека сместится на более высокий уровень абстракции — разработчики превратятся из настройщиков нейросетей в архитекторов сложных систем обратной связи, которые контролируют общую эволюцию ИИ.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.