ИИ тренирует робопса намного быстрее и эффективнее, чем человек
Ученые Пенсильванского университета разработали систему, предназначенную для обучения роботов с использованием искусственного интеллекта.
Ученые Пенсильванского университета разработали систему, предназначенную для обучения роботов с использованием искусственного интеллекта.
Система DrEureka (Domain Randomization Eureka) взаимодействовала с роботом Unitree Go1. Это четвероногая машина с открытым исходным кодом. Обучение робота проходило в симулированной среде, для этого применялась рандомизация основных переменных: это показатели трения, массы, смещения центра тяжести и другие параметры.
ИИ на основе нескольких пользовательских запросов генерировал код, который описывал систему вознаграждений и штрафов для обучения робота в виртуальной среде. Затем ИИ анализировал каждую симуляцию, насколько хорошо виртуальный робот справился с задачей и как результат можно улучшить.
Авторы заметили, что для корректного написания кода ИИ необходимо вводить дополнительные инструкции по безопасности. В противном случае нейросеть начинает жульничать при моделировании, стремясь к максимальной производительности. В реальном мире это могло бы привести к перегреву двигателей и повреждению робота.
В результате эксперимента DrEureka справилась с задачей обучения робота лучше, чем человек. Система показала рост скорости движения робота на 34% и увеличение расстояния, преодолеваемого по пересеченной местности, на 20%. Ученые считают, что разница заключается в подходах к обучению: человек разбивает его на несколько этапов и находит решение по каждому, тогда как нейросеть обучает всему сразу.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.