Исследователи OpenAI представили систему, которая способна не только держать и вращать различные предметы, подобно человеку, но и автономно обучаться этим действиям, пишет TechCrunch.
Многие роботы отлично владеют хватательными движениями и различными действиями, и могут быть намного эффективнее человека на производстве. Но для каждого отдельного случая применения для них приходится писать отдельную программу. Роботы не умеют, как человек, автоматически адаптироваться к параметрам разных предметов, чтобы совершить с ними те или иные манипуляции. А чтобы научить их необходимой ловкости, нужно ввести в систему миллионы примеров того, как с этими предметами будет обращаться человек.
Разработчики OpenAI решили полностью отказаться от вводных данных о действиях человека. Они использовали виртуальный симулятор, в котором система под названием Dactyl самостоятельно раз за разом пыталась научиться двигать пальцами, чтобы объект поворачивался по заданной схеме. Система получала только смоделированные данные о том, как расположены её пальцы, и изображения кубика в её руке с трёх различных точек. Но в виртуальном пространстве, в отличие от реального, компьютер может обработать тысячи способов воздействия на предметы за несколько секунд, проанализировать результаты и использовать их в следующей попытке.
Помимо габаритов и вариантов расположения предметов, система учитывала ряд изменяющихся параметров — например, силу давления на кончиках пальцев, цвет предмета и освещение в комнате. Благодаря этому она не ограничена в наборе предметов, с которыми может взаимодействовать, и окружающей обстановкой. Для исследования разработчики использовали 6 144 CPU и 8 GPU. Это позволяло за 50 часов собрать информацию, на сбор которой ушло бы около ста лет. Когда систему запустили в лаборатории, её движения очень точно имитировали человеческие: например, Dactyl двумя пальцами удерживала кубик в руке, а с помощью остальных переворачивала его в нужном направлении.
Система научилась не только естественно двигать пальцами, причём абсолютно самостоятельно — выполнять различные действия она сможет с предметами любой формы. Эта универсальность очень важна для роботов, взаимодействующих с окружающим миром, так как невозможно вручную запрограммировать все действия, которые можно совершать с каждым предметом или в каждой ситуации на практике.
Исследователи опубликовали работу и некоторые из инструментов, которые они использовали для создания и тестирования Dactyl.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.