Google запустила автономный ИИ для роботов: складывает одежду и завязывает шнурки

Лаборатория DeepMind анонсировала новую версию своей модели искусственного интеллекта Gemini Robotics, способную работать полностью автономно — без подключения к интернету и облачной инфраструктуре.

Оставить комментарий

Модель, построенная по архитектуре VLA (vision-language-action), размещается непосредственно на роботах и выполняет задачи в реальном времени. Эта особенность делает ее особенно полезной в условиях нестабильной связи или повышенных требований к безопасности данных.

Новая модель уже обучена на роботе ALOHA, разработанном Google, и адаптирована для других платформ, включая гуманоидного робота Apollo от компании Apptronik и двухрукого манипулятора Franka FR3. Она способна осваивать новые задачи всего после 50–100 демонстраций — достаточно показать, как выполнять нужное действие, чтобы ИИ научился воспроизводить его самостоятельно.

Вместе с моделью Google впервые выпускает программный набор разработчика (SDK), который позволит тестировщикам оценивать работу модели и дообучать ее под конкретные нужды. Это открывает возможности для применения Gemini Robotics On-Device в самых разных сценариях — от складской логистики до медицинской робототехники.

По словам руководителя отдела робототехники Google DeepMind Каролины Парады, новая модель хотя и менее мощная, чем флагманская гибридная версия Gemini Robotics, демонстрирует удивительную эффективность. «Мы были приятно удивлены тем, насколько сильной оказалась эта автономная версия», — заявила она в интервью The Verge.

Разработчики отмечают, что автономная модель может успешно справляться с действиями, требующими точной моторики: завязывать шнурки или складывать одежду. Однако для более сложных многоэтапных задач, таких как приготовление еды, может потребоваться подключение к более мощной облачной версии модели.

Пока новая модель доступна лишь ограниченному кругу участников программы доверенного тестирования, однако в будущем компания рассчитывает на более широкое внедрение. По словам Каролины Парады, это только начало, и в ближайшее время пользователи увидят модели, построенные на более совершенной версии Gemini 2.5.

Boston Dynamics показала, как робот Atlas видит мир вокруг
По теме
Boston Dynamics показала, как робот Atlas видит мир вокруг
Люди теряют смысл при работе с роботами. Помочь могут эмпатичные «коботы»
По теме
Люди теряют смысл при работе с роботами. Помочь могут эмпатичные «коботы»
Amazon хочет заменить сотрудников роботами, но боится об этом говорить
По теме
Amazon хочет заменить сотрудников роботами, но боится об этом говорить

Читать на dev.by