Google запустила автономный ИИ для роботов: складывает одежду и завязывает шнурки
Лаборатория DeepMind анонсировала новую версию своей модели искусственного интеллекта Gemini Robotics, способную работать полностью автономно — без подключения к интернету и облачной инфраструктуре.
Модель, построенная по архитектуре VLA (vision-language-action), размещается непосредственно на роботах и выполняет задачи в реальном времени. Эта особенность делает ее особенно полезной в условиях нестабильной связи или повышенных требований к безопасности данных.
Новая модель уже обучена на роботе ALOHA, разработанном Google, и адаптирована для других платформ, включая гуманоидного робота Apollo от компании Apptronik и двухрукого манипулятора Franka FR3. Она способна осваивать новые задачи всего после 50–100 демонстраций — достаточно показать, как выполнять нужное действие, чтобы ИИ научился воспроизводить его самостоятельно.
Вместе с моделью Google впервые выпускает программный набор разработчика (SDK), который позволит тестировщикам оценивать работу модели и дообучать ее под конкретные нужды. Это открывает возможности для применения Gemini Robotics On-Device в самых разных сценариях — от складской логистики до медицинской робототехники.
По словам руководителя отдела робототехники Google DeepMind Каролины Парады, новая модель хотя и менее мощная, чем флагманская гибридная версия Gemini Robotics, демонстрирует удивительную эффективность. «Мы были приятно удивлены тем, насколько сильной оказалась эта автономная версия», — заявила она в интервью The Verge.
Разработчики отмечают, что автономная модель может успешно справляться с действиями, требующими точной моторики: завязывать шнурки или складывать одежду. Однако для более сложных многоэтапных задач, таких как приготовление еды, может потребоваться подключение к более мощной облачной версии модели.
Пока новая модель доступна лишь ограниченному кругу участников программы доверенного тестирования, однако в будущем компания рассчитывает на более широкое внедрение. По словам Каролины Парады, это только начало, и в ближайшее время пользователи увидят модели, построенные на более совершенной версии Gemini 2.5.
Читать на dev.by