🚀 Идем на ежегодный Cloud Security TechSpot в Варшаве
Support us

Новая модель Google создаёт подобие 3D-игр по текстовому запросу

ИИ-подразделение Google DeepMind представило 2 поколение модели Genie. Новинка генерирует интерактивные видео по одному исходному изображению и текстовому описанию пользователя, пишет TechCrunch.

1 комментарий

ИИ-подразделение Google DeepMind представило 2 поколение модели Genie. Новинка генерирует интерактивные видео по одному исходному изображению и текстовому описанию пользователя, пишет TechCrunch.

По словам разработчиков, Genie 2 способна создавать бесконечное множество насыщенных 3D-миров, в том числе такие, в которых пользователь может выполнять различные действия, например плавать и прыгать, управляя ими при помощи мыши или клавиатуры. Модель умеет имитировать взаимодействие между предметами, движение, освещение, физику, отражения и поведение виртуальных персонажей.

TechCrunch отмечает, что многие работы Genie 2 напоминают сцены из ААА-игр — вполне возможно, потому, что среди обучающих видеороликов были эпизоды из популярных видеоигр. Однако подробности о своих источниках данных и методах их сбора компания по причинам конкуренции и иным не раскрывает. DeepMind имеет беспрепятственный доступ к видеороликам на YouTube, но Genie 2 по сути создаёт несанкционированные копии видеоигр, которые «смотрела», из-за чего к ней могут возникнуть претензии по поводу интеллектуальной собственности.

Genie 2 создаёт целостные виртуальные миры с видом с разных ракурсов, например от первого и третьего лица, с изометрической проекцией и так далее. Ролики длятся до одной минуты, в основном — 10-20 секунд.

Также Genie 2 умеет запоминать части смоделированной сцены, которые выходят из поля зрения в процессе взаимодействия с героем, и качественно воссоздаёт их, когда они снова в кадре. DeepMind позиционирует новинку, скорее, как инструмент для творчества и исследований — например, для создания прототипов интерактивных сцен и тестирования ИИ-агентов.

Сотрудники Google получили Нобелевскую премию по химии
Сотрудники Google получили Нобелевскую премию по химии
По теме
Сотрудники Google получили Нобелевскую премию по химии
Google представила ИИ для озвучивания видео
Google представила ИИ для озвучивания видео
По теме
Google представила ИИ для озвучивания видео
Разработчики чат-ботов пытаются научить их шутить, но пока безуспешно
Разработчики чат-ботов пытаются научить их шутить, но пока безуспешно
По теме
Разработчики чат-ботов пытаются научить их шутить, но пока безуспешно
Читайте также
ByteDance представила ИИ, который превращает любое фото в 3D
ByteDance представила ИИ, который превращает любое фото в 3D
ByteDance представила ИИ, который превращает любое фото в 3D
Теперь Gemini делает презентации сама — по тексту или загруженному файлу
Теперь Gemini делает презентации сама — по тексту или загруженному файлу
Теперь Gemini делает презентации сама — по тексту или загруженному файлу
ИИ помогает работникам подделывать чеки, которые невозможно отличить от настоящих
ИИ помогает работникам подделывать чеки, которые невозможно отличить от настоящих
ИИ помогает работникам подделывать чеки, которые невозможно отличить от настоящих
Более 1 млн пользователей обсуждают c ChatGPT суицид — в неделю
Более 1 млн пользователей обсуждают c ChatGPT суицид — в неделю
Более 1 млн пользователей обсуждают c ChatGPT суицид — в неделю

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

povelitel-krasnogo-drakona
povelitel-krasnogo-drakona Проектный мессенджер в 我想排便
1

Новая модель Google создаёт подобие 3D-игр по текстовому запросу

О. Хаксли, "Дивное новое подобие", антиутопия с элементами броманса.