17% скидка на размещение рекламы на площадках devby — до 20 ноября. Клац!
Support us

Google представила генератор видео по текстовому описанию Lumiere

Компания представила ИИ-генератор видео Lumiere, создающий динамические изображения по текстовому описанию. Разработчики называют инструмент самым мощным среди известных аналогов.

2 комментария
Google представила генератор видео по текстовому описанию Lumiere

Компания представила ИИ-генератор видео Lumiere, создающий динамические изображения по текстовому описанию. Разработчики называют инструмент самым мощным среди известных аналогов.

Создатели называют сервис «моделью пространственно-временной диффузии для реалистичной генерации видео», основанной на искусственном интеллекте. Отличием Lumiere от аналогов стала уникальная архитектура модели: видео по всей его продолжительности генерируется за один проход. Другие модели генерируют несколько ключевых кадров, а затем производят интерполяцию по времени.

Генератор Google работает в нескольких режимах. Сервис может производить преобразование текста в видео, конвертировать статические изображения в динамические, создавать ролики в заданном стиле на основе образца, редактировать существующее видео по письменным подсказкам, анимировать определенные области статического изображения или редактировать видео фрагментарно.

В компании пояснили, что модель обучали на наборе данных, который включает 30 миллионов роликов с текстовыми описаниями. Видео имеют длину 80 кадров с частотой 16 кадров в секунду. Базовая модель обучена на разрешении 128×128 пикселей. Lumiere генерирует пятисекундные ролики с разрешением 1024×1024 пикселей.

Ранее Google представила модель Imagen Video, которая генерирует ролики разрешением 1280×768 пикселей с частотой кадра 24 кадра в секунду. Однако минусом была меньшая реалистичность, что наблюдается и в аналогичных генераторах, таких как Make-A-Video от Meta, Runway Gen2 и Stable Video Diffusion.

Google отметила, что понимает угрозу, которую могут представлять подобные проекты. «Основная наша цель в этой работе — дать начинающим пользователям возможность генерировать визуальный контент гибко и творчески. Однако существует риск неправомерного [создания] подделок или вредоносного контента при помощи нашей технологии, и мы считаем, что крайне важно разрабатывать и применять инструменты выявления случаев предвзятости и злонамеренного использования, чтобы обеспечить безопасную и добросовестную работу [модели]», — заявили в компании.

Google обвинил российские спецслужбы в организации кибератак
Google обвинил российские спецслужбы в организации кибератак
По теме
Google обвинил российские спецслужбы в организации кибератак
Ученые выяснили почему качество поиска Google сильно ухудшилось
Ученые выяснили, почему качество поиска Google сильно ухудшилось
По теме
Ученые выяснили, почему качество поиска Google сильно ухудшилось
Google представила функцию поиска всего что есть на экране смартфона
Google представила функцию поиска всего, что есть на экране смартфона
По теме
Google представила функцию поиска всего, что есть на экране смартфона
Читайте также
Google внедряет агентный шопинг: ИИ сам ищет, сравнивает и покупает товары
Google внедряет агентный шопинг: ИИ сам ищет, сравнивает и покупает товары
Google внедряет агентный шопинг: ИИ сам ищет, сравнивает и покупает товары
«Не гонитесь за Google и Microsoft»: главный учёный IBM советует джунам смотреть шире на наём
«Не гонитесь за Google и Microsoft»: главный учёный IBM советует джунам смотреть шире на наём
«Не гонитесь за Google и Microsoft»: главный учёный IBM советует джунам смотреть шире на наём
Google будет наказывать Android-приложения, «съедающие» заряд батареи
Google будет наказывать Android-приложения, «съедающие» заряд батареи
Google будет наказывать Android-приложения, «съедающие» заряд батареи
Google придумала, как решить одну из главных проблем ИИ
Google придумала, как решить одну из главных проблем ИИ
Google придумала, как решить одну из главных проблем ИИ

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Zhan Chubukou
Zhan Chubukou Шчолкаю зубамі в ЗАО "Прыдацелі і атшчыпенцы"
0

Ух ты! С учетом наличия собственного здоровенного облака научились делать много картинок на основе stable diffusion? Ну да, это прорыв в стиле Пакистана. Нет мозгов, зато железа много - давай запустим генерацию картинок быстрее, а потом сложим так, чтобы видосик получался ) И где-то на том конце друг Сарвар хлопает в ладошки - отличный план!

Пользователь отредактировал комментарий 29 января 2024, 02:44

Комментарий скрыт за нарушение правил комментирования.

Правила тут, их всего 5