Support us

HeyGen перевела наши любимые мемы. Теперь на очереди дубляж?

Интернет захлестнула волна переозвученных мемов: Илон Маск заговорил на испанском, а Данила Багров — на английском. Сервис HeyGen предлагает перевод на другой язык с помощью нейросети. Инструмент объединил сразу же три технологии и так понравился пользователям, что возник вопрос: эпоха дубляжа закончилась?

Оставить комментарий
HeyGen перевела наши любимые мемы. Теперь на очереди дубляж?

Интернет захлестнула волна переозвученных мемов: Илон Маск заговорил на испанском, а Данила Багров — на английском. Сервис HeyGen предлагает перевод на другой язык с помощью нейросети. Инструмент объединил сразу же три технологии и так понравился пользователям, что возник вопрос: эпоха дубляжа закончилась?

Откуда взялся сервис?

HeyGen — это сервис виртуальных аватаров, которые озвучивают текст на разных языках. В соответствии с выбранным языком для персонажа генерируется мимика и движения губ. В видеоредакторе можно создать диалог между несколькими персонажами. На выбор предлагаются как мультяшные герои, так и реалистичные модели. На сайте компании указано, что HeyGen — калифорнийская фирма, зарегистрированная в Лос-Анджелесе. Его основали бывшие сотрудники Snapchat Джошуа Сюй и ByteDance Уэйн Лян.

В сентябре компания выпустила новую функцию перевода видео. Нейросеть распознает речь в ролике и переводит ее на другой язык. Функция использует одновременно три технологии: перевода, дипфейка и распознавания голоса. Голос обрабатывают и копируют с помощью нейросетей. Текст переводят и озвучивают на выбранном языке. Нейросеть изменяет рот человека так, чтобы текст на новом языке ложился на мимику.

У пользователя есть возможность создать один бесплатный ролик. В итоге он получает полный дубляж с переводом на другой язык, но сохранением оригинального голоса. Результат впечатлил пользователей своей правдоподобностью: новое видео повторяет голос и даже движения губ. Причем чем лучше было качество оригинального видео, тем лучше проходила генерация.

Как это работает?

HeyGen поддерживает перевод на английский, испанский, французский, хинди, итальянский, немецкий, польский и португальский. Однако у сервиса есть ограничения. Он поддерживает не все языки и обрабатывает только короткие видео с одним голосом. Хронометраж варьируется от нагрузки на сервис. Сначала была возможна загрузка двухминутных роликов, потом длительность ограничили одной минутой. 

Пользователи приспособились к ограничениям и быстро сообразили тестировать сервис на культовых мемах. Так появились переводы на разных языках мемов про кандибобер, немецкий /watch?v=B5JmfoZI2u0&ab_channel=Listok">вариант «Я вас уничтожу» от Маэстро, /watch?v=RCqs0YKxsj0&ab_channel=dashaloser">cabbage, but not red cabbage и /watch?v=SOW6zeThb-Q&ab_channel=dashaloser">монолог идущего к реке.

Разработчики сервиса опубликовали советы по генерации роликов. Они просят учитывать, чтобы в оригинальном видео либо не было лишнего шума или музыки на фоне, либо музыка не должна быть выраженной. В идеале должен говорить только один человек, если загрузить диалог, то нейросеть объединит голоса — и собеседники будут звучат «усредненным» голосом.

В кадре не должно быть портретов, бюстов — иначе чужие лица могут тоже заговорить. Говорящий должен смотреть прямо в камеру для лучшего анализа мимики. Руки, микрофоны и другие предметы не должны закрывать его лицо. Спикер должен говорить на одном языке, если в речи появляются иностранные слова, то генерация собьется.

Какие минусы у HeyGen?

Большие возможности сервиса вызвали дискуссию в профессиональной среде. Не приведет ли этот путь к созданию программы «идеального дубляжа»? Уже сейчас браузеры или Youtube добавляют функцию онлайн-перевода роликов и трансляций, используя возможности искусственного интеллекта. HeyGen позволяет создавать собственные переозвученные видео, в том числе, в перспективе, и фильмы.

Критики указывают, что ролики, созданные с помощью HeyGen, не лишены недостатков. В некоторых моментах выражения лиц стираются, выглядят нечеткими и искусственными. Но самое главное — это интонации. С точки зрения актерской техники, голоса звучат плоско, в них нет эмоциональности, за которую дубляж и ценится у зрителей.

По словам основателя студии дубляжа Dubbing Brothers Матье Тайеба, на пробах для одного персонажа прослушивают от шести до десяти актеров, чтобы точно перенести интонации и эмоции. В студии сомневаются, что искусственный интеллект достигнет такого же результата. «Он должен будет преуспеть в переносе музыкальности одного языка в другой», — замечает худрук студии Шарлотта Корреа.

Кроме того, в сгенерированных роликах очень бедный словарный запас: нейросеть буквально переводит текст, который предлагается в оригинальном видео. Тогда как во время дубляжа происходит адаптация реплик персонажей: переводчики находят правильные слова, чтобы выразить юмор или другие эмоции.

На адекватность перевода влияет и привычный темп речи, Эксперты заметили, что в роликах HeyGen англоязычные версии французских видео часто медленнее. В английской речи используется на 20-25% меньше слов, и французы говорят быстрее. И наоборот, когда англоязычное видео конвертируют на английский, то голос очень ускоряется.

Что будет с озвучкой?

Несмотря на минусы существующих сервисов, они быстро совершенствуются. Профессионалы предсказывают, что уже через несколько лет актеры озвучки начнут использовать эти инструменты. Компании могут оценить дешевизну нейросетей и обратиться к таким инструментам в ущерб качеству дубляжа.

За счет простоты технологии компания и стала популярной. Еще когда сервис был китайским стартапом Surreal, к нему обращались экспортеры для замены азиатских актеров в рекламных материалах западными моделями. Нанимать иностранных моделей для пересъемки было дорого, технология HeyGen экономила компаниям огромные суммы. Тогда услуга была непубличной и для коммерческого использования.

Уже сейчас функцию могут применять страны, у которых нет средств для качественного дубляжа, или блогеры для адаптации своего контента на иностранную аудиторию. Однако остаются те вопросы, о которых пока не задумываются пользователи сервиса: права на сгенерированный контент и вознаграждение артистов при использовании их голоса. Если вместо мемов начнут переводить фильмы, это неизбежно повлияет на всю индустрию.

Xbox в виде ведра и планы на The Elder Scrolls: что мы узнали из утечки Microsoft
Xbox в виде ведра и планы на The Elder Scrolls: что мы узнали из утечки Microsoft
По теме
Xbox в виде ведра и планы на The Elder Scrolls: что мы узнали из утечки Microsoft
В ЕС вступили в силу DSA и DMA. Как Европа закручивает гайки IT-гигантам и что это значит
В ЕС вступили в силу DSA и DMA. Как Европа закручивает гайки IT-гигантам и что это значит
По теме
В ЕС вступили в силу DSA и DMA. Как Европа закручивает гайки IT-гигантам и что это значит
ЕС против монополии соцсетей: что будет со свободой слова в интернете?
ЕС против монополии соцсетей: что будет со свободой слова в интернете?
По теме
ЕС против монополии соцсетей: что будет со свободой слова в интернете?
Читайте также
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Американец создал картину с помощью нейросети и победил в конкурсе для художников
Американец создал картину с помощью нейросети и победил в конкурсе для художников
Американец создал картину с помощью нейросети и победил в конкурсе для художников
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
3 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.