Sora — новый ИИ-генератор видео от OpenAI. Как им пользоваться

Компания запустила свою революционную генеративную модель Sora для создания видео по текстовым описаниям. Рассказываем, как ею пользоваться и насколько она продвинутая.

Оставить комментарий

OpenAI впервые представила Sora в феврале 2024 года, выпустив демонстрационные ролики и технический отчет модели. На тот момент доступ к Sora был ограничен небольшой группой художников, дизайнеров и кинематографистов для тестирования и сбора отзывов. По словам разработчиков, новая версия модели Sora Turbo значительно быстрее, чем ее предшественница. Сейчас модель доступна на сайте sora.com.

Возможности Sora

Sora может создавать различные видео: от 5 до 20 секунд в разных соотношениях сторон и разрешениях от 480p до 1080p. Также есть широкий, вертикальный и квадратный форматы. Пользователи могут генерировать контент с помощью текстовых запросов, а также использовать существующие видео для редактирования и создания нового контента с помощью инструмента Re-mix.

Интерфейс сервиса предлагает несколько инструментов: Storyboard позволяет пользователям создавать видео на основе последовательности подсказок, Blend объединяет два видео, сохраняя элементы обоих, а опции Loop и Re-cut дают возможность дополнительно настраивать и редактировать свои видео и сцены. Также в приложении есть ленты рекомендаций, которые показывают генеративные ролики других пользователей.

Как пользоваться

После регистрации пользователю открывается личный кабинет, в нижней части которого находится поле ввода и настройки генерации. Можно выбрать соотношение сторон (16:9, 1:1, 9:16), разрешение (480p, 720p, 1080p), продолжительность (от 5 до 20 секунд), количество генерируемых видео (до четырёх за один раз). Также можно выбрать шаблон стиля видео.

Sora Turbo  доступна в составе подписки ChatGPT Plus и Pro. Каждая генерация видео будет стоить пользователю определенное количество «кредитов». Видео в 480p стоит от 20 до 150 кредитов, ролик в 720p — от 30 до 540 кредитов. Видео в 1080p будет самым «дорогим»: от 100 до 2000 кредитов. OpenAI не пояснила, что именно влияет на количество потраченных кредитов.

  • Подписчики базового тарифного плана ChatGPT Plus ($20 в месяц) получат 1000 кредитов в месяц. Это позволит сгенерировать до 50 «приоритетных видео» (то есть видео, которые генерируются быстро) в формате 720p и длительностью 5 секунд.
  • Пользователи нового тарифа ChatGPT Pro за $200 в месяц получат 10 000 кредитов, которые смогут потратить на 500 приоритетных видео в формате 1080p и длительностью 20 секунд. Низкоприоритетные генерации можно создавать без ограничений. Также пользователи ChatGPT Pro могут выполнять до пяти генераций одновременно и скачивать ролики без водяных знаков.

Безопасность

Компания внедрила ряд мер безопасности и защитных механизмов. Разработчик предупредил, что в случае нарушений пользователю могут запретить пользоваться моделью или приостановить работу его аккаунта.

  • Пользователям запрещено генерировать видео с изображениями людей младше 18 лет, а также ролики, содержащие насилие, «откровенные темы» или нарушающие авторские права третьих лиц.
  • Sora не генерирует видео на основе изображений с известными людьми, узнаваемыми персонажами и логотипами.
  • Генеративные ролики будут иметь видимые водяные знаки и метаданные стандарта C2PA, указывающие на то, что они созданы с помощью ИИ.
  • Пользователям запрещено делиться сгенерированными видео, содержащими клипы или изображения реальных людей, в ленте домашней страницы Sora.

OpenAI ограничивает доступ к некоторым функциям модели, чтобы дать сообществу время адаптироваться и разработать нормы ответственного использования. Например, загрузка изображений людей пока ограничена лишь избранными тестировщиками. OpenAI пояснила, что не стала позволять загружать фото и видео реальных людей, так как опасается злоупотреблений.

Отзывы

Блогер Маркус Браунли, известный как MKBHD, работал с предварительной версией Sora и заявил, что модель работает не идеально. В целом Sora имеет те же недостатки, что и другие генераторы видео: в роликах часто объекты непостоянны. Например, они могут перемещаться нелогично, исчезать и появляться в других местах без видимой причины.

Еще одна проблема — это конечности персонажей, модель может недосчитаться пальцев или перепутать ноги при передаче ходьбы. Браунли считает, что модель может быть полезна для создания заставок, анимаций, стоп-кадров и других вспомогательных изображений, однако он не стал бы ее рекомендовать для создания реалистичных роликов.

OpenAI подчеркивает, что выпущенная модель — это «ранняя версия» Sora, которая неизбежно будет ошибаться.  «Она не идеальна, но уже на том этапе, когда мы думаем, что она будет действительно полезна для дополнения человеческого творчества», — заявил руководитель исследования Sora Уилл Пиблз.

Релиз Sora произошел после того, как группа тестировщиков слила доступ к видеогенератору в знак протеста против того, что они назвали двуличием и «стихийной отмывкой» со стороны OpenAI. Активисты утверждают, что компания оказывала давление на ранних тестировщиков Sora, включая членов красной команды и творческих партнеров, чтобы те создавали позитивный нарратив вокруг Sora, и не стала справедливо вознаграждать их за работу.

Доступность

Компания заявила, что модель доступна в США и многих других странах (полный список можно посмотреть здесь). При этом сейчас Sora недоступна в Великобритании, Швейцарии и странах ЕС. Это может быть связано с юридическими проблемами из-за действия недавно принятого Закона о цифровых услугах (DSA). Генеральный директор OpenAI Сэм Альтман отметил, что запуск в «большинстве стран Европы» может «занять некоторое время».

По состоянию на 10 декабря при попытке зарегистрироваться сайт Sora уведомляет, что команда OpenAI временно ограничила регистрацию новых пользователей. Вероятно, это связано с наплывом желающих попробовать модель. Даже если у пользователя нет подписки, он все равно сможет просматривать ленту видеороликов, созданных другими пользователями с помощью Sora.

Какой поиск лучше: генеративный или традиционный?
По теме
Какой поиск лучше: генеративный или традиционный?
Они обогащали себя и Кремль: раскрыта масштабная российская криптосеть по отмыванию денег
По теме
Они обогащали себя и Кремль: раскрыта масштабная российская криптосеть по отмыванию денег
Маск против Альтмана: почему сооснователь воюет с OpenAI?
По теме
Маск против Альтмана: почему сооснователь воюет с OpenAI?

Читать на dev.by