Гонка за создание видео с помощью ИИ

С широким выпуском Sora, видеоинструмента OpenAI, большинство крупных технологических гигантов — и некоторые стартапы — теперь стремятся создать модели, способные генерировать реалистичные высококачественные видеоролики из текстовых подсказок. (Axios)

Почему это важно: Видеоинструменты GenAI могут сэкономить время и деньги кинематографистов, но они также могут привести к новым проблемам с авторскими правами и потоку дипфейков.

Чем жестче конкуренция в сфере ИИ, тем больше вероятность того, что технологические компании будут отдавать приоритет датам выпуска, а не безопасности.

Генерация видео с помощью ИИ требует гораздо больше энергии, чем генерация текста, что уже создает нагрузку на электросеть.

Общая картина: Google, OpenAI и стартап в сфере искусственного интеллекта Runway предлагают продукты, которые позволяют создателям создавать короткие видеоролики с минимальными усилиями.

Veo 2 от Google

Google анонсировала Veo 2, последнюю версию своего видеоинструмента genAI, через неделю после более широкого выпуска Sora в декабре. Компания сообщает, что Veo 2 теперь доступен для пользователей раннего доступа в США, которым исполнилось 18 лет.

«Кажется, никто не имеет ни малейшего представления, как на самом деле это опробовать», — написал в своем блоге технический писатель и инвестор MG Siegler. «Я проработал [в Google] более десяти лет, и я не могу вам объяснить, как к этому получить доступ».

Google утверждает, что Veo позволяет создавать клипы длительностью до двух минут, а это значит, что с его помощью можно создавать очень короткие фильмы.

Целый раздел страницы продукта Veo 2 посвящен ограничениям инструмента и объясняется, что ему трудно воспроизводить последовательность и сложные движения.

Бывший сотрудник Google Билавал Сидху получил ранний доступ и опубликовал видео собаки в солнцезащитных очках и наушниках, пьющей коктейль. На разных снимках менялся только цвет зонтика в коктейльном бокале.

Хотя общепринятой системы оценки производительности видеогенераторов на базе ИИ не существует, Veo 2 от Google на данный момент считается наиболее перспективным.

Создатель видеоролика GenAI Блейн Браун похвалил Veo, показав видео, как различные инструменты справляются с задачей «пара рук, умело нарезающих идеально приготовленный стейк на деревянной разделочной доске. От него поднимается слабый пар».

Тест, как написал Браун в Х, бросает вызов моделям ИИ с помощью физики и движения, интерпретации того, что значит идеально прожаренный стейк, и изображения рук — печально известная проблема для ИИ.

Да, но: на Veo 2 есть лист ожидания, в то время как другие модели доступны прямо сейчас.

Сора из OpenAI

В феврале 2024 года OpenAI выпустила бета-версию Sora для избранной группы тестировщиков, а в декабре выпустила продукт для всех подписчиков ChatGPT Plus и Pro.

OpenAI ограничивает подписчиков Plus стоимостью 20 долларов в месяц 50 видеороликами с разрешением 480p или меньшим количеством видеороликов с разрешением 720p в месяц.

Подписчикам Pro за 200 долларов в месяц обещают «в 10 раз больше использования, более высокое разрешение и большую продолжительность».

Sora поставляется в комплекте с ChatGPT Plus и Pro, поэтому подписка стоимостью 20 или 200 долларов включает все возможности ChatGPT Plus и Pro по созданию текста, кодирования и изображений.

Sora, ориентированный на пользователей, желающих создавать 20-секундные видеоролики, идеально подходит для социальных сетей и маркетинга.

Создать видео с помощью Sora так же просто, как ввести описание в поле подсказки и дождаться его генерации.

Видеоролики впечатляют, но в них часто не хватает элементарной физики .

Альфа-версия Gen-3 от Runway

Последняя модель ИИ-стартапа Runway — Gen-3 Alpha — доступна на всех платных тарифных планах с сентября.

Как сообщает Axios, инструменты Runway сыграли решающую роль в создании удостоенного премии «Оскар» фильма «Всё и всюду одновременно».

Стоимость подписки составляет от 144 до 1500 долларов в год в зависимости от того, сколько секунд видео вы хотите создать.

Runway был первым, кто выпустил свой инструмент в 2023 году, но это не всегда означает успех. Вспомните Betamax, Netscape, MySpace.

Более длительное существование Runway дало ему больше времени для работы с создателями контента с целью предотвращения нарушения авторских прав.

В декабре 2023 года компания заключила соглашение с Getty Images, чтобы предложить более «коммерчески безопасную» версию своего инструмента, а в сентябре 2024 года заключила партнерское соглашение с Lionsgate Studios для обучения модели искусственного интеллекта Runway на основе каталога фильмов Lionsgate.

В прошлом месяце Runway запустила сеть талантов для независимых создателей искусственного интеллекта, чтобы они могли продемонстрировать свои работы студиям и производственным компаниям.

В гонке по-прежнему никто не победит, включая американских гигантов, таких как Adobe и Meta, китайские технологические компании, такие как Tencent (Hunyuan Video) и Kuaishou (Kling AI), а также ряд других разрозненных стартапов.

Меган Морроне

(в пересказе)

Мнение авторов может не совпадать с мнением редакции

Некоммерческое сообщество журналистов Non profit