На Google I/O 2026 компания представила Gemini Omni — новую мультимодальную модель ИИ, ориентированную на генерацию и монтаж видео. (Moneycontrol)
Компания заявила, что модель сочетает возможности Gemini с инструментами создания контента на базе искусственного интеллекта, позволяя пользователям генерировать видео с использованием текста, изображений, аудио и существующих видеоклипов.
Google объявила, что первая модель семейства Omni, под названием Gemini Omni Flash, выйдет на рынок через приложение Gemini, Google Flow, YouTube Shorts и YouTube Create.
Что такое Gemini Omni
По данным Google, Gemini Omni разработан для создания «всего из любого входа», начиная с генерации видео. Пользователи могут предоставлять различные виды ввода, включая изображения, аудио, текстовые подсказки и референсные видео для создания клипов, сгенерированных ИИ.
Компания заявила, что Gemini Omni также поддерживает разговорное редактирование. Это позволяет пользователям продолжать дорабатывать видео с помощью подсказок на естественном языке, не начиная процесс создания заново. Google утверждает, что модель может сохранять согласованность сцены, непрерывность объектов и реалистичную физику движения при монтаже.
Google продемонстрировала несколько примеров во время объявления, включая превращение скульптур в пузырькообразные структуры, изменение окружения, изменение ракурсов камеры и создание кинематографических визуальных эффектов с помощью подсказок.
Сосредоточьтесь на реалистичной генерации видео с помощью ИИ
Google заявила, что Gemini Omni использует более широкие знания и возможности рассуждения Gemini для повышения реализма сгенерированного контента. Компания выделила такие особенности, как улучшенное понимание гравитации, движения, кинетической энергии и гидродинамики.
Модель также может создавать объяснения, анимированные последовательности и стилизованные видео, сохраняя синхронизацию с аудио- и движущими. Google привёл примеры с глиняной анимацией, научно-фантастическими сценами, музыкальными визуальными эффектами и обучающими объяснениями.
Доступность и поддерживаемые платформы
Google подтвердила, что Gemini Omni Flash запускается по всему миру для подписчиков Google AI Plus, Pro и Ultra через приложение Gemini и платформу Google Flow.
Компания также заявила, что функция будет доступна бесплатно для пользователей YouTube Shorts и YouTube Create, начиная с этой недели. Ожидается поддержка разработчиков и корпоративных клиентов через API в ближайшие недели.
Прозрачность ИИ и проверка SynthID
Google заявила, что все видео, созданные с использованием Gemini Omni, будут использовать цифровые водяные знаки SynthID. Компания также расширяет поддержку верификации в Google Search и Chrome, чтобы помочь пользователям идентифицировать контент, созданный ИИ, онлайн.
Google добавила, что пользователи смогут проверять видео, созданные Gemini Omni, напрямую через поиск, Chrome и экосистему Gemini.
Сценарий Шаурьи Шубхам
Мнение авторов может не совпадать с мнением редакции.
Cообщество журналистов. Non profit
