Google открыл доступ к Gemini Omni — новой ИИ-модели для генерации и редактирования видео. Она умеет работать сразу с несколькими типами входных данных: текстом, фотографиями, видео, аудио и референсами. Модель уже появилась в Flow — сервисе Google для создания роликов с ИИ. Гайд к нейронке: как создавать видео в Gemini Omni.
Gemini Omni поддерживает генерацию видео со звуком, а также редактирование готовых сцен через обычный чат. Google показывает сценарии, где пользователь загружает несколько изображений, пишет запрос и затем последовательно меняет результат: перестраивает сцену, меняет стиль, добавляет движения камеры или заменяет объекты в кадре. Подробности в материале Postium.
Читайте также: 7 лучших нейросетей для генерации видео
Нейросеть Gemini Omni — что умеет и как работает
Gemini Omni — мультимодальная видеомодель внутри экосистемы Gemini. Google позиционирует её не только как инструмент для генерации роликов «с нуля», но и как систему для последовательной доработки готового материала.
Модель умеет:
- генерировать видео по тексту;
- создавать ролики из фотографий;
- использовать несколько референсов одновременно;
- редактировать готовое видео;
- сохранять персонажей и стиль между сценами;
- генерировать звук внутри ролика.
Google отдельно показывает сценарий с image-to-video: пользователь загружает до пяти изображений, а модель превращает их в единую сцену с движением и анимацией. Также поддерживаются многошаговые правки через чат — без повторной генерации всего ролика после каждого изменения.
В отличие от Veo, который работает как text-to-video-модель, Omni Flash умеет использовать видео как исходный материал для дальнейшей генерации. Это главный сдвиг всей линейки: Google переходит от генерации «с нуля» к редактированию и перестройке готового контента.
В Flow Gemini Omni работает как часть редактора. Пользователь может загрузить исходные материалы, задать сцену текстом и продолжить работу через диалог: менять композицию, освещение, движение камеры, детали окружения или объекты в кадре.
Google также показывает работу с video-to-video: модель берёт готовое видео и перестраивает его по новому описанию, сохраняя основу сцены.
Как пользоваться Gemini Omni Flash
Gemini Omni Flash уже появилась в Flow среди инструментов генерации видео. Для работы можно загрузить фото, видео или референсы, а затем продолжить редактирование через текстовые запросы в чате.
Google пока не опубликовал полный список регионов и тарифов, где модель доступна без ограничений. На страницах сервиса компания указывает, что часть функций может отличаться в зависимости от страны и типа аккаунта.
Почему это важно? Flow всё меньше похож на «генератор видео по тексту» и всё больше — на полноценный ИИ-редактор. Пользователь может сохранять персонажей, визуальный стиль и композицию между правками, а не пытаться заново воспроизвести их новым запросом.
Для Google это ещё и попытка объединить генерацию, монтаж и доработку видео внутри одного сервиса. Вместе с Gemini Omni компания обновила сам Flow и добавила Flow Agent — ИИ-ассистента для работы над сценами и проектами.
Итог: Gemini Omni — новая ИИ-модель Google для видео. Она создаёт короткие ролики со звуком из текста, фото, видео и аудио, а также умеет редактировать готовые сцены.