Google представил нейросеть Gemini Omni — модель уже добавили на Flow

Google открыл доступ к Gemini Omni — новой ИИ-модели для генерации и редактирования видео. Она умеет работать сразу с несколькими типами входных данных: текстом, фотографиями, видео, аудио и референсами. Модель уже появилась в Flow — сервисе Google для создания роликов с ИИ. Гайд к нейронке: как создавать видео в Gemini Omni.

Gemini Omni поддерживает генерацию видео со звуком, а также редактирование готовых сцен через обычный чат. Google показывает сценарии, где пользователь загружает несколько изображений, пишет запрос и затем последовательно меняет результат: перестраивает сцену, меняет стиль, добавляет движения камеры или заменяет объекты в кадре. Подробности в материале Postium.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру».

Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру».

Нейросеть Gemini Omni — что умеет и как работает

Gemini Omni — мультимодальная видеомодель внутри экосистемы Gemini. Google позиционирует её не только как инструмент для генерации роликов «с нуля», но и как систему для последовательной доработки готового материала.

Модель умеет:

генерировать видео по тексту;
создавать ролики из фотографий;
использовать несколько референсов одновременно;
редактировать готовое видео;
сохранять персонажей и стиль между сценами;
генерировать звук внутри ролика.

Google отдельно показывает сценарий с image-to-video: пользователь загружает до пяти изображений, а модель превращает их в единую сцену с движением и анимацией. Также поддерживаются многошаговые правки через чат — без повторной генерации всего ролика после каждого изменения.

В отличие от Veo, который работает как text-to-video-модель, Omni Flash умеет использовать видео как исходный материал для дальнейшей генерации. Это главный сдвиг всей линейки: Google переходит от генерации «с нуля» к редактированию и перестройке готового контента.

В Flow Gemini Omni работает как часть редактора. Пользователь может загрузить исходные материалы, задать сцену текстом и продолжить работу через диалог: менять композицию, освещение, движение камеры, детали окружения или объекты в кадре.

Google также показывает работу с video-to-video: модель берёт готовое видео и перестраивает его по новому описанию, сохраняя основу сцены.

Как пользоваться Gemini Omni Flash

Gemini Omni Flash уже появилась в Flow среди инструментов генерации видео. Для работы можно загрузить фото, видео или референсы, а затем продолжить редактирование через текстовые запросы в чате.

Google пока не опубликовал полный список регионов и тарифов, где модель доступна без ограничений. На страницах сервиса компания указывает, что часть функций может отличаться в зависимости от страны и типа аккаунта.

Почему это важно? Flow всё меньше похож на «генератор видео по тексту» и всё больше — на полноценный ИИ-редактор. Пользователь может сохранять персонажей, визуальный стиль и композицию между правками, а не пытаться заново воспроизвести их новым запросом.

Для Google это ещё и попытка объединить генерацию, монтаж и доработку видео внутри одного сервиса. Вместе с Gemini Omni компания обновила сам Flow и добавила Flow Agent — ИИ-ассистента для работы над сценами и проектами.

Итог: Gemini Omni — новая ИИ-модель Google для видео. Она создаёт короткие ролики со звуком из текста, фото, видео и аудио, а также умеет редактировать готовые сцены.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

Тэги Gemini Google