Google представил нейросеть Gemini Omni — модель уже добавили на Flow

Google открыл доступ к Gemini Omni — новой ИИ-модели для генерации и редактирования видео. Она умеет работать сразу с несколькими типами входных данных: текстом, фотографиями, видео, аудио и референсами. Модель уже появилась в Flow — сервисе Google для создания роликов с ИИ. Гайд к нейронке: как создавать видео в Gemini Omni.

Gemini Omni поддерживает генерацию видео со звуком, а также редактирование готовых сцен через обычный чат. Google показывает сценарии, где пользователь загружает несколько изображений, пишет запрос и затем последовательно меняет результат: перестраивает сцену, меняет стиль, добавляет движения камеры или заменяет объекты в кадре. Подробности в материале Postium.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Читайте также: 7 лучших нейросетей для генерации видео

Нейросеть Gemini Omni — что умеет и как работает

Gemini Omni — мультимодальная видеомодель внутри экосистемы Gemini. Google позиционирует её не только как инструмент для генерации роликов «с нуля», но и как систему для последовательной доработки готового материала.

Модель умеет:

  • генерировать видео по тексту;
  • создавать ролики из фотографий;
  • использовать несколько референсов одновременно;
  • редактировать готовое видео;
  • сохранять персонажей и стиль между сценами;
  • генерировать звук внутри ролика.

Google отдельно показывает сценарий с image-to-video: пользователь загружает до пяти изображений, а модель превращает их в единую сцену с движением и анимацией. Также поддерживаются многошаговые правки через чат — без повторной генерации всего ролика после каждого изменения.

В отличие от Veo, который работает как text-to-video-модель, Omni Flash умеет использовать видео как исходный материал для дальнейшей генерации. Это главный сдвиг всей линейки: Google переходит от генерации «с нуля» к редактированию и перестройке готового контента.

В Flow Gemini Omni работает как часть редактора. Пользователь может загрузить исходные материалы, задать сцену текстом и продолжить работу через диалог: менять композицию, освещение, движение камеры, детали окружения или объекты в кадре.

Google также показывает работу с video-to-video: модель берёт готовое видео и перестраивает его по новому описанию, сохраняя основу сцены.

Как пользоваться Gemini Omni Flash

Gemini Omni Flash уже появилась в Flow среди инструментов генерации видео. Для работы можно загрузить фото, видео или референсы, а затем продолжить редактирование через текстовые запросы в чате.

Google пока не опубликовал полный список регионов и тарифов, где модель доступна без ограничений. На страницах сервиса компания указывает, что часть функций может отличаться в зависимости от страны и типа аккаунта.

Почему это важно? Flow всё меньше похож на «генератор видео по тексту» и всё больше — на полноценный ИИ-редактор. Пользователь может сохранять персонажей, визуальный стиль и композицию между правками, а не пытаться заново воспроизвести их новым запросом.

Для Google это ещё и попытка объединить генерацию, монтаж и доработку видео внутри одного сервиса. Вместе с Gemini Omni компания обновила сам Flow и добавила Flow Agent — ИИ-ассистента для работы над сценами и проектами.

Итог: Gemini Omni — новая ИИ-модель Google для видео. Она создаёт короткие ролики со звуком из текста, фото, видео и аудио, а также умеет редактировать готовые сцены.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

Комментарии: Google представил нейросеть Gemini Omni — модель уже добавили на Flow
⚡ В тренде
Плохой промт звучит так: «Напиши статью на тему…». Хороший промт объясняет, для кого нужен текст, какую задачу он решает, какие факты использовать, какой структуры держаться и чего нельзя писать. Разница не в длине запроса, а в точности. Если не задать роль, аудиторию, формат и фактуру, нейросеть заполнит пустоты сама: возьмёт усреднённые формулировки, напишет общими словами […]
Если вам нужно быстро и грамотно сделать презентацию, воспользуйтесь ИИ-агентом Kimi Agentic Slides. Он умеет не только генерировать слайды, но и находить информацию для наполнения, структурировать и дополнять её визуалом. В статье разберемся, что представляет собой функция Agentic Slides и как ею пользоваться бесплатно. Подробно и по шагам покажем процесс создания презентации. Читайте также: 5 […]
ИИ может сильно ускорить создание поста-карусели, но начинать нужно не с дизайна. Главная ошибка — сразу писать нейросети: «Сделай красивую карусель». В ответ обычно получаются красивые, но пустые слайды. Выглядят они хорошо, но читать их не хочется. Процесс должен идти в другом порядке: сначала — мысль и структура, потом — промпты для сценария и визуальный […]
Если вы решили запустить собственный облачный сервис, игровой сервер или сайт с большой посещаемостью, то обычного виртуального хостинга будет недостаточно. Вам потребуется виртуальный сервер, который обеспечит необходимые мощности, выделенный IP-адрес и полный контроль над операционной системой. В статье рассмотрим 10 популярных российских провайдеров, предлагающих VDS/VPS-сервера в аренду. Оценим их по ключевым параметрам. Разберемся, на что […]
Яндекс Директ — это инструмент для привлечения клиентов через поиск, РСЯ (Рекламная сеть Яндекса) и Карты Яндекса. Запущенную с его помощью рекламу пользователи видят в браузере, на ресурсах экосистемы (Яндекс Погода, Яндекс Афиша и пр.), партнерских сайтах Яндекса и тематических Телеграм-каналах. Товары и услуги, расположенные вблизи локации поиска, на Яндекс картах для наглядности выделяются зеленой […]
Блоги компаний
Новости
Свежие статьи