Китайская команда Wan (принадлежит Alibaba Cloud) выпустила обновлённую ИИ-модель для генерации видео — Wan 2.5. Теперь ролики создаются не только с картинкой, но и со звуком: модель сама добавляет закадровую речь, музыку, эффекты и синхронизирует движение губ с текстом.
Мы уже протестировали нейросеть, сделали подробный гайд, как работать в Wan 2.5 и собрали 10 шаблонов промтов для Wan, которые можно легко адаптировать под свои задачи.
Поддерживается мультиязычная озвучка, в том числе на русском. Качество кадров и плавность анимации заметно улучшились по сравнению с версией 2.2. Postium собрал больше фактов о новом ИИ-генераторе видео и рассказывает, как протестировать его бесплатно.
Читайте также: Промты для генерации видео
Что нового в Wan 2.5
Для пользователей новая версия генератора открывает доступ к созданию видео «под ключ» прямо из текста (или картинки), без отдельного монтажа и наложения звука. Вот наглядный пример:
Возможности новой нейросети:
- Видео + звук в один проход. Генерация ролика и аудио происходит одновременно, без постобработки.
- Автоматический липсинк. Реплики героев подстраиваются под губы персонажей.
- Языки. Работает многоязычная речь: английский, китайский и другие, в том числе русский.
- Форматы. Видео до 1080p, доступны пресеты «быстрый рендер» и «максимальное качество».
- Режимы ввода. Text-to-video и image-to-video: можно задать описание или загрузить картинку, чтобы на её основе получить ролик.
- Скорость. По отзывам тестировщиков, короткий ролик в 4–5 секунд модель создаёт за несколько минут.
Как пользоваться Wan 2.5 Video
Wan 2.5 уже можно тестировать прямо на сайте сервиса, вход через Гугл-аккаунт, без ограничений. После входа на сайт идём в генератор (в меню справа), пишем промт и настраиваем параметры генерации: первый кадр, тип генерации, длина видео, модель, звук, камера и прочее:

Если вы генерируете видео бесплатно, без оплаты кредитами — придётся подождать результата, если оплачиваете — получите ролик быстрее. Подробнее все шаги генерации рассмотрели в отдельном гайде по нейронке.

Тариф Pro будет стоить $6,5 в месяц, на нём вы получаете 300 кредитов и другие премиум-опции. Также можно отдельно купить от 30 кредитов.

Также есть доступ через API и сервисы-партнёры. Полностью бесплатного доступа нет, но площадки вроде Higgsfield, ComfyUI, VEED и другие партнёры могут давать бесплатные лимиты на генерацию (несколько роликов в день или ограничение по секундам). Открытого кода разработчики пока не обещают.
Также можно подключить API. Wan 2.5 есть на маркетплейсах моделей, включая Replicate, где можно оплатить использование по мере необходимости. Некоторые сервисы дают тестовые кредиты.
Wan 2.5 выходит на рынок в тот момент, когда за внимание борются Google Veo 3, Pika Labs, Runway и китайский конкурент Kling 2.5 Turbo. Но ключевое отличие китайской модели — ставка на полноценный мультимедийный клип «из промпта». Если у конкурентов видео и звук обычно генерируются раздельно, здесь всё объединено сразу.
Также, чуть раньше появился модуль Wan 2.2 Animate, позволяющий оживлять персонажей и накладывать речь. Версия 2.5 стала логичным шагом: объединить картинку и звук в одном инструменте, сделать технологию массово доступной и дешевле конкурентов.