Компания Tencent открыла исходный код и веса Hunyuan World 1.1, известной также как WorldMirror. Это универсальная feed-forward модель, которая генерирует трёхмерные сцены практически из любых входных данных — от видео и фото до комбинации снимков с разных ракурсов.

В отличие от версии Hunyuan World 1.0, которая фокусировалась на генерации 3D-миров из текста или одного изображения, новая модель делает ставку на точную реконструкцию реальной геометрии и поддержку видео. По сути, это шаг от «создания фантазийных миров» к воспроизведению реальности.

Реклама. Erid 2VtzqwMXQT6. ООО «Клик.ру», ИНН 7743771327. Промопульт
Реклама. Erid 2Vtzqx3YjaU. ООО «Клик.ру», ИНН 7743771327. Промопульт

Читайте также: Как создавать видео с помощью нейросеть WAN 2.5

Что умеет нейросеть Hunyuan World 1.1

1. Любые входные данные.

WorldMirror принимает на вход видео, серию фото или одиночные изображения. При желании пользователь может добавить геометрические приоры — позы камер, фокусные расстояния, карты глубины — чтобы улучшить точность и устранить неоднозначности в структуре сцены.

2. Любые выходные данные.

Модель генерирует сразу несколько 3D-представлений в одном проходе:

  • плотные облака точек (dense point clouds);
  • карты глубины для разных ракурсов;
  • параметры камер;
  • нормали поверхностей;
  • 3D Gaussian Splatting — формат, подходящий для современных рендеров и движков.

3. Быстро и просто.

Hunyuan World 1.1 — это feed-forward архитектура без итеративных шагов оптимизации. Весь процесс реконструкции выполняется на одной GPU и занимает несколько секунд. Это делает модель удобной для применения в реальном времени и в продакшн-пайплайнах.

Почему это важно? Раньше, чтобы восстановить 3D-сцену из видео или фото, требовались мощные серверы и много времени — иногда десятки минут на один объект. WorldMirror делает то же самое за несколько секунд и на одной видеокарте.

Модель не нужно долго настраивать под каждый набор данных — она работает «из коробки». Благодаря этому 3D-реконструкцию теперь можно использовать гораздо шире: быстро генерировать объекты и сцены для игр или VR, делать цифровые копии зданий и помещений, а также визуализировать сцены для фильмов.

Tencent утверждает, что WorldMirror показывает результаты уровня лучших в мире моделей (SOTA) на популярных наборах данных — и особенно хорошо работает, если добавить подсказки вроде позиции камер или карт глубины.

Статья в тему: Промты для создания 3D-фигурок и кукол в коробке

Как пользоваться Hunyuan World 1.1?

Модель Hunyuan World 1.1 (WorldMirror) распространяется по лицензии Tencent Hunyuan World Mirror Community License — она разрешает исследовательское и ограниченное коммерческое использование.

Использовать её можно двумя способами:

  • Скачать и запустить локально. Репозиторий HunyuanWorld-Mirror на GitHub содержит код инференса, примеры и подробные инструкции по установке.
  • Попробовать онлайн. На Hugging Face доступны веса модели и демо-интерфейс: можно загрузить видео или набор снимков и получить готовую 3D-сцену прямо в браузере.

Летом 2024 года Tencent представила Hunyuan World 1.0, модель для генерации 3D-миров из текста или одиночного изображения. Позже вышла Hunyuan World Lite — версия для обычных видеокарт. Теперь компания делает следующий шаг — универсальную 3D-реконструкцию из реальных данных, объединяющую разные направления (текст → 3D, фото → 3D, видео → 3D) в одном решении.

Итог: Tencent сместила фокус с генерации вымышленных 3D-миров на реконструкцию реальных сцен. Hunyuan World 1.1 (WorldMirror) показывает переход индустрии от «творческих» моделей, создающих фантазии по тексту, к практическим инструментам, которые точно восстанавливают геометрию и физику окружающего мира.

По сути, Tencent предлагает универсальный пайплайн для цифрового копирования реальности — шаг к «реальному» 3D-интеллекту, где модели не придумывают, а понимают и воспроизводят мир.

Ранее Lightricks представила нейросеть LTX-2, которая нативно генерирует видео в 4K.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Tencent открыла Hunyuan World 1.1 (WorldMirror) — нейросеть для создания 3D-сцен по фото и видео
⚡ В тренде
В соцсетях резко выросло число роликов и картинок, где обычные города превращены в мягкие мини-макеты из пряжи. Дома выглядят как игрушечные, деревья — как пушистые комочки, дороги — как аккуратно вышитые полосы. Всё это напоминает диораму, которую долго и терпеливо собирали вручную. Но на самом деле такие сцены делают нейросети — достаточно одного удачного промта. […]
«Сбер» выпустил iOS-приложение чат-бота GigaChat. Оно доступно в App Store под названием G8AI, сообщили в пресс-службе компании. В приложении уже работают голосовой режим (два голоса — мужской и женский), генерация изображений и музыки, а также функция «Глубокое исследование», которая анализирует данные из нескольких источников. Читайте также: Как установить приложение ChatGPT на Айфон Что умеет iOS-версия […]
OpenAI представила новую версию своей модели — GPT-5.1, доступную в двух режимах работы: Instant и Thinking. Обновление делает ChatGPT не только умнее, но и более человечным: теперь можно выбрать стиль общения — от строгого и делового до дружелюбного или даже слегка «чудаковатого». Подробности в материале Postium. Читайте также: 10 лучших курсов по работе с ChatGPT […]
Чат-бот Grok от компании xAI теперь умеет создавать короткие видео по текстовым подсказкам. Функция работает через инструмент Imagine: пользователю достаточно описать сцену, а нейросеть сама сгенерирует ролик с движением, звуком и озвучкой. Ранее Grok Imagine умел превращать в видео только изображения — можно было «оживить» фото, добавив движение или эмоцию. Postium показывает, как работает обновление. […]
Первый сезон «Fallout» стал для Prime Video редким случаем, когда экранизация игры не просто «сработала», а задала планку. Постапокалиптика с фирменным чёрным юмором, узнаваемые детали вселенной, три равноправные линии героев — и ни грамма боязни выглядеть странно. Финал аккуратно подвёл нас к расширению карты: из компактных, но разрушенных районов пустоши — в легендарный Нью-Вегас. В […]
Блоги компаний
Новости
Свежие статьи