Tencent официально выпустила HunyuanImage 3.0 — крупнейшую на сегодня открытую модель для генерации изображений по текстовому описанию. Она насчитывает 80 млрд параметров, при этом во время инференса задействуется около 13 млрд.

По словам команды, результат сравним с качеством ведущих закрытых моделей. Postium подготовил подробный обзор новой ИИ-модели для создания картинок.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Читайте также: 25 нейросетей для генерации картинок

Что умеет нейросеть HunyuanImage 3.0

HunyuanImage 3.0 создана на базе MoE-архитектуры (Mixture of Experts) и объединяет языковую и визуальную модель в единую систему. В отличие от традиционных диффузионных генераторов (DiT), здесь используется «трансфузионный» подход — плотная связка Diffusion и LLM-тренировки.

Это позволяет не только создавать картинки, но и осмысленно работать с длинными промтами для генерации изображений, учитывать «мировые знания» и аккуратно встраивать текст в изображения.

Что это значит на практике:

  • Поддержка длинных запросов до 1000+ слов.
  • Генерация читаемого текста на изображениях (постеры, комиксы, инфографика).
  • Работа со сложными стилями — от эмодзи и комиксов до образовательных иллюстраций.
  • Более быстрый отклик: процесс занимает минуты, а не часы.

Как обучали модель? Tencent заявляет о крупнейшем мультимодальном датасете в своей линейке: 5 млрд пар «текст–картинка», видеокадры и смешанные данные «текст + изображение», 6 трлн токенов текстовых корпусов.

Базой для модели послужил Hunyuan-A13B, мультимодальный LLM. Такой гибридный тренинг делает HunyuanImage 3.0 универсальной: она может совмещать задачи понимания текста и генерации изображения в одном шаге.

Статья в тему: Промты для обработки фото в ChatGPT

Как пользоваться HunyuanImage 3.0

1. Через официальный сайт. Перейдите на hunyuan.tencent.com/image и нажмите «Авторизоваться» в правом верхнем углу. Интерфейс пока доступен только на китайском, поэтому удобнее включить автоматический перевод в браузере.

Как пользоваться HunyuanImage 3.0

Авторизация через e-mail: введите свою почту, нажмите «Получить код» и используйте его в качестве пароля (обычного пароля здесь нет).

Как войти на сайт HunyuanImage

После входа выберите вкладку «Визуальная генерация» — это второй пункт меню справа.

Визуальная генерация

Откроется окно генерации. По умолчанию стоит модель 3.0, но можно проверить настройки.

Как выбрать модель HunyuanImage 3.0

Введите промт (описание картинки) и получите результат за пару минут. Полученную картинку можно скачать или попросить сгенерировать ещё раз.

Как создавать изображения с помощью нейросети HunyuanImage 3.0

2. Через Hugging Face. Модель доступна в каталоге Hugging Face. Можно запускать через transformers или попробовать демо в браузере.

3. Локальный запуск. Код и веса (≈170 ГБ) опубликованы на GitHub. Для работы потребуется минимум 3–4 GPU по 80 ГБ. Есть оптимизация FlashAttention и FlashInfer для ускорения.

Вероятно, модель вскоре появится у партнёров.

В начале сентября Tencent выпустила HunyuanImage 2.1 (17B) — диффузионную модель с рефайнером, которая стала лидером в открытых бенчмарках T2I.

Параллельно компания развивает Hunyuan-LLM и HunyuanVideo. С релизом 3.0 Tencent делает ставку на единую архитектуру, которая объединяет текстовые и визуальные задачи в одном фреймворке. В планах добавить image-to-image, редактирование картинок, многошаговые диалоги с моделью.

Ранее Wan 2.5 добавила генерацию видео по звуку.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

Комментарии: Tencent выпустила HunyuanImage 3.0 — бесплатный аналог Midjourney с открытыми весами
⚡ В тренде
Twitch — это не просто стримы и чат. Это возможность превратить своё увлечение играми в настоящую профессию. Представь: ты не просто играешь в любимые игры, а зарабатываешь на этом, строишь собственное комьюнити и становишься узнаваемым стримером. Звучит как мечта? На Twitch она вполне реальна. В этой статье расскажем, как быстро раскрутить канал, выйти на первую […]
Сайты с прокси – это сервисы, предоставляющие услуги прокси: использование специальных серверов, выступающих посредниками между пользователем и интернетом. Прокси-серверы позволяют сохранять анонимность в сети, увеличивают скорость доступа к некоторым ресурсам, повышают уровень защиты данных от возможных угроз. В этой статье мы разберем, какие прокси бывают и для чего используются. Рассмотрим 10 популярных сайтов с прокси. […]
История Pixar — это не просто рассказ о создании мультфильмов. Это история о том, как маленькая команда энтузиастов смогла изменить индустрию развлечений, ввести новые стандарты и доказать: даже самые амбициозные мечты достижимы. Успех Pixar — это синтез технологий, креатива и бизнес-рисков. Эта история может вдохновить не только тех, кто связан с кино или анимацией, но […]
Ищете промты для открыток ко Дню России? Нейросети могут сделать семейное поздравление по фото, портрет в праздничном образе, открытку для детей или вариант в советском стиле с достопримечательностями нужного города. В этой статье собрали готовые промты для разных форматов, а также покажем, как ими пользоваться и где лучше генерировать такие открытки. Читайте также: 25 нейросетей […]
Google добавила в Gemini Live создание и редактирование изображений во время разговора. Можно показать комнату через камеру и попросить Gemini изменить интерьер, разобрать задачу по математике или сделать мем. Функция работает в приложении Gemini через Live. Google не уточнила, у всех ли уже появился новый режим и есть ли ограничения по странам, устройствам или типам […]
Блоги компаний
Новости
Свежие статьи