Хотите сделать безлимитный генератор картинок прямо на компьютере? Z-Image — одна из лучших нейросетей для этого. Это открытая модель от Alibaba: её можно скачать, запустить локально и использовать для генерации изображений, обработки фото и работы с референсами.

Z-Image — не только text-to-image генератор. Модель подходит и для более серьёзных задач: редактирования изображений, апскейла, ИИ-фотосессий, UGC-креативов, подключения LoRA и кастомных воркфлоу в ComfyUI.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

В этой статье разберём, что представляет собой нейросеть Z-Image, какие у неё есть версии, как бесплатно скачать и установить её на компьютер и как использовать для разных задач — от генерации по запросу до работы с исходниками.

Читайте также: 33 промта для генерации дизайна в ChatGPT Images 2.0

Что умеет нейросеть Z-Image и какие есть версии

Alibaba Z-Image — это семейство открытых моделей для генерации изображений от команды Tongyi-MAI внутри Alibaba. Модель доступна открыто: веса можно скачать, запустить локально и подключить к ComfyUI, Forge и другим оболочкам. Поэтому вокруг Z-Image быстро появилось комьюнити с workflow, LoRA, ControlNet и готовыми сборками.

Почему Z-Image сейчас называют одной из лучших open-source моделей для генерации изображений? Из-за соотношения качества и системных требований. Модель весит 6B параметров: она заметно легче многих тяжёлых open-source генераторов, но при этом даёт сильный результат в фотореализме, предметной съёмке, иллюстрациях и изображениях с текстом.

Технически Z-Image — диффузионная модель на архитектуре Scalable Single-Stream Diffusion Transformer. Проще говоря, Z-Image читает текстовый запрос, создаёт набор случайного шума и шаг за шагом превращает его в картинку. В отличие от части других нейросетей, здесь текст и изображение обрабатываются вместе внутри одной системы, поэтому модель лучше связывает описание с итоговым результатом.

Статья в тему: 25 нейросетей для генерации изображений

Версии модели Z-Image

У Z Image есть четыре версии: Turbo, базовая Z-Image, Edit и Omni.

1. Z-Image Turbo — версия для быстрой генерации картинок по промту. Её можно использовать для обложек, постеров, рекламных креативов, иллюстраций и визуала для соцсетей.

2. Z-Image — базовая версия для тех, кому нужен контроль над результатом. Она работает медленнее Turbo, но поддерживает CFG, негативные промты, fine-tuning, LoRA и ControlNet. Эту версию используют, когда нужно настроить модель под бренд, персонажа, стиль иллюстраций, серию обложек или рабочий пайплайн в ComfyUI.

3. Z-Image Edit — заявленная версия для редактирования изображений по текстовым инструкциям. Должна менять объект, фон, стиль, свет и отдельные элементы сцены. Но официальный чекпоинт Edit пока не опубликован, поэтому такие задачи сейчас чаще решают через img2img, inpaint, ControlNet и сторонние workflow.

4. Z-Image Omni-Base — заявленная универсальная база для генерации и редактирования. Рассчитана на комьюнити-разработку, fine-tuning и кастомные пайплайны. Для скачивания Omni-Base пока не доступна.

Если ставите Z-Image локально, выбирайте между двумя рабочими вариантами: Turbo — для быстрых генераций, базовая Z-Image — для контроля, LoRA, fine-tuning и сложных workflow.

Как протестировать Z-Image бесплатно и без регистрации

По сути, официальный сайт Z-Image — это репозиторий проекта на GitHub. Там собраны все основные ссылки: описание модели, документация, демо-страницы и версии Z-Image.

Как протестировать Z Image бесплатно и без регистрации

Ниже на странице проекта есть ссылки на демо-версии Z-Image и Z-Image Turbo. Они открываются через Hugging Face Spaces — это веб-интерфейс, где модель можно протестировать прямо в браузере (действительно бесплатно, и действительно без регистрации).

На Hugging Face сразу открывается панель генерации: поле для промта, выбор разрешения, seed и количество steps.

Что умеет нейросеть Z Image и какие есть версии

Steps — это число шагов, за которое модель собирает изображение. У Z-Image Turbo по умолчанию стоит 8 шагов: этого достаточно для быстрого теста.

Seed — число, которое фиксирует случайность генерации. Если оставить random seed, модель каждый раз будет выдавать новый результат. Если указать конкретный seed, можно повторить похожую картинку с теми же настройками.

Дальше всё просто: вводите промт для генерации изображения, нажимаете Generate и ждёте результат. Пробуйте свои запросы и смотрите, как Z-Image справляется с фотореализмом, постерами, рекламными креативами и другими задачами.

Для первого теста этого достаточно. Если результат вас устраивает, можно скачать веса и запускать Z-Image локально через ComfyUI, Forge или другие интерфейсы.

Как скачать и установить Z-Image на своём компьютере

Для локального запуска самый оптимальный вариант — это Z-Image Turbo. Она быстрее базовой версии, требует меньше шагов генерации и лучше подходит для домашних видеокарт.

Поэтому дальше разберём установку и требования на примере Turbo.

Системные требования

Для локальной работы Z-Image Turbo нужна видеокарта NVIDIA с поддержкой CUDA. Официально поддерживается CUDA 11.4 и новее — сюда попадает большинство RTX 20xx, 30xx, 40xx и 50xx.

Комфортный вариант — видеокарта с 16 GB VRAM и выше. На 12 GB модель можно запускать с оптимизациями. Для 8 GB скачивают FP8, GGUF, offload или специальные community-workflow, но это уже компромисс по скорости, разрешению и стабильности.

Какой файл скачивать

Важно: Сами веса Z-Image Turbo для ComfyUI можно скачать с Hugging Face (инструкция ниже). Там лежат разные версии модели: bf16, fp16, fp8, GGUF и AIO-сборки.

У Z-Image много форматов весов, и новичков это обычно путает. На практике достаточно понимать разницу между основными вариантами:

  • safetensors — основной формат модели. Это стандартный вариант для ComfyUI, Forge и большинства workflow.
  • bf16 — максимальное качество и полный размер модели. Требует много VRAM. Подходит для 16+ ГБ памяти.
  • fp16 — компромисс между качеством и потреблением памяти. Один из самых универсальных вариантов.
  • fp8 — облегчённая версия модели. Качество чуть ниже, зато модель занимает меньше VRAM и проще запускается на домашних видеокартах.

GGUF — отдельная история. Это сильно сжатые версии модели для экономии памяти. Их используют, когда нужно выжать запуск даже на слабом железе.

Также можно встретить Q8, Q5_K_M, NvFP4 и AIO. Это уже вариации квантизации и упаковки модели.

Что такое VAE и text encoder? У некоторых сборок Z Image VAE и text encoder идут отдельными файлами. Text encoder отвечает за понимание текста в промпте. VAE — за финальную сборку изображения: цвета, детали, резкость и качество картинки на выходе.

В AIO-сборках всё уже упаковано вместе. В обычных workflow эти файлы иногда нужно подключать отдельно.

Установка через ComfyUI

ComfyUI — самый популярный способ развернуть Z-Image локально. Это нодовый интерфейс, где генерация собирается как схема из блоков.

Перейдите по ссылке на сборку Z-Image Turbo для ComfyUI на Hugging Face. Внутри уже лежат все нужные файлы модели, разложенные по папкам.

Как скачать и установить Z Image на своём компьютере

Скачивайте файлы из этих директорий:

  • diffusion_models — основная модель;
  • text_encoders — text encoder;
  • vae — VAE;
  • loras — LoRA и дополнительные адаптеры.

Просто открываете нужную папку и нажимаете скачать рядом с выбранным файлом:

Как скачать Z Image Turbo для ComfyUI

Дальше переносите их в такие же папки внутри ComfyUI:

  • ComfyUI/models/diffusion_models;
  • ComfyUI/models/text_encoders;
  • ComfyUI/models/vae;
  • ComfyUI/models/loras.

После этого запускайте ComfyUI и загружайте workflow под Z-Image Turbo. Модель появится в списке и будет готова к генерации.

Установка через Forge и Forge Neo

Forge и Forge Neo — более простой способ для тех, кому не нравится нодовый интерфейс ComfyUI.

По логике это веб-интерфейс: загрузили модель, ввели промпт, нажали Generate. Интерфейс ближе к Automatic1111, но поддержка новых моделей вроде Z-Image и FLUX здесь лучше.

Для Z-Image Turbo в Forge Neo лучше сразу искать специальные loader-ноды и отдельные инструкции от комьюнити.

Как пользоваться Z-Image — подробное руководство

Генерация изображений

Базовый сценарий работы с Z-Image Turbo — генерация картинок по текстовому запросу. Вы открываете workflow в ComfyUI, загружаете модель, вводите промт и запускаете генерацию.

Для первого запуска достаточно:

  • выбрать модель Z-Image Turbo;
  • ввести промт;
  • поставить 4–8 steps;
  • выбрать sampler;
  • нажать Queue Prompt.

У Z Image-Turbo есть важная особенность: это быстрая дистиллированная модель. Она рассчитана на малое количество шагов, поэтому лучше работает с короткими промтами, понятной структурой и без перегруженного negative prompt.

Z-Image лучше понимает подробное описание сцены. Модель пытается буквально собрать изображение из текста: кто в кадре, какой свет, какая камера, окружение, стиль и материалы сцены.

Поэтому хороший промпт составляется так:

  • объект;
  • окружение;
  • свет;
  • камера;
  • стиль.

Например:

cinematic portrait of a woman, soft studio lighting, realistic skin texture, shallow depth of field, black background, high detail

Или:

futuristic tokyo street at night, neon lights, rain reflections, cinematic atmosphere, ultra detailed

Для Z Image Turbo не настраивайте CFG как в SDXL или базовой Z-Image. Turbo — дистиллированная модель, она рассчитана на малое количество шагов и работает без CFG. В Diffusers ставьте guidance_scale=0.0; в ComfyUI лучше опираться на готовый workflow.

Примеры рабочих промтов

Реалистичный портрет:

close-up photorealistic portrait of a woman, natural skin texture, soft diffused light, brown eyes, sharp focus, neutral studio background, realistic facial proportions, high detail

Продуктовая фотография:

minimalist product shot of a glass perfume bottle on a white marble surface, soft studio lighting, clean commercial photography, sharp reflections, premium advertising style, high resolution

В стиле аниме:

anime girl under cherry blossoms, school uniform, detailed eyes, vibrant colors, warm spring lighting, clean background, polished illustration style

Архитектура:

modern minimalist house exterior, concrete and glass facade, surrounded by trees, golden hour lighting, architectural photography, sharp details, clean composition

LoRA

LoRA — дополнительные веса поверх основной модели. Их используют, чтобы не загружать каждый раз референс: персонажа, стиль, товар или визуальный формат можно «вшить» в модель один раз.

Это похоже на SDXL/Flux: модель + LoRA. В отличие от Nano Banana, где лицо удерживается по загруженному фото, здесь персонажа обучают заранее. После этого можно задавать только сцену, одежду, позу и фон — модель подтянет нужный образ сама.

Готовые LoRA можно найти на CivitAI и Hugging Face: введите в поиске «z image lora» и выбирайте адаптер по описанию, примерам и версии модели. Ищите LoRA, обученные именно под Z-Image или Z-Image Turbo.

В ComfyUI LoRA подключается через LoRA Loader. В Forge её нужно укзать прямо в промте: <lora:имя_файла:сила>. Можно подключать несколько LoRA, но начинать лучше с одной: так проще понять, что она меняет — лицо, стиль, одежду, детализацию или общую эстетику.

Обучение LoRA локально и онлайн

Вы можете обучить свою LoRA под повторяемые задачи: одного персонажа, виртуального инфлюенсера, брендовый стиль, карточки товара, превью или рекламные креативы. Это нужно, когда модель должна стабильно повторять лицо, объект или визуальный стиль, а не генерировать каждый раз случайный результат.

Z-Image Turbo удобно использовать в готовом пайплайне: она быстро генерирует изображения. Но для обучения и тонкой настройки лучше подходит базовая Z-Image — она рассчитана на fine-tuning, LoRA и кастомизацию. LoRA под Turbo тоже делают, но это больше комьюнити-практика.

Для обучения нужны:

  • 15–30 качественных изображений персонажа, товара или стиля;
  • видеокарта от 12 GB VRAM, лучше 16 GB и выше;
  • подписи к изображениям;
  • конфиг обучения под Z-Image или Z-Image Turbo.

Главное — чистый датасет. Если на фото разный свет, мусорный фон и случайные детали, LoRA запомнит лишнее. Если изображения подготовлены аккуратно, модель стабильнее удерживает лицо, стиль или объект.

Если своего железа нет, LoRA можно обучить онлайн через сторонние сервисы. Это проще, но обычно платно и требует загрузки изображений на чужой сервер.

ControlNet

ControlNet нужен, чтобы управлять структурой изображения: позой, контуром, глубиной, композицией или эскизом. Если LoRA отвечает за стиль или персонажа, то ControlNet задаёт каркас сцены.

Для Z-Image Turbo в ComfyUI обычно используют ControlNet Union. Он работает с разными типами входных данных: pose, depth, Canny-контур, сегментация и скетчи.

Схема работы простая: загружаете Z-Image Turbo, подключаете ControlNet Union, добавляете референс и промт. Модель берёт структуру исходника и перестраивает сцену под описание.

Главный параметр — strength. При значениях 0.5–0.8 модель удерживает позу или композицию, но не копирует исходник слишком жёстко. Чем выше значение, тем сильнее результат повторяет референс.

LoRA и ControlNet можно использовать вместе: LoRA удерживает персонажа или стиль, а ControlNet — позу и композицию. Так можно один раз обучить персонажа и дальше генерировать серии изображений без постоянной загрузки лица как референса.

Можно ли отключить цензуру и генерировать NSFW

Tongyi-MAI не позиционирует Z-Image как NSFW-модель. При локальном запуске пользователь управляет workflow, но NSFW LoRA, uncensored-сборки и «разблокировки» относятся к сторонним файлам, а не к официальной версии Z Image.

Например, на CivitAI можно найти NSFW LoRA и кастомные сборки под Z-Image Turbo, которые смещают модель в сторону откровенного контента.

Но если задача не в генерации 18+ контента, а в обычной fashion-съёмке, анатомических референсах, купальниках или художественных сценах, лучше формулировать промт нейтрально: через жанр, свет, одежду, композицию и контекст, а не пытаться обходить ограничения модели.

Например:

Editorial fashion photo of a model wearing a minimalist summer swimsuit on a clean studio background, professional lighting, natural pose, high-end magazine style, tasteful composition, no explicit content

Такой промпт описывает обычную fashion-съёмку без попытки «сломать» фильтры.

Важно: При локальном запуске ответственность за модель, LoRA, датасет, настройки и итоговый результат лежит на пользователе.

Что дальше

Нейросеть Z-Image стоит попробовать, как минимум, ради одного: после локальной установки у вас появляется свой генератор изображений без лимитов, очередей и зависимости от сторонних сервисов.

Начать можно просто:

  • протестируйте Z-Image в демо на Hugging Face;
  • скачайте и запустите  Z-Image Turbo через ComfyUI;
  • подключите готовый workflow;
  • дальше подключайте LoRA, ControlNet и img2img под свои задачи.

По сути, Z-Image превращает ваш компьютер в личную студию для генерации и обработки изображений. Вы один раз настраиваете пайплайн — и дальше генерируете столько, сколько позволяет ваше железо.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

Комментарии: Нейросеть Z-Image и Z-Image Turbo: как скачать, установить и пользоваться бесплатно
⚡ В тренде
Плохой промт звучит так: «Напиши статью на тему…». Хороший промт объясняет, для кого нужен текст, какую задачу он решает, какие факты использовать, какой структуры держаться и чего нельзя писать. Разница не в длине запроса, а в точности. Если не задать роль, аудиторию, формат и фактуру, нейросеть заполнит пустоты сама: возьмёт усреднённые формулировки, напишет общими словами […]
Если вам нужно быстро и грамотно сделать презентацию, воспользуйтесь ИИ-агентом Kimi Agentic Slides. Он умеет не только генерировать слайды, но и находить информацию для наполнения, структурировать и дополнять её визуалом. В статье разберемся, что представляет собой функция Agentic Slides и как ею пользоваться бесплатно. Подробно и по шагам покажем процесс создания презентации. Читайте также: 5 […]
ИИ может сильно ускорить создание поста-карусели, но начинать нужно не с дизайна. Главная ошибка — сразу писать нейросети: «Сделай красивую карусель». В ответ обычно получаются красивые, но пустые слайды. Выглядят они хорошо, но читать их не хочется. Процесс должен идти в другом порядке: сначала — мысль и структура, потом — промпты для сценария и визуальный […]
Если вы решили запустить собственный облачный сервис, игровой сервер или сайт с большой посещаемостью, то обычного виртуального хостинга будет недостаточно. Вам потребуется виртуальный сервер, который обеспечит необходимые мощности, выделенный IP-адрес и полный контроль над операционной системой. В статье рассмотрим 10 популярных российских провайдеров, предлагающих VDS/VPS-сервера в аренду. Оценим их по ключевым параметрам. Разберемся, на что […]
Яндекс Директ — это инструмент для привлечения клиентов через поиск, РСЯ (Рекламная сеть Яндекса) и Карты Яндекса. Запущенную с его помощью рекламу пользователи видят в браузере, на ресурсах экосистемы (Яндекс Погода, Яндекс Афиша и пр.), партнерских сайтах Яндекса и тематических Телеграм-каналах. Товары и услуги, расположенные вблизи локации поиска, на Яндекс картах для наглядности выделяются зеленой […]
Блоги компаний
Новости
Свежие статьи