Компания Qwen представила новую мультимодальную модель Qwen-Image — мощную разработку на базе 20-миллиардной архитектуры MMDiT, специально созданную для генерации изображений с высокой точностью текстов, редактирования картинок и поддержки различных языков.

Это не просто визуальный генератор — это универсальный инструмент, способный обрабатывать сложные запросы с текстовыми элементами, сочетая художественную выразительность и техническую точность.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Читайте также: 5 нейросетей для генерации картинок с надписями

Что умеет нейросеть Qwen-Image?

1. Картинки с надписями

Qwen-Image умеет «рисовать» текст на изображениях не просто точно, но и с учётом контекста, структуры, языка и даже каллиграфического стиля. Модель поддерживает как алфавитные языки (английский), так и иероглифические (китайский), умеет отображать длинные фразы, абзацы, рукописные надписи и сложную верстку.

Пример с китайским текстом:

Что умеет нейросеть Qwen-Image

На изображении — аниме-сцена в духе Миядзаки, оживлённая улица, персонаж с табличкой «阿里云», магазины с вывесками «云存储», «云计算», «云模型». Все надписи отчётливо видны, их глубина, свет и перспектива выдержаны идеально.

Пример с английским текстом:

Пример с английским текстом

В витрине книжного магазина — постер с фразой «New Arrivals This Week», рядом подписи к книгам и афиша мероприятия. Модель корректно передала даже мелкие надписи на обложках книг, включая заголовки: The Silent Patient, The Night Circus и др.

2. Точное редактирование изображений

Модель одинаково хорошо справляется с генерацией с нуля и редактированием. Qwen-Image позволяет:

  • добавлять или удалять объекты,
  • менять стили,
  • редактировать подписи,
  • изменять позы персонажей.

Все это возможно благодаря усовершенствованной мультитаск-обучающей парадигме, где текст и визуальный контекст обрабатываются синхронно.

3. Высокие результаты в тестах

Qwen-Image прошла проверку на ряде бенчмарков:

  • GenEval, DPG, OneIG-Bench — генерация изображений,
  • GEdit, ImgEdit, GSO — редактирование,
  • LongText-Bench, ChineseWord, TextCraft — работа с текстом.

На всех тестах модель показала state-of-the-art результат, особенно в рендеринге китайского текста — это редкость даже для топовых ИИ-систем.

Как пользоваться Qwen-Image и создавать картинки с надписями на русском языке

Модель доступна в чат-боте Qwen Chat — просто выберите «Image Generation» и введите запрос. О том как правильно это делать, мы писали в статье — промты для генерации изображений (обязательно изучите!).

Промт для генерации картинки

Со сложными композициями, где есть много надписей на русском языке пока справляется плохо:

С надписями на русском языке пока справляется плохо:

А вот картинки попроще всё же делать умеет:

Сложные сцены на китайском:

Сложные сцены на китайском

Модель нарисовала интерьер с висящими каллиграфическими свитками — включая правую, левую часть и горизонтальную надпись. Все символы читаемы, стилистика выдержана, даже центральное изображение башни 岳阳楼 — реалистично.

Инфографика на английском:

Инфографика на английском

Изображение в стиле инфографики с заголовком «Habits for Emotional Wellbeing» — включает 6 иконок, текстовые модули, декоративные рамки и чёткую структуру. Модель справляется не только с краткими подписями, но и с абзацами, сохраняет симметрию, пропорции и визуальный ритм.

Мелкий текст:

Мелкий текст

На изображении — мужчина у окна с бумажным листом в руке. Лист занимает менее 10% кадра, но на нём написано четверостишие — и Qwen-Image смогла точно сгенерировать рукописный текст со всем содержанием.

Билингва:

Билингва

На стекле за героиней надпись: «Meet Qwen-Image – a powerful image foundation model capable of complex text rendering and precise image editing. 欢迎了解Qwen-Image…». Модель легко переключается между языками и стилями в одном кадре.

Постер:

Постер

«Imagination Unleashed» — кинопостер в футуристичном стиле с центральным компьютером, из которого вырываются цвета, образы и динамика. Все текстовые элементы, включая титры и слоганы, оформлены как в настоящем плакате.

Презентации:

Презентации

Модель способна сгенерировать полноценную бизнес-презентацию. Пример — китайская слайд-страница с логотипом Alibaba, четырьмя иллюстрациями в едином стиле и текстовыми блоками «梅傲», «兰幽», «竹清», «菊淡». Всё — с фирменной графикой, цветами, шрифтами и чёткой композицией.

Qwen-Image адаптивна к разным запросам реализм и фотореализм, импрессионизм, аниме и гейм-дизайн, минимализм и инфографика. Это делает её универсальным инструментом для дизайнеров, художников, маркетологов, стартапов и креаторов.

Qwen-Image — это шаг к демократизации визуального творчества. Она снижает порог входа, упрощает производство контента и открывает возможности для инновационных форматов — от образования до маркетинга. И в отличие от многих моделей, она действительно умеет работать с текстом.

Ранее Gemini научилась генерировать комиксы и книжки с озвучкой.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

Комментарии: Вышла нейросеть Qwen-Image — как ей пользовать и создавать картинки с надписями
⚡ В тренде
Twitch — это не просто стримы и чат. Это возможность превратить своё увлечение играми в настоящую профессию. Представь: ты не просто играешь в любимые игры, а зарабатываешь на этом, строишь собственное комьюнити и становишься узнаваемым стримером. Звучит как мечта? На Twitch она вполне реальна. В этой статье расскажем, как быстро раскрутить канал, выйти на первую […]
Сайты с прокси – это сервисы, предоставляющие услуги прокси: использование специальных серверов, выступающих посредниками между пользователем и интернетом. Прокси-серверы позволяют сохранять анонимность в сети, увеличивают скорость доступа к некоторым ресурсам, повышают уровень защиты данных от возможных угроз. В этой статье мы разберем, какие прокси бывают и для чего используются. Рассмотрим 10 популярных сайтов с прокси. […]
История Pixar — это не просто рассказ о создании мультфильмов. Это история о том, как маленькая команда энтузиастов смогла изменить индустрию развлечений, ввести новые стандарты и доказать: даже самые амбициозные мечты достижимы. Успех Pixar — это синтез технологий, креатива и бизнес-рисков. Эта история может вдохновить не только тех, кто связан с кино или анимацией, но […]
Ищете промты для открыток ко Дню России? Нейросети могут сделать семейное поздравление по фото, портрет в праздничном образе, открытку для детей или вариант в советском стиле с достопримечательностями нужного города. В этой статье собрали готовые промты для разных форматов, а также покажем, как ими пользоваться и где лучше генерировать такие открытки. Читайте также: 25 нейросетей […]
Google добавила в Gemini Live создание и редактирование изображений во время разговора. Можно показать комнату через камеру и попросить Gemini изменить интерьер, разобрать задачу по математике или сделать мем. Функция работает в приложении Gemini через Live. Google не уточнила, у всех ли уже появился новый режим и есть ли ограничения по странам, устройствам или типам […]
Блоги компаний
Новости
Свежие статьи