«Сбер» обновил модель Kandinsky Image, добавив поддержку генерации надписей на русском языке. Теперь нейросеть может вписывать кириллический текст непосредственно в изображение — на вывесках, этикетках, одежде или предметах. Раньше модель корректно обрабатывала только английские слова.

По данным компании, Kandinsky дообучили на 10 млн изображений с русским текстом в разных форматах — печатном, рукописном, вышитом, гравированном и других. Это позволило улучшить распознавание форм букв и адаптировать их к различным текстурам и ракурсам.

Реклама. Erid 2VtzqwMXQT6. ООО «Клик.ру», ИНН 7743771327. Промопульт
Реклама. Erid 2Vtzqx3YjaU. ООО «Клик.ру», ИНН 7743771327. Промопульт

Функция уже доступна в Telegram-ботах Kandinsky и GigaChat, а также в веб-версии GigaChat, релиз на сайте Kandinsky.ai ожидается в ближайшее время.

Теперь пользователи могут создавать изображения с подписями вроде «Москва ночью», «С днём рождения!» или «Кофейня на углу» прямо в генерации, без последующего редактирования в графических редакторах. Лучше всего модель работает с короткими словами и простыми фразами. «Сбер» отмечает, что Kandinsky способна учитывать материал букв — например, «металлические», «неоновые» или «вышитые» — и естественно интегрировать текст в окружение.

Тестируем. Вот результат генерации по запросу: [нарисуй кофейню с вывеской «Кофе с тобой»]

Кофе с тобой

Комиксный стиль. Проверяем отрисовку комикса со словами. Запрос: [Комикс в современном стиле.Офисный работник сидит за ноутбуком, удивлённо смотрит на экран.Над его головой белое облачко речи с фразой:«О, ГигаЧат научился писать на русском!»].

Комиксный стиль

Обложка журнала. Проверяем размер текста и позиционирование на креативе. Запрос [Стильная девушка на глянцевой обложке журнала. Заголовок сверху большими буквами: «МОДА». Дополнительный текст мелко: «Тренды 2025»].

Обложка журнала

Текст прописью. Проверяем, как справляется с длинным рукописным текстом. Запрос: [учитель пишет на доске текст белым мелом прописью: «Сегодня мы будем изучать русский язык и его особенности.»]

Текст прописью

Твёрдый знак. Смотрим, сможет ли нейронка сгенерить надписи, где есть «Ъ». Запрос: [Витрина старинной булочной, на деревянной или стеклянной вывеске дореволюционным шрифтом написаны три слова: «ХЛЕБЪ», «СЫРЪ», «ПИРОГЪ»].

Надписи с твёрдым знаком

Материал букв. Проверяем как рисует буквы из указанного материала. Запрос: [слово «СТАЛЬ» объёмными буквами из настоящей стали на тёмном фоне].

Материал букв

В целом результат можно оценить на «пять с минусом». Нейронка уверенно справляется с печатными кириллическими шрифтами, особенно на коротких словах («ХЛЕБ», «СТАЛЬ»). Материалы — сталь, дерево, неон — выглядят убедительно и выразительно, визуал в целом читаемый.

Но проблемы остаются: прописной (рукописный) текст заменяет печатным, твёрдый знак «Ъ» не улавливает или заменяет на «Ь». В длинных фразах появляются ошибки и искажения. Тестировали в веб-версии GigaChat.

Kandinsky — собственная генеративная модель «Сбера», созданная на архитектуре diffusion и обученная на российских датасетах. В мае 2024 года вышла версия Kandinsky 3.1, которая повысила качество композиции и детализацию.

Осенью в GigaChat появилась возможность генерировать видеофрагменты и 3D-сцены. Новый апдейт с поддержкой кириллицы продолжает курс компании на локализацию и развитие отечественных AI-инструментов.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: «Сбер» научил Kandinsky Image делать надписи на русском языке 
  • 8 октября, 2025

    Интересное направление. Если действительно удастся сделать удобное взаимодействие с внешними сервисами прямо в чате — будет полезно.

Ответить
⚡ В тренде
В соцсетях резко выросло число роликов и картинок, где обычные города превращены в мягкие мини-макеты из пряжи. Дома выглядят как игрушечные, деревья — как пушистые комочки, дороги — как аккуратно вышитые полосы. Всё это напоминает диораму, которую долго и терпеливо собирали вручную. Но на самом деле такие сцены делают нейросети — достаточно одного удачного промта. […]
«Сбер» выпустил iOS-приложение чат-бота GigaChat. Оно доступно в App Store под названием G8AI, сообщили в пресс-службе компании. В приложении уже работают голосовой режим (два голоса — мужской и женский), генерация изображений и музыки, а также функция «Глубокое исследование», которая анализирует данные из нескольких источников. Читайте также: Как установить приложение ChatGPT на Айфон Что умеет iOS-версия […]
OpenAI представила новую версию своей модели — GPT-5.1, доступную в двух режимах работы: Instant и Thinking. Обновление делает ChatGPT не только умнее, но и более человечным: теперь можно выбрать стиль общения — от строгого и делового до дружелюбного или даже слегка «чудаковатого». Подробности в материале Postium. Читайте также: 10 лучших курсов по работе с ChatGPT […]
Чат-бот Grok от компании xAI теперь умеет создавать короткие видео по текстовым подсказкам. Функция работает через инструмент Imagine: пользователю достаточно описать сцену, а нейросеть сама сгенерирует ролик с движением, звуком и озвучкой. Ранее Grok Imagine умел превращать в видео только изображения — можно было «оживить» фото, добавив движение или эмоцию. Postium показывает, как работает обновление. […]
Первый сезон «Fallout» стал для Prime Video редким случаем, когда экранизация игры не просто «сработала», а задала планку. Постапокалиптика с фирменным чёрным юмором, узнаваемые детали вселенной, три равноправные линии героев — и ни грамма боязни выглядеть странно. Финал аккуратно подвёл нас к расширению карты: из компактных, но разрушенных районов пустоши — в легендарный Нью-Вегас. В […]
Блоги компаний
Новости
Свежие статьи