Сбер представил нейросеть Kandinsky 3.0 — новейшую диффузионную модель для создания изображений по текстовым описаниям. Над продуктом работали в течении года, параллельно с работой по улучшению версий Kandinsky 2.1 и 2.2.

Команда Сбера провела исследования различных архитектур и обработала большое количество данных, чтобы повысить уровень понимания текста и качество генераций. Кроме того, новая модель ИИ теперь лучше разбирается в российском и советском культурном контексте (как и YandexArt).

Реклама. Erid 2VtzqvV8xTw. ООО «Клик.ру», ИНН 7743771327.
Реклама. Erid 2VtzqwZMkSy. ООО «Клик.ру», ИНН 7743771327.

Далее подробно рассказываем о том, как работает Kandinsky 3.0 и как им пользоваться.

Читайте также: Нейросети для создания картинок по описанию

Как создавать картинки в Kandinsky 3.0 по текстовому описанию

В Kandinsky 3.0 изображение создается прямо из кодированных токенов текста. Это упрощает процесс обучения, так как нужно тренировать только один компонент модели (Decoder). Это также повышает качество понимания текста, потому что предыдущая модель обучался на довольно простых текстах, которые сильно отличаются от естественного языка, в отличии от новой модели, которая обучается на большом объеме качественных текстовых данных.

Проще говоря, Kandinsky 3.0 умеет лучше анализировать тексты и создавать более реалистичные картинки. Плюс появилась генерация видео. Он также хорошо имитирует стили, направления и почерки известных художников, а также умело дополняет недостающие части изображения. Новая ИИ-модель была обучена на огромной базе данных, содержащей 1,5 млрд пар «текст — изображение» и позволяет генерировать картинки с разрешением до 1024х1024 пикселей при любом соотношении сторон.

Kandinsky 3.0, как и ранее, доступен на разных платформах — на сайте fusionbrain.ai, в Telegram и VK, в чат-боте GigaChat и в умных колонках SberBoom. Также нейросеть работает в приложении «СберБанк Онлайн». Там она создает заставки, которые вы видите при входе в личный кабинет.

Покажем работу новой нейросети через сайт fusionbrain.ai. Интерфейс тут не претерпел больших изменений. На панели инструментов слева заходим в «Редактор» и задаём параметры изображения. Сверху над окном генерации настраиваем соотношение сторон, а ниже пишем промт и выбираем стиль.

Далее несколько примеров наших промтов и что у нас получилось.

Промт: логотип кофейни символ, белый фон.

логотип кофейни

Промт: домик в деревне в стиле пикассо.

домик в деревне в стиле пикассо

Промт: картинка для поста в соцсети про правильное питание, орехи, мёд, ягоды.

картинка для поста в соцсети

Быстрый вывод, который можно сделать — картинки действительно стали выглядеть лучше, но с текстом нейросеть по-прежнему не справляется.

Ранее фоторедактор Picsart объявил о запуске нового пакета функций на базе искусственного интеллекта для творчества — Picsart Ignite.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Sber выкатил обновлённый Kandinsky 3.0
Блоги компаний
⚡ В тренде
Вы уверены, что используете все эффективные способы продвижения в Инстаграм*? Предлагаем свериться с нашей подборкой – тут больше 19 инструментов для раскрутки аккаунта. Мы расскажем, что изменилось в Инстаграм*-продвижении в 2025 году, как реагировать на эти изменения. Далее перечислим, какие способы раскрутки работают в 2025 году. Среди них встретятся как новые инструменты, так и старые, […]
ПМЭФ — это Петербургский международный экономический форум, одно из главных ежегодных событий для бизнеса, власти и экспертов в России. Форум проводят с 1997 года, а с 2005-го он проходит при участии президента РФ. Это место, где обсуждают экономику, заключают крупные сделки, запускают госинициативы и просто обмениваются контактами и влиянием. В этой статье расскажем, когда и […]
Нейросети перевернули мем-культуру с ног на голову. Если раньше, чтобы создать вирусный ролик, нужно было снимать, монтировать, писать сценарий и надеяться на алгоритмы TikTok, то теперь достаточно одного промта. Ты вводишь фразу вроде «бабушка с бегемотом в хрущёвке» — и нейросети за минуту создают всё: от картинки до голосовой озвучки. И чем более абсурден твой […]
Каналы ВКонтакте — это новый способ говорить с аудиторией напрямую. Посты из каналов приходят в мессенджер подписчиков, а авторы получают больше охвата, реакции и близости с читателями. VK объединяет в одном формате возможности Telegram, блогов и сообществ — но с собственными правилами. Разбираем, как устроены каналы, чем они отличаются от групп и пабликов, и как […]
Мобильные прокси маскируют реальный IP-адрес, подменяя его динамическими адресами операторов сотовой связи. Их ротация и привязка к реальным мобильным сетям обеспечивают высокий уровень анонимности и доверия со стороны сайтов, что позволяет обходить блокировки соцсетей, парсить данные, управлять множеством аккаунтов или заниматься арбитражем трафика. В статье расскажем, чем мобильные прокси отличаются от обычных, рассмотрим 10 популярных […]
Новости
Свежие статьи