Сбер представил нейросеть Kandinsky 3.0 — новейшую диффузионную модель для создания изображений по текстовым описаниям. Над продуктом работали в течении года, параллельно с работой по улучшению версий Kandinsky 2.1 и 2.2.

Команда Сбера провела исследования различных архитектур и обработала большое количество данных, чтобы повысить уровень понимания текста и качество генераций. Кроме того, новая модель ИИ теперь лучше разбирается в российском и советском культурном контексте (как и YandexArt).

Реклама. Erid 2VtzqwDqfo2. ООО «Клик.ру», ИНН 7743771327.
Реклама. Erid 2VtzqvviSiY. ООО «Клик.ру», ИНН 7743771327.

Далее подробно рассказываем о том, как работает Kandinsky 3.0 и как им пользоваться.

Читайте также: Нейросети для создания картинок по описанию

Как создавать картинки в Kandinsky 3.0 по текстовому описанию

В Kandinsky 3.0 изображение создается прямо из кодированных токенов текста. Это упрощает процесс обучения, так как нужно тренировать только один компонент модели (Decoder). Это также повышает качество понимания текста, потому что предыдущая модель обучался на довольно простых текстах, которые сильно отличаются от естественного языка, в отличии от новой модели, которая обучается на большом объеме качественных текстовых данных.

Проще говоря, Kandinsky 3.0 умеет лучше анализировать тексты и создавать более реалистичные картинки. Плюс появилась генерация видео. Он также хорошо имитирует стили, направления и почерки известных художников, а также умело дополняет недостающие части изображения. Новая ИИ-модель была обучена на огромной базе данных, содержащей 1,5 млрд пар «текст — изображение» и позволяет генерировать картинки с разрешением до 1024х1024 пикселей при любом соотношении сторон.

Kandinsky 3.0, как и ранее, доступен на разных платформах — на сайте fusionbrain.ai, в Telegram и VK, в чат-боте GigaChat и в умных колонках SberBoom. Также нейросеть работает в приложении «СберБанк Онлайн». Там она создает заставки, которые вы видите при входе в личный кабинет.

Покажем работу новой нейросети через сайт fusionbrain.ai. Интерфейс тут не претерпел больших изменений. На панели инструментов слева заходим в «Редактор» и задаём параметры изображения. Сверху над окном генерации настраиваем соотношение сторон, а ниже пишем промт и выбираем стиль.

Далее несколько примеров наших промтов и что у нас получилось.

Промт: логотип кофейни символ, белый фон.

логотип кофейни

Промт: домик в деревне в стиле пикассо.

домик в деревне в стиле пикассо

Промт: картинка для поста в соцсети про правильное питание, орехи, мёд, ягоды.

картинка для поста в соцсети

Быстрый вывод, который можно сделать — картинки действительно стали выглядеть лучше, но с текстом нейросеть по-прежнему не справляется.

Ранее фоторедактор Picsart объявил о запуске нового пакета функций на базе искусственного интеллекта для творчества — Picsart Ignite.

Реклама. Erid 2VtzqxepSUW. ООО «Клик.ру», ИНН 7743771327.
Реклама. Erid 2Vtzqw1vtxW. ООО «Клик.ру», ИНН 7743771327.
Комментарии: Sber выкатил обновлённый Kandinsky 3.0
Блоги компаний
⚡ В тренде
Сериал «The Last of Us» от HBO вызвал настоящий культурный фурор, покорив сердца зрителей и критиков. Созданный по мотивам культовой игры от Naughty Dog, он мастерски передаёт атмосферу постапокалиптического мира и сложность человеческих отношений. Первый сезон сериала завоевал не только широкую аудиторию, но и признание в виде множества наград, в том числе «Эмми». Поклонники с […]
Блогерство в наши дни – это не только креатив и любимое дело, но и юридическая ответственность. Блогер может совершить противозаконное действие по незнанию, и за этим последует наказание. Мы собрали в одном гайде все новые и уже действующие законы, регламентирующие деятельность блогеров в России. Изучите этот гайд и при необходимости возвращайтесь к нему, и тогда […]
Китайский рынок искусственного интеллекта пополнился новым мощным игроком – Kimi k1.5, бесплатной нейросетью от Moonshot AI. Разработчики позиционируют её как продвинутую альтернативу ChatGPT, которая способна решать широкий спектр задач без ограничений и подписок. Благодаря мультимодальности и поиску в реальном времени, модель может стать одним из ключевых игроков в гонке ИИ. Читайте также: 6 лучших чат-ботов […]
Перед публикацией статьи на сайте или ролика на YouTube крайне важно убедиться в достоверности информации. Этот процесс называется фактчекингом. В эпоху, когда «фейк-ньюс» и информационные вбросы стали обыденностью, а основными источниками данных всё чаще становятся интернет, нейросети и чат-боты на базе ИИ, проверка фактов приобретает особую значимость. Но обязательно ли обращаться к библиотекам или изучать […]
Автономные ИИ-ассистенты уже не фантастика, а реальность. В марте 2025 года никому неизвестный китайский стартап Butterfly Effect внезапно ворвался в мир искусственного интеллекта, представив Manus AI — умного агента, способного самостоятельно выполнять сложные задачи без постоянного вмешательства человека. В отличие от обычных чат-ботов, Manus — это не просто «говорящая голова», а полноценная мультиагентная система, которая […]
Новости
Свежие статьи