Сбер представил нейросеть Kandinsky 3.0 — новейшую диффузионную модель для создания изображений по текстовым описаниям. Над продуктом работали в течении года, параллельно с работой по улучшению версий Kandinsky 2.1 и 2.2.

Команда Сбера провела исследования различных архитектур и обработала большое количество данных, чтобы повысить уровень понимания текста и качество генераций. Кроме того, новая модель ИИ теперь лучше разбирается в российском и советском культурном контексте (как и YandexArt).

Реклама: Реклама. Erid 2Vtzqv77mXw
Реклама. Erid 2VtzqvPTeXK

Далее подробно рассказываем о том, как работает Kandinsky 3.0 и как им пользоваться.

Читайте также: Нейросети для создания картинок по описанию

Как создавать картинки в Kandinsky 3.0 по текстовому описанию

В Kandinsky 3.0 изображение создается прямо из кодированных токенов текста. Это упрощает процесс обучения, так как нужно тренировать только один компонент модели (Decoder). Это также повышает качество понимания текста, потому что предыдущая модель обучался на довольно простых текстах, которые сильно отличаются от естественного языка, в отличии от новой модели, которая обучается на большом объеме качественных текстовых данных.

Проще говоря, Kandinsky 3.0 умеет лучше анализировать тексты и создавать более реалистичные картинки. Плюс появилась генерация видео. Он также хорошо имитирует стили, направления и почерки известных художников, а также умело дополняет недостающие части изображения. Новая ИИ-модель была обучена на огромной базе данных, содержащей 1,5 млрд пар «текст — изображение» и позволяет генерировать картинки с разрешением до 1024х1024 пикселей при любом соотношении сторон.

Kandinsky 3.0, как и ранее, доступен на разных платформах — на сайте fusionbrain.ai, в Telegram и VK, в чат-боте GigaChat и в умных колонках SberBoom. Также нейросеть работает в приложении «СберБанк Онлайн». Там она создает заставки, которые вы видите при входе в личный кабинет.

Покажем работу новой нейросети через сайт fusionbrain.ai. Интерфейс тут не претерпел больших изменений. На панели инструментов слева заходим в «Редактор» и задаём параметры изображения. Сверху над окном генерации настраиваем соотношение сторон, а ниже пишем промт и выбираем стиль.

Далее несколько примеров наших промтов и что у нас получилось.

Промт: логотип кофейни символ, белый фон.

логотип кофейни

Промт: домик в деревне в стиле пикассо.

домик в деревне в стиле пикассо

Промт: картинка для поста в соцсети про правильное питание, орехи, мёд, ягоды.

картинка для поста в соцсети

Быстрый вывод, который можно сделать — картинки действительно стали выглядеть лучше, но с текстом нейросеть по-прежнему не справляется.

Ранее фоторедактор Picsart объявил о запуске нового пакета функций на базе искусственного интеллекта для творчества — Picsart Ignite.

Читайте нас в Телеграм
Читайте нас в Телеграм
Комментарии: Sber выкатил обновлённый Kandinsky 3.0
Компании
В тренде
Обратная связь от клиентов — важная составляющая бизнеса. Положительные отзывы помогают удержать старых и привлечь новых клиентов, а также повысить узнаваемость бренда. Негативные (или отзывы с предложениями) помогают улучшить сервис и дают понять клиентам, что вам не безразлично их мнение. Больше половины покупателей принимают окончательное решение о покупке после прочтения отзывов о товаре, услуге или […]
Telegram недавно представил функцию «Похожие каналы», которая рекомендует пользователю каналы для подписки. Теперь, когда человек подписывается на ТГ-канал, у него открывается список похожих публичных каналов, которые подбираются автоматически по пересечению аудиторий. Соответственно, чтобы попасть в рекомендации, необходимо пересечение аудиторий с другим каналом. Читайте также: Как поднять уровень канала в Телеграм Где найти и как посмотреть […]
Совершая покупку, человек приобретает не товар или услугу, а решение проблемы. Клиент покупает продукт ради пользы или выгоды, которые получит в результате. Задача прогревов – «надавить» на боли клиентов. Акцентировать внимание на проблемах аудитории и показать, как ваш продукт с ними справится. В этой статье расскажем, как прогревать аудиторию перед продажей онлайн-курсов. Рассмотрим рабочие схемы […]
Уровень канала в Телеграм — это своего рода рейтинг или карма канала, которая даёт доступ к дополнительным функциям. Одной из таких функций являются истории от имени каналов, благодаря которым можно значительно повысить видимость канала для подписчиков. Но есть и другие фичи. В статье рассказываем, как повысить уровень Телеграм-канала — разыграть премиум-подписки, купить/накрутить бусты, мотивировать подписчиков […]
После блокировки ряда зарубежных ресурсов возрос интерес к ВКонтакте, аудитория которого летом текущего года превысила отметку в 100 млн. человек. При помощи групп ВК можно продвигать бренд, продавать товары и услуги, получать доход от рекламы. Чем больше подписчиков, тем более эффективно сообщество будет решать поставленные задачи. В данной статье мы рассмотрим наиболее эффективные способы, позволяющие […]
Новости
Статьи