Сбер представил нейросеть Kandinsky 3.0 — новейшую диффузионную модель для создания изображений по текстовым описаниям. Над продуктом работали в течении года, параллельно с работой по улучшению версий Kandinsky 2.1 и 2.2.

Команда Сбера провела исследования различных архитектур и обработала большое количество данных, чтобы повысить уровень понимания текста и качество генераций. Кроме того, новая модель ИИ теперь лучше разбирается в российском и советском культурном контексте (как и YandexArt).

Реклама. Erid 2VtzqwKjQ5T. ООО «Колтач Солюшнс»
Реклама. Erid 2Vtzqvx8CGM. ООО «Колтач Солюшнс» ИНН 7703388936

Далее подробно рассказываем о том, как работает Kandinsky 3.0 и как им пользоваться.

Читайте также: Нейросети для создания картинок по описанию

Как создавать картинки в Kandinsky 3.0 по текстовому описанию

В Kandinsky 3.0 изображение создается прямо из кодированных токенов текста. Это упрощает процесс обучения, так как нужно тренировать только один компонент модели (Decoder). Это также повышает качество понимания текста, потому что предыдущая модель обучался на довольно простых текстах, которые сильно отличаются от естественного языка, в отличии от новой модели, которая обучается на большом объеме качественных текстовых данных.

Проще говоря, Kandinsky 3.0 умеет лучше анализировать тексты и создавать более реалистичные картинки. Плюс появилась генерация видео. Он также хорошо имитирует стили, направления и почерки известных художников, а также умело дополняет недостающие части изображения. Новая ИИ-модель была обучена на огромной базе данных, содержащей 1,5 млрд пар «текст — изображение» и позволяет генерировать картинки с разрешением до 1024х1024 пикселей при любом соотношении сторон.

Kandinsky 3.0, как и ранее, доступен на разных платформах — на сайте fusionbrain.ai, в Telegram и VK, в чат-боте GigaChat и в умных колонках SberBoom. Также нейросеть работает в приложении «СберБанк Онлайн». Там она создает заставки, которые вы видите при входе в личный кабинет.

Покажем работу новой нейросети через сайт fusionbrain.ai. Интерфейс тут не претерпел больших изменений. На панели инструментов слева заходим в «Редактор» и задаём параметры изображения. Сверху над окном генерации настраиваем соотношение сторон, а ниже пишем промт и выбираем стиль.

Далее несколько примеров наших промтов и что у нас получилось.

Промт: логотип кофейни символ, белый фон.

логотип кофейни

Промт: домик в деревне в стиле пикассо.

домик в деревне в стиле пикассо

Промт: картинка для поста в соцсети про правильное питание, орехи, мёд, ягоды.

картинка для поста в соцсети

Быстрый вывод, который можно сделать — картинки действительно стали выглядеть лучше, но с текстом нейросеть по-прежнему не справляется.

Ранее фоторедактор Picsart объявил о запуске нового пакета функций на базе искусственного интеллекта для творчества — Picsart Ignite.

Читайте нас в Телеграм
Читайте нас в Телеграм
Комментарии: Sber выкатил обновлённый Kandinsky 3.0
Блоги компаний
⚡ В тренде
Сначала трендом были мемы со скуфами, теперь в сети завирусилось новое слово – анк. Мы расскажем, что оно значит, и приведем примеры. Анк – новый тренд в среде зумеров, людей, которые родились в нулевых. Из этой статьи вы узнаете, как появился тренд и в чем разница между скуфом и анком, обидно ли быть анком. Также […]
За последние годы Instagram* потерял часть российской аудитории. Это связано с его блокировкой в России. Но знаменитости продолжают развивать аккаунты и зарабатывать на них. Среди российских звезд Instagram* найдутся и спортсмены, и певцы, и модели. Посмотрим, у кого больше всего подписчиков. Чем популярнее знаменитость, тем выше ее доход. Чем больше людей подписано на аккаунт – […]
Запустить интернет-магазин ВКонтакте достаточно легко, потому что площадка старается сделать жизнь бизнесменов более удобной и привлечь как можно больше предпринимателей. Для начала работы достаточно создать сообщество, оформить его, сделать карточки товаров и запустить продвижение. На настройку всех параметров обычно уходит не больше недели. Чтобы заниматься продажей товаров, не нужно платить площадке. Даже запускать рекламу не […]
Apple WWDC 2024 пройдет сегодня вечером в 20:00 по московскому времени, пишет Postium. На мероприятии ожидается представление новых операционных систем, включая iOS 18, iPadOS 18, macOS 15, watchOS 11, tvOS 18 и visionOS 2. Также не исключены внезапные анонсы новых компьютеров Mac и других гаджетов. Если вы не входите в число немногих счастливчиков, которые отправятся […]
Запуск рекламной кампании в Яндекс Директе сам по себе не решит задачи бизнеса. Чтобы продвижение принесло пользу, нужно не ошибиться в настройках и правильно нацелиться на аудиторию. Только в этом случае кампании не потратят лишних денег и принесут заявки. В материале разберем 5 распространенных проблем, которые встречаются при запуске контекстной кампании. 1. Оставлять все плейсменты […]
Новости
Свежие статьи