Сбер представил нейросеть Kandinsky 3.0 — новейшую диффузионную модель для создания изображений по текстовым описаниям. Над продуктом работали в течении года, параллельно с работой по улучшению версий Kandinsky 2.1 и 2.2.

Команда Сбера провела исследования различных архитектур и обработала большое количество данных, чтобы повысить уровень понимания текста и качество генераций. Кроме того, новая модель ИИ теперь лучше разбирается в российском и советском культурном контексте (как и YandexArt).

Реклама. Erid 2VtzqwDpmy7. ООО «Колтач Солюшнс»
Реклама. Erid 2VtzqvmoHid. ООО «Колтач Солюшнс» ИНН 7703388936

Далее подробно рассказываем о том, как работает Kandinsky 3.0 и как им пользоваться.

Читайте также: Нейросети для создания картинок по описанию

Как создавать картинки в Kandinsky 3.0 по текстовому описанию

В Kandinsky 3.0 изображение создается прямо из кодированных токенов текста. Это упрощает процесс обучения, так как нужно тренировать только один компонент модели (Decoder). Это также повышает качество понимания текста, потому что предыдущая модель обучался на довольно простых текстах, которые сильно отличаются от естественного языка, в отличии от новой модели, которая обучается на большом объеме качественных текстовых данных.

Проще говоря, Kandinsky 3.0 умеет лучше анализировать тексты и создавать более реалистичные картинки. Плюс появилась генерация видео. Он также хорошо имитирует стили, направления и почерки известных художников, а также умело дополняет недостающие части изображения. Новая ИИ-модель была обучена на огромной базе данных, содержащей 1,5 млрд пар «текст — изображение» и позволяет генерировать картинки с разрешением до 1024х1024 пикселей при любом соотношении сторон.

Kandinsky 3.0, как и ранее, доступен на разных платформах — на сайте fusionbrain.ai, в Telegram и VK, в чат-боте GigaChat и в умных колонках SberBoom. Также нейросеть работает в приложении «СберБанк Онлайн». Там она создает заставки, которые вы видите при входе в личный кабинет.

Покажем работу новой нейросети через сайт fusionbrain.ai. Интерфейс тут не претерпел больших изменений. На панели инструментов слева заходим в «Редактор» и задаём параметры изображения. Сверху над окном генерации настраиваем соотношение сторон, а ниже пишем промт и выбираем стиль.

Далее несколько примеров наших промтов и что у нас получилось.

Промт: логотип кофейни символ, белый фон.

логотип кофейни

Промт: домик в деревне в стиле пикассо.

домик в деревне в стиле пикассо

Промт: картинка для поста в соцсети про правильное питание, орехи, мёд, ягоды.

картинка для поста в соцсети

Быстрый вывод, который можно сделать — картинки действительно стали выглядеть лучше, но с текстом нейросеть по-прежнему не справляется.

Ранее фоторедактор Picsart объявил о запуске нового пакета функций на базе искусственного интеллекта для творчества — Picsart Ignite.

⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/.

+Плюс эксклюзивы, которых нет на сайте.

⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/. +Плюс эксклюзивы, которых нет на сайте.

Комментарии: Sber выкатил обновлённый Kandinsky 3.0
Блоги компаний
⚡ В тренде
Подписка Яндекс Плюс – это единая подписка на экосистему Яндекса, включающая доступ к музыке и книгам, просмотру фильмов, сериалов и спортивных событий на Кинопоиске, скидки на покупки и кэшбэк в других сервисах. В статье подробно рассмотрим, что входит в подписку Яндекс Плюс в 2025 году, и разберемся, как ее активировать и какие дополнительные опции можно […]
Spotify официально выпустил Wrapped 2024 — персонализированные музыкальные итоги года, которые уже стали традицией для пользователей стримингов. В этом году разработчики добавили больше интерактивных возможностей и уникальных данных, чтобы каждый мог по-новому взглянуть на свой музыкальный год. Всё показываем и рассказываем далее. Читайте также: 5 лучших приложений для прослушивания подкастов Что нового в Spotify Wrapped […]
Сегодня Telegram выпустил очередное большое обновление — разработчики мини-приложений смогут запустить партнёрскую программу, а владельцы каналов и блогеры зарабатывать звёзды за привлечённую аудиторию. Кроме того, искусственный интеллект в мессенджере поможет искать стикеры, а пользователи могут делать коллажи из фото и видео для своих историй. Больше деталей в этом материале. Читайте также: Как привлечь рефералов в […]
Матрица Эйзенхауэра – это инструмент тайм-менеджмента, который помогает правильно расставлять приоритеты путем сортировки задач по важности и срочности. Подходит для всех, кто хочет научиться планировать дела и эффективно управлять своим временем. В статье рассмотрим, что из себя представляет матрица Эйзенхауэра и разберем на примерах, как ею пользоваться. Читайте также: 10 лучших курсов по SMM для […]
Музыкальный стриминг Apple Music опубликовал ежегодный музыкальный отчёт Replay 2024, который теперь доступен прямо в приложении на устройствах с iOS 18.1 и выше. В этом году Replay получил интересные обновления: пользователи могут узнать, сколько дней подряд они слушали Apple Music, или попасть в топ-500 и топ-1000 слушателей по жанрам или артистам. Для доступа к Replay […]
Новости
Свежие статьи