Сбер представил нейросеть Kandinsky 3.0 — новейшую диффузионную модель для создания изображений по текстовым описаниям. Над продуктом работали в течении года, параллельно с работой по улучшению версий Kandinsky 2.1 и 2.2.

Команда Сбера провела исследования различных архитектур и обработала большое количество данных, чтобы повысить уровень понимания текста и качество генераций. Кроме того, новая модель ИИ теперь лучше разбирается в российском и советском культурном контексте (как и YandexArt).

Реклама. Erid 2VtzqwMXQT6. ООО «Клик.ру», ИНН 7743771327. Промопульт
Реклама. Erid 2Vtzqx3YjaU. ООО «Клик.ру», ИНН 7743771327. Промопульт

Далее подробно рассказываем о том, как работает Kandinsky 3.0 и как им пользоваться.

Читайте также: Нейросети для создания картинок по описанию

Как создавать картинки в Kandinsky 3.0 по текстовому описанию

В Kandinsky 3.0 изображение создается прямо из кодированных токенов текста. Это упрощает процесс обучения, так как нужно тренировать только один компонент модели (Decoder). Это также повышает качество понимания текста, потому что предыдущая модель обучался на довольно простых текстах, которые сильно отличаются от естественного языка, в отличии от новой модели, которая обучается на большом объеме качественных текстовых данных.

Проще говоря, Kandinsky 3.0 умеет лучше анализировать тексты и создавать более реалистичные картинки. Плюс появилась генерация видео. Он также хорошо имитирует стили, направления и почерки известных художников, а также умело дополняет недостающие части изображения. Новая ИИ-модель была обучена на огромной базе данных, содержащей 1,5 млрд пар «текст — изображение» и позволяет генерировать картинки с разрешением до 1024х1024 пикселей при любом соотношении сторон.

Kandinsky 3.0, как и ранее, доступен на разных платформах — на сайте fusionbrain.ai, в Telegram и VK, в чат-боте GigaChat и в умных колонках SberBoom. Также нейросеть работает в приложении «СберБанк Онлайн». Там она создает заставки, которые вы видите при входе в личный кабинет.

Покажем работу новой нейросети через сайт fusionbrain.ai. Интерфейс тут не претерпел больших изменений. На панели инструментов слева заходим в «Редактор» и задаём параметры изображения. Сверху над окном генерации настраиваем соотношение сторон, а ниже пишем промт и выбираем стиль.

Далее несколько примеров наших промтов и что у нас получилось.

Промт: логотип кофейни символ, белый фон.

логотип кофейни

Промт: домик в деревне в стиле пикассо.

домик в деревне в стиле пикассо

Промт: картинка для поста в соцсети про правильное питание, орехи, мёд, ягоды.

картинка для поста в соцсети

Быстрый вывод, который можно сделать — картинки действительно стали выглядеть лучше, но с текстом нейросеть по-прежнему не справляется.

Ранее фоторедактор Picsart объявил о запуске нового пакета функций на базе искусственного интеллекта для творчества — Picsart Ignite.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Sber выкатил обновлённый Kandinsky 3.0
⚡ В тренде
За последние годы в российском сегменте интернета изменился доступ к ряду зарубежных онлайн-сервисов. Некоторые платформы работают с ограничениями, часть сайтов и приложений заблокирована в России, а отдельные компании добровольно покинули рынок. Ниже — актуальный список изменений и блокировок, материал будет обновляться. Читайте также: Аналоги Телеграм и WhatsApp для звонков Что заблокировано в России? Полная блокировка […]
Rostic’s запустил совместную акцию со «Смешариками». В детском комбо появятся коллекционные игрушки по мотивам мультсериала — с персонажами вроде Кроша, Нюши, Ёжика, Бараша, Лосяша, Совуньи и Пина. Акция начнёт действовать 2 декабря. Комбо будет продаваться по фиксированной цене 299 ₽ в ресторанах сети. При доставке набор будет стоить 409 ₽. Запуск охватывает всю сеть по […]
Когда мы говорим о стилях в нейросетях, в голове обычно всплывают Pixar, студия Ghibli, киберпанк и всё в этом духе. Но в реальной фотографии существует не меньше узнаваемых визуальных кодов, которые позволяют делать атмосферные нейрофотосессии в Nano Banana Pro. Я собрал 10 самых узнаваемых фотостилей, которые легко переносить в генерацию. Для каждого — сделал рабочие […]
RuTube — крупная видеоплатформа с обзорным, новостным, развлекательным и экспертным контентом. И нередко ролик нужно не просто посмотреть, а сохранить: чтобы разобрать материал офлайн, использовать фрагменты в монтаже, показать коллегам или пересмотреть позже без интернета. В этом гайде — простая пошаговая инструкция, как скачать видео из RuTube на телефон и компьютер, какие способы работают стабильно […]
Если вам нужно быстро получить красивые фото товара — для соцсетей, маркетплейсов, сайта или презентации — теперь необязательно организовывать студийную съёмку, арендовать оборудование или искать фотографа. Нейросети легко закрывают эти задачи. Мы собрали лучшие инструменты и готовые промты, которые позволяют за несколько минут получать полноценные фото товаров — реалистичные, стилизованные или рекламные. Далее разбираем, чем […]
Блоги компаний
Новости
Свежие статьи