Google Labs представила сервис Whisk, который позволяет создавать изображения на основе загруженных референсов. Работает на базе Gemini.

Новый сервис не требует составления текстовых промптов: вместо этого пользователь выбирает три изображения — объект, сцена и стиль. Тестирование Whisk уже началось в США.

Реклама. Erid 2VtzqvV8xTw. ООО «Клик.ру», ИНН 7743771327.
Реклама. Erid 2VtzqwZMkSy. ООО «Клик.ру», ИНН 7743771327.

Читайте также: 5 бесплатных нейросетей для генерации картинок

Как пользоваться сервисом Whisk от Google

Whisk позиционируется как инструмент для быстрой визуализации идей. Он позволяет «смешивать» разные элементы изображений и получать уникальные картинки без подробного текстового запроса. Вот как это работает:

Загрузка референсов. Пользователь загружает три изображения:

  • Объект — то, что должно быть в центре картинки.
  • Сцена — фон или окружающая обстановка.
  • Стиль — художественный стиль или настроение.

Автоматическая генерация. Сервис на базе ИИ-модели Gemini описывает загруженные изображения текстовыми промптами и передаёт их генеративной модели Imagen 3. После этого ИИ создаёт итоговое изображение.

Редактирование результата. Если итоговый результат не соответствует вашим ожиданиям, можно просмотреть и отредактировать созданные промпты, чтобы уточнить детали.

Например, можно взять фотографию плюшевого медведя, сцену тропического леса и стиль акварели — и получить картинку медведя в экзотическом окружении.

Ключевые особенности Whisk:

  • Простота использования — сервис работает по принципу «перетащи и сгенерируй».
  • Гибкость — пользователи могут комбинировать элементы из разных изображений.
  • Правки — если результат не идеален, текстовые промпты можно подправить вручную.

Google предупреждает, что сгенерированные изображения могут быть далеки от референсов. Например, предмет может получить другую форму, цвет или текстуру. Однако это компенсируется возможностью редактирования.

На данный момент Whisk доступен только в США через Google Labs. Компания рассчитывает получить обратную связь от пользователей и доработать инструмент. Релиз за пределами США пока не планируется.

Ранее Google представила нейросеть для генерации видео — Veo.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Google тестирует сервис Whisk для генерации изображений по трём референсам
Блоги компаний
⚡ В тренде
Apple проведёт свою ежегодную конференцию разработчиков WWDC 2025 уже в понедельник, 9 июня, в 20:00 по Москве. Ожидается, что Apple представит iOS 26, это будет самый масштабный редизайн за последние 10 лет — с эффектами «жидкого стекла», AI-функциями и полной визуальной перезагрузкой всех платформ. Прямая трансляция стартует на сайте Apple, в приложении Apple Developer и […]
Вы замечали, что в ленте — TikTok, YouTube или Reels — всё чаще попадаются видео со странными существами, дурацкими надписями и с именами вроде Бомбарди́ро Крокоди́ло или Тунг Тунг Саху́р? Они танцуют, визжат, кричат фразы на непонятном языке и ведут себя так, будто сами не понимают, что делают. Всё это — не просто странный юмор, […]
ИИ уже давно стал частью нашей жизни — он помогает решать задачи, создавать тексты и работать быстрее. OpenAI постоянно выпускает новые версии ChatGPT — от GPT-3 до мощных reasoning-моделей серии o3-pro. Чтобы эффективно пользоваться ИИ, важно понимать различия между моделями и выбирать подходящую под задачу — будь то быстрый ответ, творчество, глубокий анализ или работа […]
Вы просите нейросеть: «Напиши текст про искусственный интеллект для блога». Она пишет. Всё правильно, вроде бы даже информативно. Но… скучно. Не тот стиль, не та подача, не тот фокус. Вы начинаете уточнять: «Пиши как человек», «ироничнее», «как в Telegram», «а сделай с заголовками», «а теперь разбей на абзацы». Каждое уточнение — это попытка вручную направить […]
Китайская компания 4DV AI представила новую технологию 4D Gaussian Splatting, которая меняет представление о видео. Теперь обычный 2D-ролик можно превратить в интерактивную 4D-сцену: пользователь сможет вращать камеру, приближать объекты и менять ракурс — прямо во время воспроизведения. Всё это дополняется синхронизированным пространственным звуком, создающим эффект полного присутствия. Читайте также: 10 лучших курсов по работе с […]
Новости
Свежие статьи