Google выпустила Gemini Embedding 2 — новую модель на базе архитектуры Gemini. Это не генеративная нейросеть и не чат-бот. Её задача — переводить данные разных типов в числовые представления, чтобы системы могли находить и сопоставлять информацию по смыслу.

Модель работает с текстом, изображениями, видео, аудио и документами. Она переводит весь этот контент в единое embedding-пространство — набор числовых векторов, где близость объектов означает сходство их смысла.

Реклама. Erid 2VtzqwMXQT6. ООО «Клик.ру», ИНН 7743771327. Промопульт
Реклама. Erid 2Vtzqx3YjaU. ООО «Клик.ру», ИНН 7743771327.

Gemini Embedding 2 уже доступна в формате Public Preview через Gemini API и Vertex AI. Подробности — в материале Postium.

Читайте также: Как пользоваться нейросетью Gemini AI

Gemini Embedding 2 — что умеет и как работает

Embedding-модели используют для семантического поиска и анализа данных. Они не генерируют ответы, а преобразуют информацию в числовые векторы. Эти векторы можно сравнивать: если данные близки по смыслу, их embeddings располагаются рядом.

Gemini Embedding 2 делает это сразу для нескольких типов контента. Текст, изображения, аудио, видео и PDF-документы переводятся в единое пространство смыслов.

Gemini Embedding 2 — что умеет и как работает

Это позволяет напрямую сопоставлять разные форматы. Например, искать изображения по текстовому запросу или находить фрагмент видео по его описанию.

Модель поддерживает более 100 языков и может принимать смешанные входные данные. В одном запросе можно передать несколько типов контента — например текст вместе с изображением.

Технические ограничения модели:

  • текст — до 8192 входных токенов
  • изображения — до 6 файлов PNG или JPEG в одном запросе
  • видео — до 120 секунд в формате MP4 или MOV
  • аудио — принимается напрямую, без обязательной транскрибации
  • документы — PDF до 6 страниц

Модель использует технику Matryoshka Representation Learning. Она позволяет уменьшать размер embedding-вектора без полного пересчёта представления. Базовый размер — 3072 измерения, но его можно уменьшать. Google рекомендует использовать 3072, 1536 или 768 измерений в зависимости от требований к качеству и объёму хранения.

Как пользоваться

Gemini Embedding 2 доступна через модель gemini-embedding-2-preview в Gemini API и Vertex AI.

Разработчик отправляет в API данные — например текст, изображение или аудио. Модель возвращает embedding-вектор. Эти векторы обычно сохраняют в векторных базах данных и используют для поиска, кластеризации или систем Retrieval-Augmented Generation (RAG).

Модель уже поддерживается рядом инструментов для AI-разработки, включая LangChain, LlamaIndex, Haystack, Weaviate, Qdrant, ChromaDB и Vector Search.

Почему это важно? Во многих системах данные хранятся в разных форматах — текст, изображения, видео или аудио. Для их обработки часто используют разные модели и сложные пайплайны: изображения индексируются отдельно, аудио сначала переводится в текст, а затем анализируется.

Gemini Embedding 2 объединяет эти задачи в одной модели. Она может индексировать и сопоставлять данные разных типов напрямую, что упрощает архитектуру систем поиска и анализа.

Компания Sparkonomy использует модель для индексации видеоконтента и заявляет о снижении задержки до 70% за счёт отказа от отдельных этапов обработки.

Embedding-модели применяют в семантическом поиске, рекомендациях, анализе данных и системах RAG. Они позволяют сравнивать информацию по смыслу, а не по точному совпадению слов.

Ранее Google предлагала embedding-модели в основном для текста. Gemini Embedding 2 расширяет эту концепцию: embeddings становятся мультимодальными, и модель может работать одновременно с визуальными, аудио- и текстовыми данными.

Итог: Gemini Embedding 2 — модель, которая переводит текст, изображения, видео, аудио и документы в единое пространство смыслов, чтобы системы могли искать и сопоставлять разные типы данных.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Google представила Gemini Embedding 2 — нейросеть для поиска и сопоставления текста, изображений, видео и аудио
⚡ В тренде
МТС Premium — это подписка экосистемы МТС, которая объединяет кино, музыку, кэшбэк и партнёрские сервисы в одном тарифе. В 2026 году условия изменились: выросла цена и обновился состав подписки. Это напрямую влияет на выгоду — в одних сценариях она окупается, в других нет. В статье разберём, сколько стоит МТС Premium, что в неё входит, как […]
ВКонтакте – самая популярная российская соцсеть. Кто-то пытается с помощью ВК сделать себе имя, а кто-то – заработать. И тем, и другим для достижения своих целей нужны сообщества с большим количеством подписчиков. В статье рассмотрим 10 самых крупных по численности групп ВК и выясним, благодаря чему они стали популярными. Читайте также: Как быстро набрать подписчиков […]
Платформа Wink от Ростелеком предлагает множество вариантов подписки. Каждый пользователь может выбрать подходящий пакет, чтобы получить только нужные услуги и не переплачивать за ненужные. В этой статье мы расскажем, что входит в подписку Wink, какие есть тарифы, сколько они стоят. Также здесь вы найдете инструкцию, как подключить подписку бесплатно и как ее отключить. Читайте также: […]
Тексты, которые пишут нейросети — будто аккуратно выглаженные рубашки из химчистки. Без пятен, без запаха, без жизни. Они не раздражают, но и не трогают. А хороший текст должен цеплять! Можно, конечно, сказать ИИ: «Пиши как человек». Но это как попросить актёра «играть реалистично» — слишком абстрактно, чтобы сработало. Поэтому мы собрали 15 рабочих промтов, которые […]
Нормальные мужские фото — это всегда проблема. Хочется обновить аватарку, сделать деловой портрет или просто «крутое фото», а в реальности упираешься в съёмку: нужен свет, локация, понимание поз, и даже после этого результат часто не дотягивает. Решение — ИИ-фотосессия. Берёте одно удачное селфи и через промты собираете нужный образ: от строгого делового портрета до брутального […]
Блоги компаний
Новости
Свежие статьи