Google DeepMind представила Gemini 3.5 Live Translate — новую аудиомодель для перевода речи почти в реальном времени.

Нейросеть будет доступна в продуктах Google, а также через Gemini Live API и Google AI Studio. Для компаний Google запускает private preview в Google Meet с июня 2026 года. В Google Translate модель выходит глобально на Android и iOS. Подробнее в материале Postium.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Читайте также: Нейросети для озвучки текста голосом

Что умеет Gemini 3.5 Live Translate и как работает

Gemini 3.5 Live Translate переводит речь в речь и автоматически определяет более 70 языков. Модель старается сохранить интонацию, темп и высоту голоса говорящего, чтобы перевод звучал ближе к живому разговору.

Google сравнивает её с turn-by-turn-системами. Такие системы ждут, пока человек закончит фразу, и только потом выдают перевод. Gemini 3.5 Live Translate работает с непрерывным потоком речи и остаётся на несколько секунд позади спикера.

Модель обрабатывает аудио по мере поступления. Язык не нужно выбирать вручную. Google также пишет, что модель устойчивее работает в шумной обстановке — например, во время звонков, встреч, занятий и трансляций.

Для разработчиков доступ открыт через Gemini Live API и Google AI Studio. С моделью уже работают Agora, Fishjam, LiveKit, Pipecat и Vision Agents. Эти платформы обеспечивают инфраструктуру для аудио в реальном времени, а разработчики могут создавать приложения с голосовым переводом.

Что изменится в Google Meet? В Google Meet речевой перевод перейдёт на Gemini 3.5 Live Translate. Поддержка вырастет с пяти языков до 70+.

Перевод больше не будет работать только через английский. Google заявляет более 2000 языковых комбинаций в одной встрече. В Meet также обновят интерфейс, чтобы участники могли быстрее включать речевой перевод во время звонка.

Что появится в Google Translate? Gemini 3.5 Live Translate выходит в Google Translate на Android и iOS по всему миру. В режиме Live Translate пользователь может подключить любые наушники и слушать перевод, который передаёт тон говорящего на 70+ языках.

Gemini 3.5 Live Translate выходит в Google Translate на Android и iOS

На Android Google запускает специальный режим прослушивания. В нём перевод можно слушать через разговорный динамик телефона: достаточно поднести смартфон к уху, как во время обычного звонка. Такой режим нужен, когда надо быстро услышать перевод без наушников и не включать звук на весь окружающий мир.

Почему это важно? Google выводит свою флагманскую модель живого перевода не только в API и Meet, но и в обычное приложение Google Translate. На Android и iOS она будет доступна по всему миру, поэтому попробовать speech-to-speech-перевод на 70+ языках сможет практически любой пользователь.

Итог: Google запускает Gemini 3.5 Live Translate в API, AI Studio, Meet и Translate. Модель переводит речь в речь на 70+ языках и получит на Android режим прослушивания через динамик телефона.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

Комментарии: Google выпустила Gemini 3.5 Live Translate — аудиомодель переводит речь на 70+ языках
⚡ В тренде
Twitch — это не просто стримы и чат. Это возможность превратить своё увлечение играми в настоящую профессию. Представь: ты не просто играешь в любимые игры, а зарабатываешь на этом, строишь собственное комьюнити и становишься узнаваемым стримером. Звучит как мечта? На Twitch она вполне реальна. В этой статье расскажем, как быстро раскрутить канал, выйти на первую […]
Плохой промт звучит так: «Напиши статью на тему…». Хороший промт объясняет, для кого нужен текст, какую задачу он решает, какие факты использовать, какой структуры держаться и чего нельзя писать. Разница не в длине запроса, а в точности. Если не задать роль, аудиторию, формат и фактуру, нейросеть заполнит пустоты сама: возьмёт усреднённые формулировки, напишет общими словами […]
История Pixar — это не просто рассказ о создании мультфильмов. Это история о том, как маленькая команда энтузиастов смогла изменить индустрию развлечений, ввести новые стандарты и доказать: даже самые амбициозные мечты достижимы. Успех Pixar — это синтез технологий, креатива и бизнес-рисков. Эта история может вдохновить не только тех, кто связан с кино или анимацией, но […]
Reve представила Reve 2.0 — новую ИИ-модель для генерации и редактирования изображений. Она работает с нативным 4K-разрешением и делает упор на точное управление композицией: перед созданием картинки модель строит макет сцены. Reve 2.0 доступна на сайте Reve. Пользоваться сервисом можно бесплатно, но с ограничением на количество генераций. Больше подробностей в материале Postium. Читайте также: 25 […]
Ideogram выпустила нейросеть Ideogram 4 — первую ИИ-модель компании с открытыми весами. Это генератор изображений на 9,3 млрд параметров, который команда обучала с нуля, а не строила на базе существующей модели. Веса уже появились на Hugging Face. Доступны две версии: NF4 для CUDA и FP8. Компания также пообещала выпустить дополнительные варианты квантизации. Подробности — в […]
Блоги компаний
Новости
Свежие статьи