Google DeepMind представила Gemini 3.5 Live Translate — новую аудиомодель для перевода речи почти в реальном времени.
Нейросеть будет доступна в продуктах Google, а также через Gemini Live API и Google AI Studio. Для компаний Google запускает private preview в Google Meet с июня 2026 года. В Google Translate модель выходит глобально на Android и iOS. Подробнее в материале Postium.
Читайте также: Нейросети для озвучки текста голосом
Что умеет Gemini 3.5 Live Translate и как работает
Gemini 3.5 Live Translate переводит речь в речь и автоматически определяет более 70 языков. Модель старается сохранить интонацию, темп и высоту голоса говорящего, чтобы перевод звучал ближе к живому разговору.
Google сравнивает её с turn-by-turn-системами. Такие системы ждут, пока человек закончит фразу, и только потом выдают перевод. Gemini 3.5 Live Translate работает с непрерывным потоком речи и остаётся на несколько секунд позади спикера.
Модель обрабатывает аудио по мере поступления. Язык не нужно выбирать вручную. Google также пишет, что модель устойчивее работает в шумной обстановке — например, во время звонков, встреч, занятий и трансляций.
Для разработчиков доступ открыт через Gemini Live API и Google AI Studio. С моделью уже работают Agora, Fishjam, LiveKit, Pipecat и Vision Agents. Эти платформы обеспечивают инфраструктуру для аудио в реальном времени, а разработчики могут создавать приложения с голосовым переводом.
Что изменится в Google Meet? В Google Meet речевой перевод перейдёт на Gemini 3.5 Live Translate. Поддержка вырастет с пяти языков до 70+.
Перевод больше не будет работать только через английский. Google заявляет более 2000 языковых комбинаций в одной встрече. В Meet также обновят интерфейс, чтобы участники могли быстрее включать речевой перевод во время звонка.
Что появится в Google Translate? Gemini 3.5 Live Translate выходит в Google Translate на Android и iOS по всему миру. В режиме Live Translate пользователь может подключить любые наушники и слушать перевод, который передаёт тон говорящего на 70+ языках.

На Android Google запускает специальный режим прослушивания. В нём перевод можно слушать через разговорный динамик телефона: достаточно поднести смартфон к уху, как во время обычного звонка. Такой режим нужен, когда надо быстро услышать перевод без наушников и не включать звук на весь окружающий мир.
Почему это важно? Google выводит свою флагманскую модель живого перевода не только в API и Meet, но и в обычное приложение Google Translate. На Android и iOS она будет доступна по всему миру, поэтому попробовать speech-to-speech-перевод на 70+ языках сможет практически любой пользователь.
Итог: Google запускает Gemini 3.5 Live Translate в API, AI Studio, Meet и Translate. Модель переводит речь в речь на 70+ языках и получит на Android режим прослушивания через динамик телефона.