xAI добавила в Grok API функцию Custom Voices. Она позволяет клонировать голос по короткой записи и сразу использовать его в Text to Speech и Voice Agent API. Вместе с этим компания открыла Voice Library — раздел в консоли xAI, где собраны встроенные и пользовательские голоса команды.

Функция уже работает в экосистеме xAI. Пользовательский голос получает свой voice_id, который можно передавать в любые TTS-запросы или подключать к голосовым агентам в реальном времени. Подробнее в материале Postium.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Читайте также: 6 нейросетей для озвучки текста голосом

Custom Voices в Grok — что это и как работает

Система собирает голосовую модель из записи длиной около минуты. Перед этим человек должен прочитать проверочную фразу — xAI использует её как подтверждение присутствия и согласия.

После записи сервис сравнивает голос из проверочного клипа и основной записи. Если голос совпадает, система создаёт кастомную модель и добавляет её в Voice Library.

Custom Voices в Grok — что это и как работает

xAI отдельно подчёркивает: загрузить чужую запись и сделать клон не получится. Проверка построена вокруг живого подтверждения голоса, а не вокруг уже существующего аудиофайла.

Готовый голос работает так же, как встроенные TTS-голоса xAI. Поддерживаются речевые метки, потоковая генерация через REST и WebSocket, а также многоязычный вывод.

Параллельно xAI расширила встроенный голосовой каталог: теперь в библиотеке больше 80 голосов на 28 языках.

Как пользоваться?

Custom Voices можно создать прямо в консоли xAI. Нужно открыть создание нового голоса, прочитать фразу и записать примерно минуту речи. После обработки голос появляется в Voice Library.

Как пользоваться, как сделать запись и создать клон своего голоса

Дальше всё работает через обычный API-вызов: разработчик передаёт voice_id вместо стандартного голоса в Text to Speech или Voice Agent API.

Почему это важно? До этого кастомные голоса требовали отдельного сервиса, сложной модерации и ручной интеграции. xAI встроила всё в существующий стек Grok: запись, проверку личности, создание модели и подключение к API.

Особенно это важно для голосовых ИИ-агентов. Большинство AI-ассистентов до сих пор звучат как набор одинаковых системных голосов. xAI пытается превратить голос в часть идентичности продукта: поддержки, медиа, помощника или корпоративного ассистента.

Ещё одна важная деталь — xAI не вводит отдельную плату за пользовательские голоса. Custom Voices работают в рамках обычного использования TTS и Voice Agent API.

xAI активно наращивает голосовую часть Grok API последние недели. Сначала компания запустила Speech to Text и Text to Speech API, затем представила модель grok-voice-think-fast-1.0 для разговорных агентов в реальном времени. Теперь поверх этого стека появился полноценный слой кастомных голосов и централизованная Voice Library.

Фактически xAI создаёт свою альтернативу ElevenLabs, OpenAI Voice Engine и другим платформам, но сразу внутри экосистемы Grok.

Итог: Grok превратился из обычного TTS-сервиса в полноцененную платформу для голосовых агентов — со своими голосами и встроенным клонированием речи.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Custom Voices в Grok — xAI запустила клонирование голоса для TTS и ИИ-агентов
⚡ В тренде
Представьте, вы загружаете своё фото — обычное, как в паспорте — и через пару секунд видите себя как героя Pixar с огромными глазами или как персонажа из аниме. Без фотошопа и часов работы над картинкой. Просто нужен правильный промт и ChatGPT (из нейронок ещё подойдут Qwen и Nano Banana 2). Чтобы всё получилось, лучше взять […]
ChatGPT — универсальный ИИ для работы, учёбы, бизнеса и повседневных задач. Он пишет и редактирует тексты, помогает с кодом, анализирует файлы и таблицы, генерирует изображения, объясняет сложные темы и может много чего ещё. Но в России нейросеть ChatGPT официально недоступна. OpenAI ограничила доступ к чат-боту для российских пользователей, поэтому сайт может не открываться напрямую, регистрация […]
В соцсетях вирусится новый тренд: пользователь загружает селфи в ChatGPT, вставляет промт и получает «отчёт по внешности». Нейросеть разбирает черты лица, симметрию, пропорции, причёску, стиль, ракурс и даёт рекомендации по образу. В некоторых версиях промта ChatGPT ещё и ставит оценку по шкале от 1 до 10. В этой статье дадим основной промт и несколько вариаций […]
OpenAI начала разворачивать GPT-5.5 Instant в ChatGPT. Это новая ИИ-модель по умолчанию: она заменяет GPT-5.3 Instant и отвечает на обычные запросы без ручного выбора режима. GPT-5.5 Instant рассчитана на повседневные задачи: объяснения, поиск информации, работу с текстом, перевод и ситуации, где ChatGPT сам решает, нужен ли веб-поиск. Модель уже доступна всем пользователям ChatGPT. Подробности — […]
Telegram добавил в настройки профиля раздел «Автоматизация чатов». Теперь пользователь может подключить бота к своему аккаунту и разрешить ему отвечать на сообщения от своего имени. При подключении можно выбрать, к каким чатам бот получит доступ: например, только к новым диалогам или ко всем пользователям, кроме контактов. Детали в материале Postium. Читайте также: Как быстро набрать […]
Блоги компаний
Новости
Свежие статьи