Чтобы ИИ-голос звучал по-настоящему живо, стоит отказаться от готовых пресетов и сгенерить свой. Это несложно: задаёте возраст, тембр, темп и характер подачи — и модель начинает звучать как живой человек, а не как шаблонный диктор.
Большинство пользователей ElevenLabs берут первые попавшиеся голоса из библиотеки. В итоге получается одинаковое звучание, которое уже узнаётся в десятках роликов, подкастов и Reels. При этом в сервисе есть функция Voice Design — режим, где можно создать уникальный голос по текстовому описанию.
В этой статье я покажу, как сгенерировать собственный голос в ElevenLabs, дам 5 готовых промтов под реальные сценарии (книги, UGC, обучение, подкасты и персонажи), а также покажу рабочую альтернативу — на случай, если не хочется платить за подписку.
Читайте также: Как вести экспертный блог с помощью ИИ
Как сгенерировать ИИ-голос в ElevenLabs
Для генерации зайдите в «Voices → Create a voice» в ElevenLabs.

Затем выберите «Voice Design» и вставьте один из промтов ниже.

Да, потребуется подписка от $5 в месяц — но за уникальный голос это вполне адекватная цена, особенно если вы делаете контент регулярно.
Если не хочется платить за подписку, есть бесплатный вариант — MiniMax Audio. Он позволяет создать до трёх уникальных голосов бесплатно. Заходите в MiniMax Audio и переходите в раздел «Voice Design».

Далее в поле «Prompt» вставляете промт, ниже добавляете «Text to preview» — небольшой абзац на русском, чтобы сразу услышать результат. После этого нажимаете «Generate», прослушиваете варианты и сохраняете тот голос, который понравился больше всего.
Теперь переходим к промтам.
Статья в тему: Промты для создания обложек для видео на YouTube
Промты для создания ИИ-голоса
Все промты ниже написаны на английском — модель лучше понимает такие описания, но сами настройки адаптированы именно под озвучку русского текста. Перед генерацией обязательно оставляйте в промте одно значение: [male (мужской)] или [female (женский)] — второе просто удаляете.
Точно так же можно менять и другие параметры: возраст, тембр, темп речи, характер подачи или даже страну/акцент — это позволяет тонко подстроить голос под конкретную задачу и получить действительно уникальный результат. Больше полезных промтов для создания контента — в ТГ-канале «Промты — и точка».
1. Озвучка аудиокниг/видео
Глубокий, размеренный голос, который держит внимание и не утомляет при долгом прослушивании.
Промт:
A [MALE/FEMALE] voice, age 35–50, native Russian speaker. Tone/timbre: warm, deep, smooth. Pitch: medium to slightly low. Pacing: slow and deliberate, with expressive pauses. Professional audiobook narrator style. Emotionally restrained, thoughtful, immersive. Clear Russian articulation. Studio-quality audio. Natural breathing. Subtle cinematic delivery. The voice should feel calm, intelligent, and trustworthy, guiding the listener through long-form storytelling.
2. UGC/ИИ-блогер
Максимально естественный, «бытовой» голос для коротких видео (Reels/TikTok), имитирующий живого человека.
Промт:
A [MALE/FEMALE] voice, age 22–32, native Russian speaker. Tone/timbre: bright, lively, modern. Pitch: medium. Pacing: fast but natural, conversational. Sounds like a confident content creator. Friendly, energetic, relatable. Clear Russian articulation. Studio-quality audio. Natural intonation with light emotional variation. The voice should feel human, spontaneous, and engaging, like a real blogger talking directly to the audience.
3. Обучающие видео
Дикторский, экспертный голос. Акцент на четкость каждого слова и доверительную интонацию.
Промт:
A [MALE/FEMALE] voice, age 30–45, native Russian speaker. Tone/timbre: neutral, clean, professional. Pitch: medium. Pacing: steady and structured. Experienced instructor delivery. Calm confidence. No dramatic emotion. Perfect Russian pronunciation. Studio-quality audio. Even cadence. The voice should sound like a skilled teacher explaining complex ideas clearly and patiently.
4. Ведущий подкаста/YouTube-канала
Харизматичный «объемный» голос с эффектом дорогого студийного микрофона и приятным тембром.
Промт:
A [MALE/FEMALE] voice, age 30–45, native Russian speaker. Tone/timbre: rich, warm, charismatic. Pitch: medium to slightly low. Pacing: relaxed conversational rhythm. Podcast host style. Confident, intelligent, engaging. Studio-quality audio. Smooth transitions between sentences. Subtle expressive intonation. The voice should feel personal, modern, and trustworthy — like a professional media host.
5. Персонаж фильма или игры
Когда нужен кинематографичный голос с характером.
Промт:
A [MALE/FEMALE] voice, age 40–60, native Russian speaker. Tone/timbre: low, slightly rough, cinematic. Pitch: low to medium. Pacing: slow and deliberate. Story-driven game character delivery. Serious, grounded, emotionally restrained. Clear Russian articulation. Studio-quality audio. Gravelly texture. Dramatic pauses. The voice should feel experienced and real, like a character with history and depth.
Что делать дальше и как использовать ИИ-голос?
Возьмите любой свой старый пост, сценарий или лонгрид и переозвучьте новым голосом. Сравните с прошлой версией — разницу слышно сразу. Это самый быстрый способ понять, подходит ли голос под вашу задачу. Как делать озвучку текста голосом в ElevenLabs — рассказывали в отдельной статье.
Один и тот же материал теперь можно выпускать в двух форматах: текст + аудиоверсия. Это фактически +100 % контента без переписывания. Кроме того, в ElevenLabs можно задавать тон и эмоции прямо в тексте через специальные теги — как грамотно озвучивать статьи и управлять подачей, разобрали в отдельном гайде.
И ещё один практичный приём: попробуйте сделать короткое видео с вашим клоном или ИИ-блогером. Для UGC достаточно простой схемы — фон + субтитры + голос. Такой формат хорошо работает для тестирования офферов и идей, особенно на раннем этапе. Видео с аватаром и липсинком можно собрать на платформах вроде HeyGen или Kling Avatar — там голос легко совмещается с говорящей моделью.
Больше гайдов по нейросетям: