Стартап ElevenLabs представил новую модель генерации речи — Eleven V3 (alpha). Это самая выразительная и реалистичная TTS-модель на сегодня: она умеет передавать эмоции, интонации, паузы и даже такие детали, как шёпот, смех или кашель.
Теперь ИИ-голоса звучат по-настоящему естественно — настолько, что их сложно отличить от человеческих.
Читайте также: 6 нейросетей для озвучки текста голосом
Что умеет Eleven V3
ИИ-озвучка наконец перестала звучать, как робот из навигатора. С Eleven V3 можно делать аудиокниги, озвучку роликов, диалоги для игр — и всё это с нужным настроением и живыми эмоциями.
Детали:
- В тексте теперь можно задавать тон и эмоции через специальные теги: [sad], [excited], [angry], [whispers], [coughs] и т.д.
- Модель генерирует сразу два варианта фразы, чтобы выбрать наиболее удачный.
- Появился полноценный диалоговый режим: можно создавать сцену с несколькими голосами, без ограничений по количеству спикеров.
- Поддерживается более 70 языков, включая русский.
- Новая модель доступна даже бесплатным пользователям. Весь июнь генерации на V3 расходуют всего 20% кредитов — это десятки минут звука без доплат.
Как использовать: Eleven V3 — самая выразительная модель генерации речи. Но чтобы она звучала как надо, нужно уметь правильно ей «подсказывать». Вот что важно.
Выбирайте подходящий голос: если вы хотите шепот — не берите голос, обученный на крике.
Нажав на голос, можно посмотреть его подробное описание:
Настройте стабильность — переведите ползунок в нужное положение:
- Creative — больше эмоций, но могут быть ошибки.
- Natural — баланс между выразительностью и точностью.
- Reliable — стабильнее, но хуже реагирует на теги.
Используйте аудиотеги: [laughs], [whispers], [angry], [sigh], [sarcastic], [gunshot], [applause], [strong French accent] и др. Не забывайте про пунктуацию — точки, паузы и заглавные буквы влияют на ритм и интонацию.
Пример: [whispers] I never knew it could be this way… [sigh] But I’m glad we’re here.
Попробовать можно уже сейчас — модель доступна в интерфейсе ElevenLabs.
Ранее ChatGPT научился читать документы из Google Диска.
⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».
⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».