Компания ElevenLabs представила новую функцию под названием GenFM, которая позволяет создавать подкасты с несколькими голосами на основе загруженного контента, такого как видео с YouTube, текст или PDF-документ.
Функция схожа с возможностями Google NotebookLM и доступна бесплатно в приложении ElevenLabs Reader для iOS.
GenFM поддерживает 32 языка, включая русский, английский, испанский, китайский и другие. Для создания подкаста ИИ автоматически выбирает два голоса из более чем десятка доступных.
Интересной особенностью является добавление в речь естественных пауз и звуков, таких как «ммм» или смех, чтобы сделать подкаст более живым и реалистичным.
Представитель компании, Джек МакДермотт, отметил, что команда стремится сбалансировать естественность и полезность аудиоконтента. В будущем ElevenLabs планирует добавить больше возможностей для кастомизации подкастов и поддержку нескольких источников данных.
Недавно компания Meta* (запрещена в РФ) представила новый сервис NotebookLlama, который стал аналогом Google NotebookLM. NotebookLlama позволяет пользователям создавать ИИ-генерируемые разговоры на основе предоставленных источников, включая текстовые документы и мультимедийные файлы.
Одновременно с этим, онлайн-сервис перевода DeepL, запустил функцию DeepL Voice. С её помощью пользователи могут переводить не только текст, но и голосовые сообщения в режиме реального времени. DeepL Voice поддерживает несколько языков и обеспечивает высокую точность распознавания и перевода речи.
Тренд на использование ИИ-моделей для распознавания и создания аудиоконтента показывает, что в будущем взаимодействие с ИИ будет неотличимо от общения с человеком. Поэтому компании стремятся улучшать качество синтезированной речи, чтобы сделать ее максимально естественной и персонализированной.
⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/. +Плюс эксклюзивы, которых нет на сайте.
⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/. +Плюс эксклюзивы, которых нет на сайте.