Технический директор ВКонтакте Александр Тоболь на открытии конференции Saint HighLoad++, сообщил что теперь у разработчиков есть возможность бесплатно использовать технологию ВКонтакте, которая считывает голос и переводит его в текст.

ASR (Automatic Speech Recognition) или технологию распознавания речи, можно внедрить в несколько кликов.

Реклама: 2VtzquY3wEz

На выбор доступно две модели для распознавания можно:

  • нейтральная — для разборчивой речи, как в телешоу или интервью;
  • спонтанная — для обыденной речи со сленгом и ненормативной лексикой.

Нейросети ВК быстро обрабатывают аудиофайлы, удаляют из расшифровки шумы и паузы, понимают неразборчивую речь и даже отдельный звук «ъ».

Обработку аудио до 100 минут в сутки можно применять для любых целей, а для безлимитного доступа нужно отправить заявку на электронную почту. Начать использовать технологию можно через веб-интерфейс на специальной странице или настроить интеграцию через публичный API ВКонтакте. Решение должно быть востребовано в стартапах, небольших инди-проектах, а также в личных проектах.

В самой соцсети ASR используется для расшифровки голосовых сообщений, генерации субтитров в видео, персональных рекомендаций и многого другого. Решение включает в себя три нейросети: для распознавания речи, поиска подходящих слов и расстановки знаков препинания.

Ранее ВКонтакте показал новый дизайн профиля в приложении.

Сравнение онлайн-курсов
Перед тем, как купить любой курс, сравните условия от разных школ — стоимость обучения, скидки, длительность, есть ли программа трудоустройства.

Подобрать онлайн-курс >>
Реклама
Больше статей по теме:

ОСТАВЬТЕ ОТВЕТ

Напишите комментарий
Введите своё имя