Нейросети Яндекс Браузера научились переводить видео с китайского языка и автоматически накладывать русскую озвучку.

Технология уже работает на YouTube, а чуть позже появится поддержка популярной китайской видеоплатформы Bilibili.

Реклама: Erid 2VtzqxMEZ7c
Реклама. Erid 2VtzquiXA8E

Как работает автоматический перевод с китайского в Яндекс Браузере

Яндекс Браузер сам предлагает перевести видео с китайского на YouTube сразу после того, как пользователь его откроет. Нужно просто нажать на кнопку «Перевести видео».

Перевод с китайского

Основные тонкости технологии:

  • Уникальный датасет. Разработчики Яндекса с нуля собрали собственный датасет. С помощью специального алгоритма они обработали 1,5 миллиона видео и выбрали 100 тысяч с качественными субтитрами на севернокитайском языке. Соответствие аудио и субтитров важно, потому что именно по ним нейросеть учится понимать речь.
  • Понимание письменности. Чтобы превращать речь в текст, нейросети браузера выучили тысячи иероглифов. Каждый из них читается как слог. Чтобы нейросеть научилась их понимать, весь необходимый для работы с китайским словарь разработчики закодировали в виде 10 000 токенов.
  • Тоны и контекст. На изучение и распознавание четырёх тонов, определяющих смысл сказанного в китайском языке, у нейросети заняло месяц. Ещё в китайском много омофонов — слов, которые звучат одинаково, но пишутся по-разному и обладают разным значением. Чтобы различать их, нейросети Яндекс Браузера умеют учитывать контекст.

Кроме того, у Яндекса появилась достаточная технологическая база для работы с другими сложными языками. Например, корейским и японским.

Ранее в Яндекс Браузере появились интерактивные субтитры для видео на четырёх языках.

Читайте нас в Телеграм
Читайте нас в Телеграм
Комментарии: В Яндекс Браузере появился автоматический перевод с китайского языка
Блоги компаний
⚡ В тренде
А вы знали, что даже двухступенчатая аутентификация – не гарантия защиты от взлома профиля? Более того, через нее злоумышленники могут навсегда украсть аккаунт без возможности восстановления. Разберемся, что дает двухфакторка в Инстаграм* и нужно ли ее устанавливать. Мы расскажем, что такое двойная аутентификация в Инстаграм* и от чего она может защитить. Покажем пошаговую инструкцию, как […]
Яндекс запустил функцию генерации видео в приложении «Шедеврум» в августе прошлого года. Сначала функция была доступна только самым активным пользователям, но сейчас ей могут пользоваться все желающие. Генерация видео позволяет создавать короткие ролики, гифки и динамические аватарки для соцсетей. Также, для видео в приложении есть отдельная лента с анимациями, которые сделали другие пользователи. Далее показываем, […]
Команда Сбера представила Kandinsky 3.1 – следующую ступень в развитии предыдущей модели, Kandinsky 3.0. Модель получила множество улучшений, а также была дополнена полезными функциями и режимами, которые расширяют возможности пользователей. Улучшенная модель генерации изображений сегодня стала доступна всем пользователям без ограничений. Обновлённая версия дообучена на датасете эстетичных изображений, что позволило повысить качество генерации картинок. Первоначальный […]
ВКонтакте – самая популярная российская соцсеть. Кто-то пытается с помощью ВК сделать себе имя, а кто-то – заработать. И тем, и другим для достижения своих целей нужны сообщества с большим количеством подписчиков. В статье рассмотрим 10 самых крупных по численности групп ВК и выясним, благодаря чему они стали популярными. Читайте также: Как раскрутить группу в […]
Яндекс представил первые устройства для умного дома с поддержкой Matter over Wi-Fi — умную розетку и светодиодную ленту. Это первые устройства, выпущенные российской компанией, с поддержкой данного протокола. Что такое Matter? Благодаря ему вы можете объединить в единую систему устройства самых разных производителей без лишних сложностей с настройками. Для подключения нужна Яндекс Станция или устройство […]
Новости
Свежие статьи