seopapa

Команда Qwen (принадлежит Alibaba) запустила новую ИИ-модель для распознавания речи — Qwen3-ASR-Flash. Он основан на модели Qwen3-Omni и обучен на десятках миллионов часов аудио. Система распознаёт 11 языков и даже справляется с пением на фоне музыки.

Новая нейросеть обещает точное и устойчивое распознавание речи — включая акценты, диалекты китайского и шумный фон. Кроме того, модель может «подсказать», как интерпретировать речь — если загрузить любой текст (от ключевых слов до целых документов), она адаптирует результат под контекст.

Реклама. Erid 2VtzqwMXQT6. ООО «Клик.ру», ИНН 7743771327. Промопульт
Реклама. Erid 2Vtzqx3YjaU. ООО «Клик.ру», ИНН 7743771327.

Читайте также: Бесплатные нейросети для озвучки текста

Что умеет нейросеть Qwen3-ASR-Flash

Модель позволяет задавать текстовый «контекст» — от ключевых слов до несвязных текстов — и адаптирует результат под него. Это помогает при работе с терминологией, именами, или конкретной темой (например, в медицине или играх).

Что ещё:

  1. Лидирующая точность распознавания — модель превосходит аналоги на бенчмарках для китайского, английского и ещё 9 языков.
  2. Пение — не проблема — умеет точно транскрибировать вокал даже с фоном.
  3. Гибкий контекст — можно загружать подсказки в виде любого текста: от списков до абзацев.
  4. Определяет язык и отсекает шум — модель точно определяет язык и игнорирует не-речь (фон, тишину).
  5. Работает в сложных условиях — хорошо справляется с плохой акустикой и нестандартной подачей.

Поддерживаемые языки:

  • Русский;
  • Китайский (включая диалекты: сычуаньский, миньнань, у и кантонский);
  • Английский (британский, американский и др.);
  • И ещё 8 языков: французский, немецкий, испанский, итальянский, португальский, японский, корейский, арабский.

Как пользоваться Qwen3‑ASR‑Flash

Проще всего протестировать ИИ-модель через демо на Hugging Face — туда можно загрузить аудиофайл и сразу получить транскрипт.

Как пользоваться Qwen3‑ASR‑Flash

Для гибкой работы и интеграции подойдёт API от Alibaba Cloud Model Studio: вы передаёте аудио и, при желании, текстовый контекст (до 10 000 токенов) — например, список терминов или абзац с тематикой записи.

Сервис поддерживает 11 языков, определяет речь автоматически, фильтрует шум и работает даже с пением. Бесплатная квота — до 10 часов аудио на 180 дней.

Qwen обещает, что сервис будет регулярно обновляться — чтобы улучшать точность, адаптацию под разные сценарии и уникальные функции, такие как распознавание вокала.

Ранее Alibaba представила ИИ-модель на 1 трлн параметров — Qwen3-Max-Preview (Instruct).

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Qwen представила ASR-модель нового поколения — распознаёт 11 языков и даже песни
⚡ В тренде
Если вы ищете лучший конструктор интернет-магазина, скорее всего, вы уже приняли два важных решения. Первое — вам нужен собственный сайт для интернет-магазина, а не только продажи через маркетплейсы. Второе — вы не хотите тратить месяцы и сотни тысяч рублей на разработку интернет-магазина с нуля. В 2026 году конструкторы сайтов для интернет-магазинов закрывают большинство технических задач […]
Если вы только начали вести блог, запускаете новый проект или хотите оживить аккаунт, вам нужно одно — люди. В 2026 году подписчики по-прежнему важны: это и охваты, и продажи, и валидация вашего контента. Но просто выкладывать красивые фото уже недостаточно. Алгоритмы Instagram* меняются, пользователи привыкают к клиповому мышлению, а конкуренция растёт. В этой статье — […]
Да-да, вы наверняка уже всё сами видели. Лысый парень в очках встаёт с дивана, машет руками под строчку «Возьми телефон, детка…» — и вскоре этот же фрагмент начинает всплывать буквально везде: в рилсах, тиктоках, шортсах и даже в рабочих чатах. Мем разошёлся так широко, что успел надоесть, а затем ленту захлестнула волна нейрослопа: ролики, где […]
TikTok уже несколько лет работает в России в ограниченном режиме. Формально приложение не заблокировано: его можно скачать, открыть и пользоваться аккаунтом. Однако основные функции платформы для российских пользователей остаются отключёнными. Редакция Postium разбирается, что происходит с TikTok в России в 2026 году, почему сервис работает не полностью и можно ли смотреть новые видео. Читайте также: […]
Ищете готовые промты для ИИ-фотосессии девушки? Скорее всего, вы уже сталкивались с проблемой: большинство промтов из интернета работают плохо. Картинка может получиться красивой, но нейросеть часто меняет лицо. В итоге появляется новый персонаж, который лишь отдалённо напоминает исходного человека. Главная задача хорошего промта — сохранить сходство с человеком и его лицом. Запрос должен не только […]
Блоги компаний
Новости
Свежие статьи