通义 09月25日

Qwen3-ASR-Flash语音识别模型发布

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

最新语音识别模型Qwen3-ASR-Flash正式发布，基于Qwen3基座模型，经海量多模态及千万小时ASR数据训练。核心特性包括领先识别准确率、惊艳歌声识别、可定制化识别、非人声拒识别、高鲁棒性及多语种支持。该模型已在魔搭、HF创空间、阿里云百炼上线，欢迎体验并提出建议，官方将持续优化。

🔍 Qwen3-ASR-Flash是基于Qwen3基座模型开发的先进语音识别模型，通过海量多模态数据和千万小时ASR数据训练，实现了高准确率的语音识别性能。

🎤 该模型具备卓越的歌声识别能力，能够精准识别和分离歌声，同时支持可定制化识别，满足用户多样化的识别需求。

🛡️ Qwen3-ASR-Flash拥有高鲁棒性，即使在复杂环境中也能保持高准确率，并具备非人声拒识别功能，有效提升识别质量。

🌐 支持多语种识别，同时具备强大的抗噪声能力，能够适应各种语言环境和噪声干扰，确保语音识别的稳定性和可靠性。

🚀 Qwen3-ASR系列语音识别服务将持续优化与维护，官方诚邀用户前往魔搭、HF创空间、阿里云百炼进行体验，并欢迎分享具体应用场景。

2025-09-09 15:16 浙江

昨天我们正式推出了最新语音识别模型Qwen3-ASR-Flash，相信大家都已经知道了，它是基于Qwen3基座模型，经过海量多模态数据以及千万小时规模的ASR（自动语音识别）数据训练而成。

我们再快速复习一下它的核心特性：

1、领先的识别准确率

2、惊艳的歌声识别能力

3、可定制化识别（非常值得关注）

4、语音识别与非人声拒识别

5、模型鲁棒性高，复杂环境中仍能保持高准确率

6、多语种、抗噪声、识歌声，Qwen3-ASR通通搞定

昨天模型发布后，我们收到了很多积极的反馈，还有关于输入音频格式、时长等建议。后续，我们将持续对 Qwen3-ASR 系列语音识别服务进行优化与维护，感谢大家的支持！

诚邀各位朋友前往魔搭、HF创空间、阿里云百炼进行体验。

欢迎大家分享Qwen3-ASR的具体应用场景，我们将在评论区选择3条最具创意的留言送出通义POLO文化衫。

Qwen3-ASR-Flash发布后，听到大家说……

Fish AI Reader