最新语音识别模型Qwen3-ASR-Flash正式发布,基于Qwen3基座模型,经海量多模态及千万小时ASR数据训练。核心特性包括领先识别准确率、惊艳歌声识别、可定制化识别、非人声拒识别、高鲁棒性及多语种支持。该模型已在魔搭、HF创空间、阿里云百炼上线,欢迎体验并提出建议,官方将持续优化。
🔍 Qwen3-ASR-Flash是基于Qwen3基座模型开发的先进语音识别模型,通过海量多模态数据和千万小时ASR数据训练,实现了高准确率的语音识别性能。
🎤 该模型具备卓越的歌声识别能力,能够精准识别和分离歌声,同时支持可定制化识别,满足用户多样化的识别需求。
🛡️ Qwen3-ASR-Flash拥有高鲁棒性,即使在复杂环境中也能保持高准确率,并具备非人声拒识别功能,有效提升识别质量。
🌐 支持多语种识别,同时具备强大的抗噪声能力,能够适应各种语言环境和噪声干扰,确保语音识别的稳定性和可靠性。
🚀 Qwen3-ASR系列语音识别服务将持续优化与维护,官方诚邀用户前往魔搭、HF创空间、阿里云百炼进行体验,并欢迎分享具体应用场景。
2025-09-09 15:16 浙江
昨天我们正式推出了最新语音识别模型Qwen3-ASR-Flash,相信大家都已经知道了,它是基于Qwen3基座模型,经过海量多模态数据以及千万小时规模的ASR(自动语音识别)数据训练而成。
我们再快速复习一下它的核心特性:
1、领先的识别准确率
2、惊艳的歌声识别能力
3、可定制化识别(非常值得关注)
4、语音识别与非人声拒识别
5、模型鲁棒性高,复杂环境中仍能保持高准确率
6、多语种、抗噪声、识歌声,Qwen3-ASR通通搞定
昨天模型发布后,我们收到了很多积极的反馈,还有关于输入音频格式、时长等建议。后续,我们将持续对 Qwen3-ASR 系列语音识别服务进行优化与维护,感谢大家的支持!
诚邀各位朋友前往魔搭、HF创空间、阿里云百炼进行体验。
欢迎大家分享Qwen3-ASR的具体应用场景,我们将在评论区选择3条最具创意的留言送出通义POLO文化衫。





跳转微信打开