小米开源Xiaomi-MiMo-Audio语音模型

界面快报 09月19日

小米开源Xiaomi-MiMo-Audio语音模型

小米推出首个原生端到端语音模型Xiaomi-MiMo-Audio，基于创新预训练架构，在多项语音理解及对话评测中超越同参数量开源模型，性能优异。

9月19日，小米正式开源首个原生端到端语音模型——Xiaomi-MiMo-Audio，它基于创新预训练架构和上亿小时训练数据，首次在语音领域实现基于ICL的少样本泛化，并在预训练观察到明显的“涌现”行为。据介绍，在通用语音理解及对话等多项标准评测基准中，MiMo-Audio大幅超越了同参数量的开源模型，取得7B最佳性能；在音频理解基准MMAU的标准测试集上，MiMo-Audio超过Google闭源语音模型Gemini-2.5-Flash；在面向音频复杂推理的基准Big Bench Audio S2T任务中，MiMo-Audio同样超越了OpenAI闭源的语音模型GPT-4o-Audio-Preview。

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

小米语音模型 Xiaomi-MiMo-Audio 性能开源

相关文章

Meet HPT 1.5 Air: A New Open-Sourced 8B Multimodal LLM with Llama 3

Gemma: Introducing new state-of-the-art open models

百度副总裁的事儿挺火... 璩（qu）静凭借她自己的暴论短视频火上了几轮微博热搜，不近人情差点成了百度的“企业文化”，各种关于她的传播爆料齐出，经常被人们不...

Open Source Generative AI at Hugging Face with Jeff Boudier - #624

Exploring the FastAI Tooling Ecosystem with Hamel Husain - #532

小米与京东达成战略合作，目标三年达2000亿销售额

小米SU7先后出现刹车和启动故障，换车将优先排产

机构：一季度全球真无线耳机市场出货量达6500万，苹果出货量同比下滑8%但仍居第一

小米卫星通信软件著作权获批

小米登记卫星通信APP