讯飞星火大模型多语言技术进展

原创 iFLYTEK RESEARCH 2025-08-12 17:16 北京

语言是大模型的基础，随着大模型在全球范围的风靡与延展，大模型多语言能力的重要性和实用度也备受关注。

不久前，科大讯飞星火X1大模型全面升级，多语言能力覆盖130+语种；基于星火X1底座的语音同传大模型在翻译效果、实时响应、语音听感、专业精深等方面大幅跃升。

在大模型的多语言能力上，讯飞基于多年深耕多语言相关的语音识别、合成、同传、机器翻译等技术，正在探寻与实践一条全新路径。我们将分享目前在讯飞星火大模型多语言技术上的心得、成果与趋势研判，希望有更多人参与到多语言大模型及应用的构建当中，真正实现“给世界提供第二种选择”。

以下内容整理自讯飞研究院院长刘聪在WAIC 2025“科大讯飞高级别高水平多语言基座大模型国际学术研讨会”上的演讲

目前，大模型在中英文上已经达到了很好的效果；但客观来说，在多语言上的效果还有待进步。

大模型为多语言技术带来的机遇

大模型为多语言技术发展带来了全新的机遇，挖掘出巨大的需求潜力：

多语言大模型为“一带一路”国家战略、人机交互等重大需求提供关键支撑；

国际AI巨头纷纷加码多语言大模型研发，通用大模型正在从中英文向多语言拓展；

少数国家研发仅支持本国语言的大模型，但仍处于起步阶段（如越南、印尼等研发了面向本国语言的大模型）。

同时，大模型还能更好解决当前多语言技术遇到的难题：

不同的语言在语法结构、词汇语义方面存在巨大的差异，现有的模型泛化不足，很难在不同语言上形成泛化推广的能力；

相较于中英文等主要语种具有海量数据的情况，很多小语种的语言分析研究、专家知识积累不足，导致训练数据稀缺；

多语言技术在实际应用中除了文本翻译，还会结合语音翻译、图片翻译等环节，中间造成的延续性级联误差扩散，都会影响多语种识别效果，导致最终翻译结果错误。

科大讯飞在多语言技术上拥有深厚的积淀。例如2008-2015年之间，我们先后在语音合成、语音评测、语音识别等领域首次超过人类或人类专家水平，此后在机器翻译、机器阅读理解和常识推理等方向上持续突破，并且承担了语音及语言信息处理国家工程研究中心、国家新一代人工智能开放创新平台、认知智能全国重点实验室等平台，这些都为之后星火大模型的多语言技术研发奠定了坚实的基础。

讯飞星火多语言大模型

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签