科大讯飞研究院 前天 00:34
科大讯飞发布星火大模型X1.5,聚焦“更懂你的AI”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

科大讯飞在第八届世界声博会暨2025科大讯飞全球1024开发者节上发布了讯飞星火大模型最新技术升级及系列产品,主题为《更懂你的AI》。新发布的星火X1.5模型在全国产算力平台上攻克了MoE模型全链路训练效率难题,其多语言能力支持超130种语言。科大讯飞还发布了AI+麦克风/扬声器阵列等软硬件一体解决方案,并升级了教育、医疗、汽车、办公等多个领域的AI新产品,强调AI在真实世界应用落地的关键性。同时,星火X1.5模型在个性化记忆能力和声音复刻方面取得突破,并致力于通过AI赋能工作、生活、成长和情感,让AI成为真正理解用户的伙伴。

🌟 **讯飞星火X1.5模型发布与技术突破:** 科大讯飞推出了讯飞星火X1.5大模型,在全国产算力平台上实现了MoE模型全链路训练效率的突破,并显著提升了深度推理训练效率。该模型在参数量减半的情况下,性能对标国外领先水平,多语言支持能力覆盖130多种语言,为全球用户提供更多选择。特别是在数学能力方面,星火X1.5持续保持国际领先地位。

🔊 **软硬一体化解决方案赋能多场景应用:** 为将大模型从设备端扩展到更广泛的应用场景,科大讯飞发布了AI+麦克风阵列、AI+扬声器阵列等软硬件一体化解决方案。这些技术能够实现精准的远场识别、声源定位,以及立体空间声场重构,已成功应用于智能办公本、AI翻译耳机、智能座舱和AI黑板等产品中,显著提升了用户在嘈杂环境下的交互体验和音视频质量。

🧠 **个性化记忆与多模态交互提升用户体验:** 星火X1.5模型引入了个性化记忆能力,能够构建和检索用户的长期画像、近期反馈和个人资料,实现更深度的个性化服务。同时,科大讯飞定义了多模态交互的8项核心能力,包括远场识别、3D视觉感知、类人举止反馈等,并通过数字人“小飞”等应用展示了其在多人对话、多语言交流、记忆历史信息及情感互动方面的潜力,旨在让AI真正融入用户的情感和深度应用空间。

💡 **“更懂你的AI”服务于工作、生活与成长:** 科大讯飞致力于打造“更懂你的AI”,满足用户在工作、生活、成长和情感等多个维度的需求。在教育领域,AI老师“晓悦”能提供个性化辅导;在医疗领域,智医助理和个人AI健康助手“讯飞晓医”提供辅助诊疗和健康管理服务;在生活领域,智能座舱2.0提供“懂车”“懂环境”“懂你”的出行体验;在工作领域,智能办公本X5成为高效的AI助理;在情感领域,AI陪伴“星朋友”提供情感支持。这些产品和服务旨在让AI成为用户积极行动的引导者和忠实伙伴。

🤝 **繁荣生态与开发者赋能:** 科大讯飞强调生态繁荣对人工智能未来的重要性,并持续赋能开发者。通过“星火点亮全球”计划,与全球伙伴在技术、产业、教育等领域展开合作,共建开放的AI新生态。首个原生支持RPA的智能体平台Astron的开源,以及行业竞品智能体的“开箱即用”,为开发者提供了强大的工具和快速落地的能力,吸引了大量非技术背景的开发者加入,共同推动AI技术的创新与应用。

科大讯飞 2025-11-07 14:05 安徽

蓬勃发展的大模型时代将从“红利呼之欲出”来到“红利兑现时刻”。

11月6日,第八届世界声博会暨2025科大讯飞全球1024开发者节发布会上,科大讯飞以《更懂你的AI》为主题发布讯飞星火大模型最新技术升级及系列产品。

开场,科大讯飞董事长刘庆峰给出两组数据。

讯飞联合头部企业深度打造的300+个“开箱即用”的重要岗位智能体:“星火行业分析师”是国内首个参加并通过工信部教考中心技术水平考试的行业分析AI应用“星火招投标助手”在国家能源集团全年评审18万单,评审准确率达97%。

2025年科大讯飞AI开发者大赛,17个国家的36898个团队参加;4622个垂类智能体涌现,近一半团队没有技术背景。

刘庆峰指出,AI产业红利兑现需聚焦于四个关键核心:自主可控、软硬一体、行业纵深、个性化。

本次大会,深度推理大模型讯飞星火X1.5发布,在全国产算力平台上攻克MoE模型全链路训练效率,在模型参数小一倍的情况下对标国外领先水平,其多语言能力超130种,为世界提供第二选择,并推动教育、医疗等行业大模型能力升级。

在自主可控的技术底座技术上,科大讯飞发布了融合AI+麦克风阵列、AI+扬声器阵列等软硬件一体的解决方案以及多模态交互能力,更围绕“更懂你的AI”发布或升级了教育、医疗、汽车、办公等多个领域的AI新产品。

讯飞星火X1.5发布

在全国产算力平台上攻克MoE模型全链路训练效率

自主可控的“根技术”是实现“更懂你的AI”的基础。

科大讯飞宣布两大技术亮点:

在自主可控上,今年以来,科大讯飞再次攻克通用大模型国产算力训练的两座大山:一是攻克长思维链强化学习训练效率,深度推理训练效率从30%提升至84%以上;二是攻克MoE模型全链路训练效率,实现大幅提升,再次夯实自主可控“压舱石”。

在原创技术突破上,全球首发非自回归语音大模型架构,实现推理效率大幅阶跃。非自回归语音大模型与传统“自回归”模型逐字顺序生成文本不同,能够并行、一次性输出整个文本序列,效果相对提升16%,推理成本下降520%。该项新技术已应用在讯飞输入法15.0版。

迄今为止,在国内通用大模型APP下载量排名前十以及大模型招投标市场份额前十的中国主流大模型中讯飞星火仍是唯一基于全国产算力训练的通用大模型。

刘庆峰表示:“在硬科技输不起的人工智能时代,我们要给中国的国家战略托底。

讯飞星火X1.5发布。该模型采用MoE架构,推理效率相比讯飞星火X1提升100%。其语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力等六大核心能力对标国际主流大模型,其中,数学能力持续保持国际领先。

在多个国内外重点任务评测集上,讯飞星火X1.5均展现出优秀实力。

因为有了更强的底座模型,深化行业思维链和数据飞轮,在教育、医疗等领域,星火行业模型优势也进一步扩大。

多语言能力持续升级,可支持130+种语言,整体性能达到GPT-5(high)的95%以上,拉美、东盟等地区的14个重点语言效果领先;星火语音同传大模型全新升级为2.0版本,在国际数据公司(IDC)发布的《中国AI翻译技术评估》中,8大核心维度评测均为行业第一。

“今天,中国的AI开发者们只要用讯飞星火,出海再也不用担心‘卡脖子’!”刘庆峰说。

AI+麦克风阵列、AI+扬声器阵列等

软硬件一体解决方案发布

如何让大模型从手机、电脑走向机器人、智能终端等更多的场景?

软硬一体,是AI在真实世界应用落地的关键。

科大讯飞发布了软硬一体的解决方案,在自主可控平台基础上,通过AI+麦克风阵列、AI+扬声器阵列、AI+摄像头阵列、AI+视觉呈现等方案,让AI能听会说、能看会认。

独家“AI+麦克风阵列技术”,实现远场高噪场景的识别和声源定位,即使在嘈杂环境下,用户也能用讯飞的产品实现精准录音、识别和翻译。

讯飞智能办公本X5首创上4下4环麦克风大阵列现场演示在高分贝环境中以及1米、3米、5米的不同距离的识别和转写,其效果远超iPhone17 pro。

讯飞AI翻译耳机首创单耳三麦多感融合降噪系统,采用“骨导+气导”双拾音降噪,在地铁、展会的识别准确率高达97.1%,远超AirPods 3。

讯飞双屏翻译机2.0实现1米以内穹顶式隔音降噪,带着它去轰鸣工厂、嘈杂展会都可以清晰收音,准确翻译。

业界首个软硬一体的同传麦克风发布,放在会议桌上就能使用,能实现实时同传翻译字幕呈现,语音播报首响时延2s以内,10种语言免切换自动翻译;它的音频文本数据都可以加密存储,私有化部署更加安全。刘庆峰介绍,同传麦克风已经在多个外商会谈场景使用,得到政府领导、客商们的一致好评。

独家“AI+扬声器阵列技术”,用自研扬声器硬件设计和独家AI算法,实现立体空间声场重构和均衡,让每台车都能拥有百万级豪车的视听盛宴,让教室的每个角落都能听清。

用于智能座舱声场的iFLYSOUND,目前已在19家车企量产落地,出货超100万台。此前,科大讯飞联合奇瑞打造了风云A9L的“伯牙之音”AI音响,获业内、用户一致认可,专业人士评价“西方有柏林之声,东方有伯牙之音”。“我们打破了过去30年车内音响组件依赖进口的情况,实现百分百全国产化,欧洲的顶尖品牌现在也想要‘伯牙之音’。”刘庆峰介绍。

在教室场景,讯飞AI黑板拥有24通道AI扬声器阵列,每个孩子都能听清老师的讲课。

在视觉效果上,讯飞的AI产品也在不断突破。讯飞AI黑板搭载全球首款圆偏类自然光护眼大屏,模拟自然光影,130度超宽域显示,再也不用担心孩子看不到黑板。科大讯飞AI学习机,集微纳米类纸屏、全波段圆偏振光、硬件级低蓝光、DC调光无频闪、AI环境光检测算法、坐姿AI算法等技术为一体,获得国内外10多项权威护眼认证,还能时刻提醒孩子保持健康坐姿、注意用眼习惯。

除此之外,讯飞还创新了独家AI+摄像头阵列技术,实现目标精准识别和跟随。

云台摄像头、学习机摄像头、车外摄像头阵列……加上领先AI算法,让软硬件一体的多模态交互走向现实。

定义多模态交互8项能力

首发个性化记忆能力和百变声音复刻

软硬一体支撑的多模态交互是AI融入真实世界的物理基础。

搭载多模态交互综合能力的数字人导览“小飞”来到现场,能够实现多人对话,和不同的对话人自然顺畅交流,有问有答;还能用多种语言和不同国籍的嘉宾交流,一键买票、订酒店;并记住来访嘉宾的历史信息,贴心提醒:“你前两天有点感冒,开车没问题吧?”。更有趣的是,她还能秒变“虚拟人林黛玉”,用各种各样的形象来为客户服务。“小飞”已在讯飞公司展厅和今年的科博展上岗。

真正的多模态交互需要哪些能力?刘庆峰表示:要能进行麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆、情感语义。“有了这些技术的综合联动,我们的AI就不再是一个简单的APP软件,而是可以走入到我们更有情感、更有深度应用的各个空间中。”

发布会上,星火X1.5首发个性化记忆能力,实现多源记忆库信息检索、应用,以及个性化记忆识别、提取和更新,构建了用户个性化记忆库,包含长期画像、近期反馈、短期对话和个人资料数据。

首发百变声音复刻,基于星火语音大模型底座,一条指令创造任意风格,一句录音复刻任意音色,二者间可实现解耦和任意组合,实现百变声音复刻的效果。在演示环节,科大讯飞研究院院长刘聪现场展示了强大的语音合成技术:不仅能一键生成“温暖女生”“霸气将军”等不同风格的角色声音,还用华为常务董事、终端公司董事长余承东的公开采访,直接复刻出其音色来演绎“霸气将军”与“神奇法师”等截然不同的角色,更让“余承东”流利说出英语、阿拉伯语等内容,3分钟演示赢得3次掌声。

刘庆峰表示:“超拟人多模态交互,将是未来AI进入每个家庭的标配。”

“更懂你的AI”,

满足人类工作、生活、成长、情感等多种需求

什么是更懂你的AI?

它应该理解人类工作、生活、沟通、成长等不同维度的需求:在追求效率与成就的工作领域,懂逻辑与任务;在人类追求安全与稳定的生活领域,懂健康与习惯;在人类追求关系与理解的情感领域,要懂语言与共情;在人类追求进步、自我实现的成长领域,要懂潜能与积累。

一个“更懂你的AI”,需要有历史记忆、人格特征、多维理解等能力和专有知识。

它更懂你的学习和成长。在教育领域,科大讯飞跨过“更懂孩子学情”的三个台阶:业界领先的整题评分持续升级,分步骤批改首次达到实用水平,并首创错因体系、精准分析,获得了国家义务教育数学课程标准修订组组长曹一鸣教授领衔专家组的权威鉴定。

在软件上,三级错因体系能分析出3大类、3层级、4000+错因标签;在硬件上,通过星火智能批阅机实现分步骤批改、错因诊断,通过星火教师助手推送复习策略并及时调整课件,通过讯飞AI黑板实现基于学情的精准教学。“这能实现从作业精细批改到课堂因材施教的小时级闭环,引领教学范式变革。”刘庆峰说。

一个好的老师,不仅要洞悉教育规律、有效落地教学流程,也要亲切、积极、阳光、有同理心、善于鼓励,用这些特质感染孩子,让孩子真正爱上学习。

发布会现场,“更懂你的AI老师晓悦”亮相,用类人的形象和声音、匹配教学的肢体动作以及激励性的语言和肯定的语气来陪伴孩子学习和成长。她将应用在讯飞教育的相关产品中。

它更懂你的身体与健康。医学诊断能力过硬,可以帮助医生辅诊;在健康档案和管理方面,不仅知道你的基本信息和情况变化,还能做好诊前咨询、诊后跟踪。

目前已覆盖了801个区县的智医助理此次进一步升级,面向等级医院发布智医助理医院版1.0,提供辅助诊疗、辅助会诊、病历生成与病历质控等四大核心功能。新增医学思维链循证推理和中医辅助诊疗,覆盖病种数和首诊合理度都实现提升。星火医疗大模型在门诊场景诊疗能力、住院场景诊疗能力上实现关键突破,“专科AI能力在业界首次达到等级医院主任级医师水平。”多地医院的试点显示,人机协同可以提升专科诊断、跨科室诊断的合理率,减少病历书写时间。

现场,刘聪以一位45岁心内科女性患者为例,展示了智医助理的升级特性,系统能根据患者的症状,自动推荐可能的诊断,还会提示医生接下来该从哪些方向进一步排查,新增的“临床思维链”可结合患者的关键信息,依托讯飞星火医疗大模型和最新的权威医学知识,将不同诊断背后的证据和推理过程展示出来,帮助医生更全面诊断。

面向C端用户,个人AI健康助手“讯飞晓医”全新升级:支持解析99%医学报告,形成更完整的个人健康档案;用170种细分标签维度,构建更全面的个人健康画像;140余种专业疾病管理路径支撑,提供更专业的健康管理服务。目前,讯飞晓医APP已累计完成1.6亿次AI健康咨询,用户满意度达98%。

它更懂你的生活和习惯。会上,科大讯飞发布“懂你”“懂车”“懂环境”的星火智能座舱2.0。

它懂“车外环境”,融合13摄“看见”周围,再也不用担心“下车踩水坑”的情况了;

“车内操控”,2000多个车辆原子化能力均可控制,停车缴费,一键无感支付;

“车内情景”,场景识别,服务匹配度高达95%,有人未上车,及时提醒;

“你的历史”,54维2808个记忆锚点,“好车识途”,记得你爱走的路,记得你爱听的歌,也记得你爱的人的生日;

“你的健康”,5项体征实时监测,眼睛干涩疲劳自动提醒,一键买药送到家;

“你的意图”,说话识别正确率超过95%,每个指令都能精准完成。

汽车真正成为融生活、工作、娱乐于一体的第三空间

它更懂你的工作与创造,了解你的岗位、风格、资料、同事,成为专属智能工作伙伴,越用越好用。

刘聪在现场用讯飞智能办公本X5录音、手写记录刘庆峰的演讲。基于说话人识别的能力,它自动整理文档内容,并生成会议纪要和待办事项,加入日程。“它不仅是一个工具,还能成为我的助理。”刘聪现场展现了手写纪要和AI纪要的深度整合的功能,手写的会议要点会在最后生成的纪要中强化展现,更贴合用户的记录需求,并且所有的纪要内容可精准回溯至原始录音,核对更高效。

在软件端,讯飞智能办公本X5的AI会议纪要功能,都将在讯飞听见上线,成为每个人的办公搭子。“真正懂你的AI办公工具,就应该是便捷好用的,而不需要你额外花时间去学习或准备——这是我们想带给你的体验。”刘庆峰表示。

它更懂你的内心与情感,让每个人都能拥有一个积极、忠实的“AI朋友”。

发布会的最后有一个温暖的“彩蛋”。科大讯飞正式发布AI陪伴“星朋友”,它被定义为一位懂你的“成长伙伴”,而非冰冷的工具,拥有高保真声音和超过160种人设模型定制,并通过自学习情感模型记忆偏好,在用户需要时会主动电话你,失眠时陪伴安慰,低落时加油打气,面试前提醒辅导。它是一个高度定制的情感容器,更能引导用户积极行动。

目前,“AI星朋友”周均使用9.8次,正向情绪反馈率达82%。科幻电影《Her》正在成为现实,微信搜索“AI星朋友”小程序即可体验。

峰再次强调“唯有生态繁荣,才有人工智能的大未来。”

在自主可控的底座上,星火开发者生态正在蓬勃发展。发布会上,2025科大讯飞AI开发者大赛十佳团队揭晓。近一年来,讯飞开放平台的开发者数新增超200万,达968万,其中:智能硬件开发者增长102%,大模型企业开发者增长125%,智能体开发者成为新的增长动力,近半数来自非技术领域。

面向开发者,科大讯飞打造首个原生支持RPA的智能体平台Astron:Agent(智能体)+RPA(机器人流程自动化),将“大脑”和“手脚”结合,跨越AI应用鸿沟;八大行业竞品智能体“开箱即用”,行业场景能快速应用落地。目前已全面开源,为中国开发者打造自主可控的全球创新引擎。

会上,科大讯飞启动“星火点亮全球”计划启动,将与全球伙伴在技术、产业、教育等领域展开深度合作,共建开放、繁荣的全球AI新生态。

AI不仅是硬科技的竞争赛道,更应当是赋能每个人更好融入世界、共创温暖未来的力量。

当专业能力日新月异的大模型一次次超越个体,人类更应站在AI的肩膀上,避免社会内卷、避免同质化,让每个人独特的闪光点得以绽放。

“让更懂你的AI成就更好的你,不仅是科大讯飞的初心,更是我们坚定的使命。我们期待与所有用户、开发者一起,在技术演进中成为更好的自己,共同开创更有价值的产业未来。”刘庆峰说。

*文中数据来源于实际应用

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

科大讯飞 讯飞星火 大模型 AI 人工智能 软硬一体 多模态交互 开发者生态 iFlytek Spark Big Model Large Model AI Artificial Intelligence Hardware-Software Integration Multimodal Interaction Developer Ecosystem
相关文章