在2025科大讯飞1024开发者节上,科大讯飞推出了具备高度多模态交互能力的数字人导览“小飞”。“小飞”能够实现多人自由对话、多语种交流,并拥有个性化记忆能力,能记住访客历史信息并进行提醒,还能切换多种虚拟形象。科大讯飞董事长刘庆峰强调,“小飞”融合了八项核心能力,展示了AI作为“类人”伙伴走进真实物理空间的能力。此外,科大讯飞还发布了基于星火语音大模型的“百变声音复刻”技术,用户可一句话复刻任意音色并创造任意风格,有望变革数字人、有声读物等领域。
🌟 **多模态数字人“小飞”上岗**:科大讯飞推出的数字人导览“小飞”已正式投入使用,它突破了传统问答模式,能够实现多人同时对话、支持多语种交流,并具备个性化记忆功能,能记住访客信息并提供贴心提醒。此外,“小飞”还能根据需求切换成“林黛玉”等多种虚拟形象,提供更丰富、人性化的服务。
💡 **AI“类人”伙伴的现实应用**:科大讯飞董事长刘庆峰指出,“小飞”的诞生标志着AI不再仅仅是应用程序,而是通过融合远场识别、3D视觉感知、情感语义理解等八项核心能力,真正走进了真实物理空间,成为能够提供有情感、有深度服务的“类人”伙伴,展现了AI在人机交互领域的巨大潜力。
🗣️ **“百变声音复刻”技术革新**:科大讯飞发布了业界首创的基于星火语音大模型的“百变声音复刻”技术。该技术允许用户仅通过一句录音即可高保真地复刻任意音色,并通过一条指令即可创造出任意风格的声音。这项突破性技术有望为数字人、有声读物、内容创作等行业带来颠覆性变革,赋能个体创造专属声音。
🚀 **推动多领域技术变革**:科大讯飞推出的这两项创新技术——多模态数字人“小飞”和“百变声音复刻”技术,预示着AI在人机交互、内容生成等领域的深度融合与发展。它们不仅提升了用户体验,也为相关行业带来了全新的发展机遇和应用场景,推动着数字内容创作和个性化服务的智能化升级。
IT之家 11 月 6 日消息,在今日的 2025 科大讯飞 1024 开发者节上,科大讯飞推出全新多模态数字人。
科大讯飞表示,具备高度多模态交互能力的数字人导览“小飞”正式亮相并已实际上岗。“小飞”突破了简单问答的局限,能够实现多人自由对话、多语种交流,并具备个性化记忆能力,能记住访客历史信息并进行贴心提醒。此外,她还能秒变“林黛玉”等多种虚拟形象,提供更丰富的服务。


科大讯飞董事长刘庆峰指出,通过融合远场识别、3D 视觉感知、情感语义理解等八项核心能力,“小飞”展示了 AI 不再是简单的 App,而是能走进真实物理空间、提供有情感、有深度服务的“类人”伙伴。

IT之家从发布会现场获悉,科大讯飞还宣布业界首发基于星火语音大模型的“百变声音复刻”技术。用户仅需一句录音即可高保真复刻任意音色,再通过一条指令便可创造任意风格。这项技术的突破,有望为数字人、有声读物、内容创作等领域带来变革,让每个人都能创造专属声音。