昆仑万维于8月11日至15日举行SkyWork AI技术发布周,陆续推出SkyReels-A3、Matrix-Game 2.0、Matrix-3D、Skywork UniPic 2.0、Skywork Deep Research Agent等模型,并于8月15日上线Mureka V7.5模型。Mureka V7.5在中文歌曲演绎方面表现出色,通过深度理解中文曲风和元素,优化ASR技术提升人声表现的真实性与情感深度,生成音乐更具艺术性与真实感。同时,昆仑万维语音团队推出MoE-TTS,一个基于MOE的角色描述语音合成框架,可让用户通过自然语言描述精准控制声音特征与风格,在开放描述场景中表现优异。
8月11日,昆仑万维SkyWork AI技术发布周正式启动。8月11日至8月15日,我们每天发布一款新模型,连续五天,覆盖多模态AI核心场景的前沿模型。截至目前,我们已经发布SkyReels-A3、Matrix-Game 2.0、Matrix-3D、Skywork UniPic 2.0、Skywork Deep Research Agent模型。8月15日,昆仑万维正式上线Mureka V7.5模型。至此,昆仑万维SkyWork AI技术发布周完美收官。
Mureka 再进阶
Mureka V7.5 作品《梦想家》Mureka V7.5在中文歌曲上的演绎再上新台阶,不仅实现了中文歌曲音色、演奏技法的大幅提升,还完成了中文歌曲咬字与情感表现提升。首先,基于对中文曲风和元素的强大理解,Mureka的理解模型对传统民歌、戏曲到经典华语流行金曲乃至当代民谣音乐拥有深刻认知。这种在中文音乐多样性与文化特性上的深度积累,使模型在理解和生成中文音乐时,能够更准确地传达其特有的艺术神韵和情感色彩。其次,为了进一步提升生成音乐中人声表现的真实性与情感深度,我们针对歌曲特点优化了 ASR 技术,使之成为理解模块的有力延伸。这项技术深入到演唱的微观层面,不仅精准识别唱词,更能通过分析真实演唱中的气息运用、情感起伏和唱法细节,智能划分出符合演唱规律的乐句,并确定自然的换气与停顿位置。结合同样精准的乐段识别,显著提升了生成人声的段落清晰度与结构真实感。这些捕捉到的细粒度演唱信息反馈给生成模型,极大地增强了人声的自然度、呼吸感以及情感表达的真实性,有效削弱了机械感,使 AI 演绎的歌曲在流畅性上更贴近真人演唱,这在处理中文歌曲特有的韵律和气息要求时效果尤为突出。正是这种结合在文化特性上的独特积累和针对歌曲演唱优化的 ASR 技术所带来的细节洞察,共同构成了我们在中文音乐生成领域的核心竞争力。从下述Mureka V7.5生成的歌曲可以听出,它不仅能「听懂」对音乐旋律与节奏的制作要求,更能深刻理解并再现不同文化语境下,特别是中文音乐中蕴含的细腻情感与艺术表达,从而为生成高度符合目标审美与文化语境、兼具艺术性与真实感的音乐作品。
角色设定prompt:US actor with a New York accent, versatile, articulate, with a dynamic pace, full of charm and charisma, attracting the attention of the audience.台词文本prompt:Ay! Macbeth's soliloquy isn't words, it's blood and thunder in the mouth!
生成的音频如下:
案例2
角色设定prompt:Iron-Willed Strategist, Female, mature (35-50), deep and resonant voice, commanding tone with biting wit no-nonsense, formidable, and effortlessly dominant.
台词文本prompt:Victory isn't debated, it's seized. Every second spent doubting is a gift to your enemies. Do I make myself clear?