热点
"情感可控" 相关文章
Bilibili 训练的这个 IndexTTS2 语音模型 效果很不错,支持情感可控 + 时长可控 - 自由切换情绪(开心、生气、悲伤等),甚至能用文字告诉模型“我想让声音听起来愤怒”。 - 保持说话人音色不变,同时注入其他音频或文字里的情感。 - 生成更自然、更清晰的语音,即使在强烈情绪下也不会崩坏。 -
小互推特 2025-09-13T01:10:03.000000Z