小互推特 09月13日
Bilibili IndexTTS2 语音模型:情感可控语音生成
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了Bilibili训练的IndexTTS2语音模型,该模型支持情感可控、时长可控,能够生成自然、清晰的语音,即使在情绪强烈时也不会崩坏。
小互 @imxiaohu
Bilibili 训练的这个 IndexTTS2 语音模型

效果很不错,支持情感可控 + 时长可控

- 自由切换情绪(开心、生气、悲伤等),甚至能用文字告诉模型“我想让声音听起来愤怒”。

- 保持说话人音色不变,同时注入其他音频或文字里的情感。

- 生成更自然、更清晰的语音,即使在强烈情绪下也不会崩坏。

-

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Bilibili IndexTTS2 语音模型 情感可控 语音生成
相关文章