拿 cursor 整了 soulx tts 的工具,适配了 macos gpu 。可以生成播客,有 web 、api 两种方式。全程没有写一行代码,问题由 agent 、plan 两种方式去分析解决。对比一个月前,提升巨大。
使用模型 Sonnet 4.5
有兴趣可以去仓库下载玩玩,cursor 写了很多文档和脚本,这个过程部分也都放在 github 上了。
测试文本生成时间
- 使用 mac M3 max 64G 版本总耗时:262.50 秒音频时长:192.52 秒 参与者:2 人对话数:27 段
