WaytoAGI小谷 2025-08-20 22:38 北京
这是今年做的最开心最完美的一场直播了。超会提问的 iris,热情的AI社区,有100多位小伙伴更是直接上手实践,和线下一样气氛拉满。这也是 FlowSpeech 最后的宣传周,从下周开始,我们又要朝着里程碑奔跑,期待拿出更好的产品和大家相见
做一条播客需要多久?一个数据是:12.9小时。
但现在借助AI,你只需要提供一个选题,它甚至能在5分钟内做好一期AI播客!
这就是橘子基于AI技术打造的TTS(Text To Speech)工具:
ListenHub(https://Listenhub.ai/zh)
最近,它还上线了一个更厉害的FlowSpeech功能,不仅能几乎完美地复刻你的声音,还能将复杂难懂的书面语转为十分自然的口语。
现在,AI真的能说人话了!
为了更好地了解这个产品,以及产品背后的思考,WaytoAGI的「鹿演」第3期邀请到了ListenHub创始人橘子,和主持人生姜 Iris一起来聊聊ListenHub的幕后故事。
在这次直播中,橘子展示了非常多真实有用案例,很多人已经用ListenHub把自己的AI项目做了起来,并且提升了收益。
ps:错过直播的小伙伴,可以到「通往AGI之路」视频号查看回放。关注我们,后面也会有更多鹿演项目哦~
下面,就一起来看看直播中提到的案例!
场景1:AI播客
过去一档播客平均要折腾十来个小时,但现在换种打法:5 分钟就能上线一条节目。
比如向阳乔木做的AI书籍解读播客,已经连续更新了15条内容,快速涨到了200+粉丝。
而这些,只需要丢给AI一套提示词、一个关键词,就能快速生成,并且信息密度高、逻辑顺,“真人感”也非常强。
向阳乔木:
同理,如果你没时间认真读书,也可以把关键词丢给ListenHub试试,几分钟就能产出出一段解读音频,赶着路、做着家务就能让知识丝滑地进入脑子。
场景2:AI故事书视频
除了播客创作者,ListenHub 也在陪伴和记录生活上展现了价值。
在直播里,橘子还分享了一个非常有爱的场景。有位用户用 Google Notebook LM 的故事书功能,把自己家小孩的声音克隆下来,然后结合故事书做成了一段视频。小朋友看到成品后特别兴奋,到处跟人炫耀:“你看,这是我录的视频!”
别人还在给孩子讲睡前故事,ListenHub已经实现让孩子自己哄自己了,非常“省爸妈”的操作。
生姜Iris:
声音不仅是记录,更是一种跨越时间的陪伴和情感延续。场景无限丰富,而这正是 ListenHub 与 FlowSpeech 想带来的价值:让科技成为情感的容器,把“声音”变成一份独一无二的礼物。
场景3:解读财报/论文等
当然,它的价值不止在情感陪伴上,在学习和信息吸收上同样强大。
ListenHub还很擅长解读财报,它能把晦涩难懂,甚至是英文论文自动转化为小白也能听懂的中文音频,帮我们快速理解新知识,降低学习门槛。
比如我看不懂GPT-5的升级亮点,就可以把这样一段官方信息丢给它:
很快,它就能输出这样一段音频,保留专业术语的同时,还能让我更清晰、更结构化地理解内容。
在直播后半场,橘子和生姜Iris就创业、产品、以及 ListenHub 的未来展开了更深入的对谈。
下面整理了部分对谈文字稿,想看完整的对谈内容的小伙伴,欢迎到视频号观看直播回放~
💡 Q&A 对谈
Q(生姜 Iris):您是从什么时候开始接触 AI 的?在此之前的生活节奏是怎样的?AI 给您带来了哪些变化?
A(Orange):我是在 2022 年 10 月接触 AI 的,那时候刚离开上一家公司 Boss 直聘,也等于结束了我十多年做移动互联网产品经理的职业生涯。
从最早毕业时做黑莓手机,到后面一直做产品经理,我感觉移动互联网已经走到末路。正好有机会认识了 MiniMax,当时公司才 80 多人。我和 CEO 聊过后,觉得很契合,就加入了。MiniMax 当时的爆款产品是 Glow(陪伴类应用),但公司更想做的是 AGI,所以我加入后负责大模型方向的产品。
对我来说,这算是跨行,当时 AI 大家都还不懂,我自己也在学习。学习最快的方法就是“费曼学习法”,所以我每天在 Twitter 上分享学习笔记,结果一年涨了 6 万粉,两年十几万粉。算是被动走上了自媒体的路,从没想过营销,就这么自然地起号了。
在 MiniMax 工作的 500 天里,几乎每天都和 AI 打交道。周末不休息,娱乐活动也全部戒掉,生活就是围绕 AI 展开。对我来说,这彻底重塑了生活节奏:白天做产品,晚上学习和分享 AI。
Q(生姜 Iris):您之前提到是如何走上 AI 自媒体的,那又是怎么从自媒体转变成创业者?两者最大的区别是什么?
A(Orange):其实我最开始还不算严格意义上的自媒体,因为那时候没有商业化。离开公司后有半年时间的竞业期,我想着能不能把这段时间拿来把自媒体闭环一下。于是我开始做公众号和小红书。这里要提醒大家一个点:X/Twitter 上几乎没有商业化,想做变现就要做公众号或小红书。
一开始就是这样尝试,没想到做了一年多,收入逐渐超过了原本的薪资。这时候我也面试了“六小虎”、字节、阿里等大厂,甚至 AI 创业公司, 但最后发现创业更适合自己。以前虽然也创业过,但那时是跟着老板,现在是第一次真正做 CEO。
我觉得是发现了机会。AI 能做的事情很多,但大家都在卷通用模型,比如 Agent。我反而看到一些没人做的方向,比如声音。语音交互会是智能穿戴、智能设备的核心入口。没有语音交互,就很难和这些设备沟通。
因此我们做了 ListenHub,偏声音的输出,而下一款产品会是更互动的“声音伙伴”(具体形态先保密)。
Q(生姜 Iris):创业后的最大感受是什么?团队发展如何?
A(Orange):公司在去年 12 月成立,当时就拿到了第一轮投资,到现在大概 9 个月。ListenHub 在 5 月 19 日上线,而在 4 月份团队才完成核心组件。春节前团队只有 3 个人:CEO、CTO 和一名后端。
一开始想依靠 AI Coding 来解决前端和设计的问题,但发现效果不理想,最终还是招了前端和设计师。团队在“缺什么招什么”的原则下逐步扩张,到 8 人时完成上线。
目前团队已发展到 15 人,同时在做下一个大产品。ListenHub 本身发展良好,本月 ARR 突破了 10 万美金,对一个商业化刚起步的团队来说,这是一个重要的里程碑。成就感来自用户的真实需求与认可,许多传播完全依靠社区朋友的口碑相传。
生姜 Iris:厉害!其实这也说明 ListenHub 已经找到了 PMF。刚刚那些真实的用户场景就是最好的证明,用户真的喜欢、愿意留下来。我觉得现在很多创业者都太着急了,总想着两个月催一个产品出来,再花一笔钱去投放。我个人并不支持这种方式。相反,像橘子老师这样,用很扎实的用户案例,把产品亮点和价值传递出去,让大家能够迅速 get 到,这才是更健康的路径。尤其是你们在资金有限的情况下,完全没有大规模投放,全靠社区朋友们口口相传去传播,这种增长才是真正的 PLG。
Q(生姜 Iris):您觉得创业过程中最大的痛苦和最大的快乐分别是什么?
A(Orange):一开始最痛苦的,其实是成立公司这件事。原以为只要注册一家公司,结果实际要搭建一整套复杂架构,前前后后要成立六家公司,每一步都要走流程,几乎每一个环节都能卡住人。
在这个过程中我才明白,很多规则看似是死的,但只要找到对的人,规则就不再是规则。
后来参加了红杉对 CEO 的培训,收获很大。那段时间让我真正了解了什么是创业、投资人是怎么想的,以及退出机制是什么。之前我常常疑惑:为什么见了那么多投资人,没有人投我们?后来才知道背后因素特别复杂,有美元基金和人民币基金的分歧、出资方的立场等等。两边互相矛盾,创业者夹在中间,基本就是“谁给钱就听谁的”。
其实没有绝对的路线,只是有一点不好:如果公司特别爆火,树大招风,会招来麻烦,但大部分团队并不会受到那么快的关注。
最大的快乐是团队。我们团队之前几乎没有人共事过,完全是 fresh start,要在这种情况下学会互相信任,其实很难。比如我和联创,去年 12 月刚开始的时候,几乎天天吵,一个月吵下来,慢慢才开始认可对方,一年多下来,才开始建立起信任。
招人的过程中,我们一开始想找熟人,后来发现并不一定合适,还是要找到真正匹配的人。现在团队氛围非常好,人人都是产品经理,很多逻辑和方案是工程师们自己想出来的。我没时间写 PRD,技术就能自己接手,产出很棒。能遇到这样的团队,我非常感激。
还有就是产品上线。上线后大家帮忙转发、使用,口碑很好。商业化后,用户的支持也超出预期。国内一般的付费率可能是千分之几,我们的付费率能做到百分之几,这个数据让我很惊喜。只要收入再涨几倍,我们就能 break even 了。对一家创业公司来说,这意义重大。有钱能解决很多问题,这点让我觉得很踏实。
Q(生姜 Iris):您怎么看待硅谷创业和国内出海创业的区别?各自的优劣势是什么?
A(Orange):以我自己有限的经验来说,硅谷的投资人非常看重创始人能否讲好一个故事。这个故事不只是包装,而是要体现你对问题的深刻思考。如果没有长期的信任感,故事就没人信。而且语言能力很关键,如果表达不到位,也会让人觉得不够可信。
所以很多团队会先在国内拿到基础资金,再去考虑硅谷融资,这是很合理的路径。硅谷投资人往往更看重 PMF,但要做到这一点,你本身就需要钱去启动,很难直接从美国拿到。通常前两轮在国内拿钱,是大多数创业者会走的方式。
另外,PMF 本身是分国家的。比如在日本做出来了,在美国未必成立。如果死磕美国几年,可能不如先把日本市场做好。创业不是按时间表推进,而是要根据用户真实反馈来调整节奏。你能掌控的是自己努力的进度,用户怎么看你是没法控制的,必须不断通过反馈去强化学习。
生姜 Iris:是的,我特别同意。其实硅谷的要求是更高的,很多创业团队会觉得去硅谷好像更容易,其实并不是。
Q(生姜 Iris):大家常说创业要回答三个问题:使命、愿景和价值观。您能分享一下吗?
A(Orange):我和联创在最初有一个共识:我们都不喜欢刷短视频,更倾向于 B 站这种内容,因为它不用不断抢夺注意力。我们想做的事情,是创造一些真正美好的东西,而不是靠消耗用户注意力来赚钱。
长期来看,我们更相信“科技向善”。产品要对人类和个体身心健康有益,这是我们坚持的方向。选择音频赛道,就是因为它是一种陪伴。视频的核心是带你进入另一个世界,而音频更多是在你健身、通勤、无聊时,安静地陪着你,不会强行占据你的全部注意力。
所以我们希望做出世界上最好的声音陪伴产品。借助 AI 的力量,和用户建立一种健康的关系,不希望大家沉迷其中,也不希望被信息流绑架。我们相信,总有一天人类会意识到,短视频并不是最好的选择。
Q(生姜 Iris):很多人说创业就是在创造一个理想世界。刚才从您“科技向善”的阐述里,我感受到很强的力量感。那在您眼中,ListenHub 的“终局”是怎样的?您想创造怎样的理想世界?
A(Orange):我们的大目标,是打造一个可以交互的声音陪伴产品。
但要真正做出这样的产品,需要解决两个关键问题:
第一,内容质量。生成的内容必须足够好,不能比真人创作差,否则用户没有理由用你。
第二,交互能力。系统必须能理解用户的语音输入和情感,并给出回应。只有“输入理解”和“输出生成”都做到位,才可能真正形成互动。
对创业公司来说,资源有限,不可能一开始就把所有资金砸在最终产品上。所以我们选择从 ListenHub 起步,把它定位成一个帮助创作者生产高质量音频内容的工具。通过这个过程,我们既能服务创作者,也能积累方法论和技术,把这些沉淀下来,未来可以作为 Agent 融入终局产品。
所以 ListenHub 的使命有两层:一方面,它要养活公司,提供现金流,支撑我们去做更大的事;另一方面,它要成为每个创作者的声音工具,降低音频创作门槛,真正帮到大家,同时也推动我们往前走。
生姜 Iris:我特别期待 ListenHub 的发展,尤其是它的全球化潜力。它不仅能连接全球的创作者,还能让大家用声音带来有温度的思考和内容。这就是 ListenHub 的独特价值。
以上就是橘子和生姜Iris的部分对谈内容。直播最后,橘子还对观众的一些提问做了详细解答,感兴趣的小伙伴们欢迎移步视频号查看回放~
在这场交流里,有一个让我印象很深的故事。
FlowSpeech 的灵感来自一位 80 岁的美国老人,他因为长期肺纤维化和几次中风,已经失去了说话的能力。
但即便如此,他依然坚持运营着一个 4000 多人的病友社群。借助 ListenHub,他用 AI 生成播客内容,继续在社区里发声,陪伴并帮助了无数病友。
也正是因为这个故事,橘子和团队才决定打造一个“AI 嘴替”FlowSpeech,能帮人读网页、讲 PPT、翻译外语,甚至让失语者用自己的声音继续和家人沟通。
ListenHub 想要做的,不只是一个生产力工具,而是期望能够更多地发挥「科技向善」的力量,把技术真正带进人们的生活,带来更好的改变。
这正是「鹿演」栏目希望持续做的事:让更多有温度、有创造力的 AI 项目被看见、被传播、被使用。
如果你也在做这样的项目,欢迎来报名鹿演,让更多人听到你的故事。
🔗 复制链接到浏览器,或点击「阅读原文」投递项目:
https://waytoagi.feishu.cn/share/base/form/shrcnkHy8ypQDYaDnozLViM9Uyf
