MacTalk - 微信公众号 11月11日 17:39
Huxe:AI 音频伴侣,个性化信息获取新方式
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章介绍了 Huxe 这款 AI 音频 App,它能够将用户的邮件、订阅的科技新闻、AI 行业动态等信息整合,生成一档个性化的“私人电台”。作者认为,相比听书,Huxe 这种信息密度适中、真人(AI 扮演)对话式的播客形式更易于接受。Huxe 的创始团队来自 Google,曾参与开发 NotebookLM,他们发现用户偏好“听信息”,故而创立 Huxe,旨在过滤和组织世界的声音。App 支持中文,并能与用户进行互动,提供 Live Station 和 DeepCast 两种模式,前者侧重实时更新,后者则进行深入讲解。Huxe 集成了 ASR、NLP、TTS 技术,通过 LLM 动态生成对话式音频,并可关联邮箱、日历等,成为实时的知识接口。尽管目前在国内使用尚不稳定,但 Huxe 在 AI 语音交互领域开辟了“音频计算”的新路径,专注于信息整理、知识消费和轻交互,有望成为“帮你听懂世界”的伙伴。

🎧 **Huxe 打造个性化 AI 音频伴侣**:Huxe 是一款创新的 AI 音频 App,通过绑定用户的邮箱、订阅源等,能够将海量信息整合成一档定制化的“私人电台”。它能实时播报早晚间新闻、科技动态、行业资讯,甚至中美科技竞争的重大事件,为信息输入提供了一种高效且易于接受的方式,尤其适合在通勤等碎片化时间场景下使用。

💡 **源自 Google 团队的创新理念**:Huxe 的核心团队来自 Google,曾是 AI 笔记工具 NotebookLM 的重要开发者。他们在构建 NotebookLM 时观察到用户对“听信息”的需求,并认为 AI 应帮助人们过滤和组织信息。Huxe 的创立正是基于这一理念,旨在将“声音理解”作为 AI 的新方向,专注于信息整理和知识消费,而非成为一个全能助手。

📻 **多样化的音频内容生成模式**:Huxe 提供两种核心内容生成模式:Live Station 侧重于对特定主题(如竞争对手、公司事件)的持续追踪和实时更新,形成“常驻电台”;DeepCast 则能根据用户需求进行深入讲解和结构化讨论,并支持收听过程中的追问和互动,提供更系统化的理解和学习体验。

🚀 **技术驱动与未来展望**:Huxe 集成了先进的语音识别(ASR)、自然语言处理(NLP)和语音合成(TTS)技术,通过 LLM 动态生成自然流畅的“对话式音频”。它将音频从简单的输出渠道升级为实时的知识接口,预示着“音频计算”的未来方向,即 AI 不仅能听内容,更能理解上下文、用户需求,并提供个性化的信息服务。

原创 池建强 2025-11-11 12:03 北京

我以前有尝试听书,比如通勤的时候打开微信读书的听书功能,有很好的 AI 声音为你读书。结果听完之后,翻开书再看,发现听过的部分几乎没什么印象。听播客就还好,当然播客本身也没文字版,忘了也不知道。

我的推断是:书的信息密度更大些,听着听着就走神了;播客的优势是真人讲人话,另外信息密度低一些,本来也是听着玩,就没这种“忘却”的感觉。

听不了书,那每天通勤的时候除了听音乐和播客,还有什么选择么?

我最近在听 Huxe,一款 AI 音频 App,我个人以为,这是个非常有趣的创新。

我每天早晚大概有一小时到一个半小时在开车通勤的路上,由于我每周都要输出大量的文字,包括科技产品和 AI 技术的内容——最近写了 MiniMax M2、Google AI Mode、钉钉千万热行技术、7nm芯片、阿里云和百度云等——这些都需要大量的信息输入。

如何在通勤这段时间里获取高质量信息呢?我发现了这款产品:Huxe。

首先我把 Huxe 和我的 Gmail 邮箱绑定,早上打开是早间新闻,晚上打开是晚间新闻,它会把我的邮件摘要、订阅的科技新闻、AI 行业动态,甚至中美科技竞争的重大事件,都串联成一档“私人电台”,在我打开的那个瞬间,实时更新,生成一档音频节目,还支持中文。

主持人是两个 AI 男女,声音温和自然,语气像是在和我聊天。听的时候我还能按住下方的音频按钮,加入聊天。听到我的问题,它会中断播放,和我聊完再继续节目主题——就像开了一档属于自己的圆桌派。

显然,这不是墨问里的听笔记功能。Huxe 想做的是个人音频伴侣(或个人电台)。我一直都很喜欢产品的音频特性,墨问里也有很多——比如 AI 语音笔记、语音转文字、语音评论等等——所以我对相关的产品很感兴趣。

事实上 Huxe 这个产品背后的故事也很好玩。

1

Huxe 的创始团队可不是一般人儿,他们都来自 Google 公司,核心成员是打造 AI 笔记工具 NotebookLM 的 Raiza Martin、Jason Spielman 和 Stephen Hughes。现在 NotebookLM 几乎是 Google 最火的 AI 工具之一,近半年活跃度暴增。

他们在构建 NotebookLM 的过程里注意到一个现象:很多用户更偏好“听信息”而非“看信息”,尤其是内容需要频繁更新、碎片化信息繁杂的时候。

Martin 就说过:“AI 不该只是生成文本,它应该帮人过滤和组织世界的声音。

但是在大公司的体系里,想推进类似的想法还是挺麻烦的,何况 NotebookLM 已经风生水起,炙手可热。几个人一商量,咱还是自己干吧。于是 2024 年底,他们离开 Google 创办了 Huxe:仅用一个月时间就做出了最小可用版本,半年后上线了 App Store 和 Google Play,

我很早在他们的 discord 频道拿到了邀请码,但最初产品还不完善,bug 多,只支持支持英文音频,我就没用起来。后来他们在 2025 年中完成了 460 万美元种子轮融资,投资人里包括 Figma CEO Dylan Field 和 Google 首席科学家 Jeff Dean。

产品逐步完善,也开始支持中文节目,于是 Huxe 重回我的视野,最近用起来了。无论是产品特性还是信息的新鲜度,都给了我不少帮助。

2

那么,Huxe 是什么呢?

从功能上讲,Huxe 是一个基于 AI 的音频信息平台。它的几项核心能力包括:

个性化的音频简报:每天早晨,Huxe 会扫描用户的邮件、日历、订阅源,自动生成一个十分钟左右的语音播报——像是你的私人新闻电台。前提是需要你授权访问邮件和日历,自己设置一下订阅提示词。

用户可自己创建自定义 AI 音频内容,其中又分为 Live Station 和 DeepCast:

Live Station 侧重持续跟踪主题的实时更新,DeepCast 则根据用户的需求进行深入讲解,同时可以与用户互动讨论。

两者的核心差异在于使用场景与信息流的交付方式。

Live Station 像是你为某个主题开设的“常驻电台”,一旦设定关注点(比如行业竞争对手、特定公司或事件),它会持续拉取相关动态,你每次打开都会收到最新音频更新,偏向实时、连续、流式的资讯追踪。

DeepCast 更像一档按需生成的深度节目,你给出一个问题或话题,它会检索多源信息、整合与分析,生成一段结构化的播客式讨论,并支持你在收听中追问、换视角、继续深挖,偏向系统化理解与互动学习。 ⁠

同时,Huxe 在 Discover 板块会为你提供各种类型的实时电台(Live Station),比如新闻、科技、AI、大公司、科学、健康等等。你可以通过类别或搜索找到自己感兴趣的电台。甚至可以直接订阅 x.com 和 reddit 上的内容。

用 Huxe 产品经理的语言说,Huxe 正在构建一个“听觉化的信息浏览器”。

3

从技术上看,Huxe 集成了语音识别(ASR)、自然语言处理(NLP)和语音合成(TTS)三大核心模块。它并不是传统音频的流式输出,而是通过 LLM 动态生成“对话式音频”。AI 不仅要理解上下文、抓取重点,还要判断语气、情绪和节奏,让听感自然流畅。

查了下资料,发现 Huxe 并没有公布底层模型,也没有说明是否使用 GPT、Claude 或 ElevenLabs 的语音引擎。简单推测一下,Huxe 应该是在后端采用 NLP 摘要生成 + TTS 模型融合的方式,并结合用户兴趣建模算法进行内容筛选。

Huxe 的“数据连接”似乎成了国外类似软件常规做法:Huxe 能关联你的邮箱、日历甚至 Slack 会议内容,在你开会前自动播报相关邮件摘要。在这个场景里,音频不再只是“输出渠道”,而变成了一个实时的知识接口。

Dia 浏览器和 Atlas 浏览器也能做类似的事情,不过是文本形式。

Huxe 目前在国内使用还有不稳定的地方,比如音频的卡顿,中文的流浪度等等(估计海外用户体验会好一些),不过这些都是可以解决的技术问题。趋势是,Huxe 在用产品押注 AI 语音交互这个领域。

Huxe 的风险是:当 Gemini 或 ChatGPT 把语音助手系统级集成到操作系统里,它是否还有独立存在的空间?

我想,其中的机会可能在于,Huxe 的方向更加垂直:专注在信息整理、知识消费和轻交互上。Huxe 没有试图成为一个万能助手,安静地做一个“帮你听懂世界”的小伙伴,不也挺香吗?

在我看来,Huxe 的真正价值是,它开辟了一条“音频计算”的路径。过去几年,我们经历了图像生成、文本生成、视频生成,如今,AI 也在进入“声音理解”阶段。未来的音频产品,可能不再是“听内容”,而是“听上下文”——它能理解你是谁、在做什么、还有,你需要听什么。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Huxe AI音频 个性化信息 智能助理 内容消费 音频计算 AI Audio Personalized Information AI Assistant Content Consumption Audio Computing
相关文章