Z Potentials 前天 23:27
AI Agent重塑Excel,掘金亿万级市场
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

CambioML创始人Rachel Hu分享了AI Agent在重塑Excel领域的应用和创业思考。她认为,大模型厂商应专注于‘最后一公里’的接入,提供真正让用户省时省钱的工具。CambioML的产品定位是‘电子表格领域的Gamma’,通过AI Agent自动清洗数据、转换非结构化信息、生成报表和图表,并确保每一步都有原始数据或公式的支撑。文章探讨了AI Agent在Excel领域的应用前景、技术难点、竞争格局以及创业公司的理性选择等关键问题。

📊 CambioML的AI Agent专注于电子表格领域,通过自动化数据处理、分析和可视化,帮助用户节省时间和成本。

🔧 产品定位为‘电子表格领域的Gamma’,旨在重新定义Excel的工作方式,提供更智能、高效的表格处理工具。

💡 创业公司应依托大厂的基础模型,专注于解决‘最后一公里’的问题,而不是从头构建整个解决方案。

原创 Z Potentials 2025-10-25 23:02 北京

AI Agent重塑Excel,如何用新技术掘金亿万级市场?

图片来源:受访者提供

12岁在机房里写下第一个RPA自动化脚本开始,Rachel的职业轨迹几乎始终与“数据”和“智能”交织在一起。她既是那个在网页比赛中用RPA脚本给自己投票的小女孩,也是后来在基金公司做量化分析、用代码驱动财务报表的年轻实习生,更是站在Amazon Web Services机器学习实验室一线的科学家。横跨学术、金融与科技巨头的经历,让她兼具科学家的理性和创业者的务实。当大模型行业在全球范围内沸腾,她决定躬身入局,开启全新的创业征程。

入局之后,Rachel对方向的选择有自己清醒的判断。“大厂拥有更高质量的数据、更庞大的研究团队、更强的基础设施,像Gemini那样的模型在成本上甚至可能比GPT-4低五倍。创业公司无法在模型层面和他们硬碰硬。”

“模型更像电力。”Rachel用了一句极具穿透力的比喻。百年前,每一家电器制造商都想做自己的发电厂,但最终,真正的价值来自谁能在电力基础上造出更节能、更好用的产品。她认为,大模型行业的发展也将遵循同样的路径。巨头负责“发电”,创业公司则要去完成“最后一公里”的接入,提供真正让用户省时间、省钱的工具,做好用的“电器”。2023年,她和合伙人离开AWS,拿到Y Combinator的录取信,正式创立CambioML。

刚起步时,他们也曾想从底层做起,开发大模型微调工具。但在多轮产品迭代和用户访谈后,他们发现真正的需求不在科研或调优,而是在被Excel折磨的普通用户身上——90%的非技术人群。她的产品并不是为精通VBA的分析师服务,而是为那些每天被格式混乱、公式难写、报表催交困扰的普通人解决“繁琐小事”。

这个看似“普通”的切口,背后是一个被忽视已久的巨大市场。全球约有7亿人每月使用Microsoft Excel,约9亿人活跃在Google Sheets上。围绕Excel诞生的插件生态,年营收以几十亿美元计,但它仍是一个“非性感”的领域——没有酷炫的界面,没有高门槛的算法,甚至很多插件至今只能运行在Windows端。这正是CambioML选择扎根的场景。

“我们要做电子表格领域的Gamma”这个方向。Rachel如是说,就像Gamma重新定义了PPT一样,他们希望用AI Agent重新定义Excel的工作方式——自动清洗数据,将非结构化信息转换为结构化结果,自动生成报表和图表,并确保每一步都有原始数据或公式的支撑,而不是凭空“幻觉”。

这不是一个轻松的创业方向。Agent会因幻觉出错,而商业决策往往牵涉真金白银。所以在很多早期的内部测试里,他们不得不一遍遍追踪Agent的决策链路,找出潜在错误来源,并确保用户能“看懂”系统的每一步推理。只有这样,用户才会真正信任产品。去年,他们已经在石油公司为客户开发AI智能钻井Agent。最近,他们的data agent拿了huggingface DABStep榜单的第一,比OpenAI Agent准确率高3倍。(source:https://huggingface.co/spaces/adyen/DABstep)

这个看似小而具体的赛道,其实远比想象中辽阔。她判断,这个领域的ARR上限可能达到数亿美元。“PPT的MAU用户规模在5亿左右,而Excel更大,商业价值也更高。围绕Excel的市场,会诞生很多家好公司。”在她的叙述中,没有“颠覆世界”的豪言壮语,也没有“下一代通用智能”的口号。更多的是一套被验证的用户逻辑:谁能帮人节省时间、节省成本、提升效率,谁就能活下来。模型只是手段,解决问题才是目的。

创业之路并非光环加身,而是靠一次次“自学”与“动手”叠加起来的。她偏爱“潜力股”员工,而不是履历耀眼的明星。“我更看重交付质量,而不是名校背景。”她笑着说。

Rachel和她的团队没有在“造电厂”,他们在铺设最后一公里的电线。那些最不被注意、最琐碎的Excel表格,正悄悄孕育着一门亿万规模的生意。

此次,Z Potentials对话了CambioML创始人Rachel Hu,她与我们分享了关于Agent应用和创业的思考。enjoy~

我们的目标用户其实不是那些精通VBA和宏的专业金融分析师,他们本来就会编程,不需要我们的服务。我们真正服务的是那90%的非专业用户,他们只是希望用Excel辅助决策。

创业公司应该更多地依托大厂的基础模型,专注于解决“最后一公里”的问题,而不是从头构建整个解决方案。随着接触到越来越多Excel用户的需求,我们逐渐演化出现有的产品形态:一个能够清洗数据、将非结构化数据转换为结构化数据、同时保持高准确率和低成本的AI Agent。

许多创业公司都是围绕Windows版本的Excel来提供服务的——甚至连Mac版本都没有,且围绕Excel开发的各种插件总价值加起来可能高达好几亿美元。每年能产生几十亿美元的营收,相当惊人

我们不可能第一天就实现L5级别,而是要不断覆盖各种边缘情况。在某些业务场景中,我们可以确保每一步、每个数字都有公式或原始数据支撑,而不是凭空猜测。

长期来看,竞争终将回归到成本。大模型就像电力,放到百年前,大家都是电器制造商,而大模型厂商则是发电厂。如果我们的产品能更省电、更节能,长远来看自然会赢得用户青睐。

核心是用户激活和留存率,即每周活跃用户的增长和用户粘性。此外,我们的关键指标是用户对处理结果是否满意,以及是否会提出后续问题,这才能真正说明产品是否切实帮助用户完成了任务。

我相信这个行业完全有可能实现从千万到数亿美元的ARR,行业天花板非常高。Gamma服务于PPT场景,拥有约5亿用户,而Excel的用户规模更大,且由于用户日常处理的是与资金、数据直接相关的工作,其商业价值天花板实际上更高,我认为这个领域将会诞生多家优秀的公司。

每个学校学生都有好也有一般的,作为创始人,我现在更青睐那些来自非名校、但交付质量极高的“潜力股”,而不是那些仅凭名校或大厂光环而“溢价”过高的人。

01 Excel插件生态的隐藏亿万生意,CambioML用AI Agent重新定义 

图片来源:受访者提供

ZP:很高兴邀请到Rachel来到ZP做客。首先请介绍一下你的个人经历,可以从读书时期开始,经历过哪些关键节点,以及在各个阶段的积累。

Rachel:说实话我的个人经历挺普通的,没有特别华丽的背景,我在青岛长大的,从小普普通通,没有太多一线城市的视野。我父亲是程序员,所以我比较早就接触了计算机,小学三四年级就开始经常去他们的机房。那个年代算是比较早的。我父亲当时在一家银行国企,负责管理整个青岛市乃至山东省的银行系统,所以我整体上还是耳濡目染了一些编程知识,12岁的时候还去参加了一个计算机比赛,自己做了一个RPA。

ZP:你自己开始做RPA大概是哪一年的事情?

Rachel:2007年,北京奥运的前一年,当时青岛作为奥运会帆船比赛的举办地,全市都在迎接奥运,举办了一场计算机比赛。比赛要求每个学生设计一个简单的网页,可以点击互动,并展示一些漂亮的画面元素。其实我做这个RPA的初衷是为了给自己投票,因为那个比赛是全市性的,每个参赛者提交一个网页作品后,需要进行公开投票。我就想怎么才能赢过其他小朋友,那就只能自己给自己投票了。当然是在我爸爸的帮助下完成的,最后我的得票数是第二名的十倍以上。不过我父母的教育理念并不强求我一定要走码农这条路,所以我本科并没有学计算机,尽管小时候做过不少这类小项目。我本科读的是金融数学,因为我父母都在金融行业,我从小就在那个环境里长大。

ZP:可以谈谈你在加拿大的求学工作经历吗?

Rachel:我本科在加拿大就读,期间做了几段实习。19岁本科期间我加入了一家东海岸的创业公司,主要做私募股权。公司规模非常小,只有两个全职员工:负责人和我。他负责系统设计,我负责处理各类数据,这也成为我职业生涯的起点,从此与数据结缘。我每天处理公司交易后台的数据,记录交易过的债券、股票等信息,并制作自动化报表。这样每天早晨七点半,CEO和CIO就能收到前一天的财务报告。那段时间用的还是C#,现在看起来已经过时了,但它确实把我带进了这个行业。

后来我20岁时去了加拿大养老基金,他管理规模约5000亿加元,主要负责投资组合优化和风险管理。但大公司的工作对我而言有些枯燥,只能看到业务的冰山一角,所以没有长期留在那里,完成了这两段实习。

22岁时我搬到旧金山,加入一家初创公司担任数据科学家。那时主要训练一些小型的语言模型,参数规模大概在3亿到5亿之间,用一台电脑就能完成训练。当时的NLP模型更多用于分类任务,与现在无监督的大语言模型很不一样。

ZP:什么时候想创业的?

Rachel:创业的想法其实很早就有了。我从19岁加入第一家创业公司开始,就发现自己很喜欢创业公司的氛围。不过现在这个具体产品和方向是最近两年才确定的。我在伯克利读硕士时参加了ACE俱乐部,当时认识了一群志同道合的朋友,现在这群朋友大多都在创业,看到大家各自在领域里努力,我感到很欣慰。当时我们都还比较青涩,毕业后有人加入创业公司,有人去了大厂,经过三四年的行业积累,现在不少人都在这一波浪潮中开始了自己的事业。

ZP:目前这家公司是什么时候正式成立的?

Rachel:2023年成立的,当时我申请了YC,很幸运地被录取了,于是在6月份辞去工作开始创业。当时我的联合创始人,是我在Amazon的同事,我们都在AWS的机器学习部门担任科学家,共事过三年。我们一起去参加了YC的面试,然后一起开始了这段创业。

ZP:当时是基于什么样的背景决定申请YC并创办这家公司的?

Rachel:我们实际上申请了两次YC。第一次是在2022年,那时大模型还没有现在这么火热,OpenAI也还没有推出ChatGPT。不过当时在AWS,我们内部已经在做大模型相关的工作了。因为当时GPT-3的出现让我们感到非常震撼,大家都开始做一些业余项目。我本人在AWS期间也做过不少业余项目,但那时候AI技术还不够成熟,总感觉缺少点什么,不像现在这样稳定和可靠。另外,作为科研背景出身的人,我们的技能组合其实比较有限,纯科研人员创业并不是最优选择,纯粹的科学家可能更适合去OpenAI、Anthropic这类大型实验室。

ZP:你提到纯科研背景创业存在短板,能否具体谈谈这方面的思考?

Rachel:我认为科研人员的技能组合确实比较局限。要打造一家成功的创业公司,需要在多个方面都没有明显短板,模型要优秀,后端工程要扎实,前端UI/UX要到位,产品设计要合理,增长策略和市场进入要有效,甚至面向企业客户时销售能力也要跟上。这些都需要完全不同的技能组合,而科研能力只是其中非常专业且应用场景有限的一部分。通过这两年的创业实践,我才逐渐学会如何打造好产品、实现用户增长、制定市场进入策略,这些能力都需要时间积累和实践磨练。当然,我们的优势在于对AI技术边界有更清晰的认识,这算是一个小小的额外优势。

ZP:你们是如何找到当前产品切入点的?现有产品的主要功能和目标用户是什么?

Rachel:我们现在的产品定位是“电子表格领域的Gamma”——Gamma主要服务于PPT场景,而我们则专注于成为电子表格的AI Agent。产品涵盖三大核心功能:数据接入与清洗、数据分析、数据可视化,完整覆盖数据分析的全流程。我们致力于承接Excel或电子表格中的各种分析需求,就像一个初级的分析员一样。

我们的用户遍布全球,主要分为几类:首先是中小企业主,他们需要进行文档清洗、格式转换并快速做出业务决策,涉及的行业非常广泛。最初我们预期用户会是专业分析师或初级数据科学家,但实际发现更广泛的用户群是这些小型企业的经营者。比如,一家营销机构可能会提出需求:“我有一个PDF文件,能否帮我转换成特定格式的CSV,并导入到内部系统中?”这类需求非常普遍。我们的目标用户其实不是那些精通VBA和宏的专业金融分析师,他们本来就会编程,不需要我们的服务。我们真正服务的是90%的非专业用户,他们只是希望用Excel辅助决策。从我19岁在创业公司开始,就经常处理Excel数据清洗工作,传统上这需要聘请实习生或初级分析师花费数小时甚至数天才能完成。但在AI帮助下,只要数据源清晰,通过我们的Agent几分钟就能生成所需报表。

ZP:公司从2023年申请YC至今经历过哪些重要的方向调整?

Rachel:回到刚才关于科研人员局限的话题。我们起步时选择了一个开源方向,专注于大模型的微调软件。当时在大模型兴起初期,AWS期间我们认积累的模型微调经验对其他企业会有价值,于是开发了基于人类反馈的强化学习开元平台,目标客户是想要微调模型的科研人员。但当时时机不太理想:2023年9月正值全球GPU短缺,客户反馈说虽然很想使用我们的服务,但无法获得足够的计算资源。现在回想,当时的基础设施和数据处理环境都尚未成熟,那个方向确实不是一个最合适的选择。

至于说是不是一个好产品?我认为再过几年可能还会有机会,因为通用大模型的成本始终会很高。在特定垂直场景中,定制化模型仍然有存在的必要。比如我们现在的Agent,成本可能只有传统通用AI Agent的十分之一,因为我们通过专业化实现了成本优化。我们使用自己微调的专用模型,针对图形界面信息提取优化的视觉语言模型。这类任务如果使用大模型可能需要处理上万个token,但用我们的方案成本会低很多。我认为这是专业化Agent相对于通用Agent的核心优势——成本和速度。

发现微调平台的用户采纳率不足后,我们决定用自己的技术训练一个专用模型。去年六七月份,我们推出了首个自研的文档指令模型,专门处理PDF、Word、PPT乃至图像等多种格式的文档。这听起来有点像OCR,但有本质区别。传统OCR模型很小,但它基于字符识别,缺乏语义理解能力,无法区分像"0"和"O"这样的字符。而视觉语言模型虽然稍慢,但具备语义理解能力,能准确识别这类易混淆字符。这就是为什么我们的小模型能比OpenAI更快且更准确。当时这个赛道还不算拥挤,我们顺利获得了不错的客户基础,最高峰时每周处理数百万次请求。但随着开源视觉语言模型大量涌现,市场竞争迅速加剧。

特别是Gemini推出Flash版本后,它的速度快、准确率高且成本低廉,让我们意识到在模型层面很难与大公司竞争。他们拥有更庞大的研究团队、更高质量的数据和更充足的计算资源。像Gemini基于TPU的成本优势可能达到OpenAI的五分之一,这种成本优势是压倒性的。因此我们认识到,模型可以作为降低成本的手段,但不应该成为创业公司的核心产品,除非是大型厂商不会涉足的特定领域。

ZP:这个认知转变过程花了多长时间?

Rachel:基本上是被市场教育出来的。我们从去年11月开始转向开发现在的Agent产品,之前大约八九个月时间都在专注于模型研发。模型运营是非常重操作的工作,而这类业务往往利润微薄,我个人也不太偏好这种运营密集型模式。

ZP:意识到不能以模型为核心产品后,你们如何重新定位核心产品?

Rachel:关键是要贴近最终用户的实际需求。比如我们开发视觉语言模型时,很多金融客户的需求其实非常具体——就是把PDF转换成Excel。但即使用最好的模型,也很难达到99%的准确率。我们后来的思路是,创业公司应该更多地依托大厂的基础模型,专注于解决“最后一公里”的问题,而不是从头构建整个解决方案。随着接触到越来越多Excel用户的需求,我们逐渐演化出现有的产品形态:一个能够清洗数据、将非结构化数据转换为结构化数据、同时保持高准确率和低成本的AI Agent。最近,我们的data agent也拿了huggingface DABStep榜单的第一,比OpenAI Agent准确率高3倍。DABstep 包含 450 多个真实业务的数据分析任务,旨在评估最先进的 LLM 和 AI 代理的能力。

02 Excel的7亿用户市场:AI Agent掘金“决策科学”,挑战大模型幻觉与成本壁垒 

图片来源:受访者提供

ZP:当前产品所处行业的整体情况如何?

Rachel:我们这个行业垂直定位在AI Agent与电子表格的交叉领域。从横向看,AI Agent是近年来的热点,但很多用户其实并不清楚AI Agent具体指什么。简单来说,AI Agent就是能够智能使用各种工具的智能体。目前市场上的AI Agent大致可以分为几类:最广泛的是通用Agent,比如Manus、OpenAI Agent、Genspark等;第二类是垂直领域Agent,比如当前热门的编程Agent、客服Agent,或者面向特定工作流的Agent。在我们这个细分领域,主要是处理Excel或报表的Agent。

数据处理类Agent又可分为两类:一类像SheetZero、Hebbia、Paradigm等,主要服务于市场调研场景,帮助用户进行知识抽取并以表格形式呈现结果;另一类像我们这样,更专注于数据分析的全流程,包括数据读取、清洗、分析和可视化。这个赛道上比较知名的公司是Julius AI,他们刚融资1000万美元。他们的用户主要是学生群体,帮助解决数学作业或数据分析任务。而我们的客户更多是B端用户,处理日常业务中的Excel决策支持,比如车厂需要分析月度销售数据、成本结构或用户奖励等。我称之为“平民化”的非专业表格数据分析,因为这些用户通常不熟悉VBA等专业工具,他们只需要直观的可视化和分析结果来管理账目。

关于市场规模,全球每月使用Excel的用户约7亿,Google Spreadsheet的月活用户约9亿,这是一个相当广阔的市场。我昨天刚好和一位教授交流,他们最近开设了一门新课决策科学(Decision Science),课堂上使用我们的产品来做一个演示,他提到,这个行业中,许多创业公司都是围绕Windows 版本的 Excel 来提供服务的——甚至连 Mac 版本都没有,且围绕 Excel 开发的各种插件总价值加起来可能高达好几亿美元。每年能产生几十亿美元的营收,相当惊人。

ZP:能否具体谈谈,产品面临的主要难点是什么?AI技术又主要发挥了什么作用?

Rachel:从技术角度看,主要难点集中在三个方面:质量、速度和成本。为什么至今没有出现像Gamma那样出色的AI表格产品?本质原因还是质量不够,幻觉问题比较严重。这背后的逻辑是,大模型常常会“偷懒”。你可以把大模型想象成一个高中生实习生,他还是个孩子,总想着走捷径完成任务。在训练过程中,我们无意中让大模型学会了取巧,因为强化学习的数据来自人类,而人类天生就倾向于寻找捷径。这导致了大模型的幻觉问题,它会一步步推导,但为了节省成本,就像人类演化一样,它选择了一步到位的输出方式。

比如计算22×22,大模型可能直接给出答案,但其中存在错误概率。对Excel用户来说,数据错误是完全无法容忍的。对于Agent任务来说,质量准确性是核心难点。普通的工程任务可以通过单元测试来验证,但Agent最终输出的是一个结果,你很难证伪,需要投入大量精力去做评估验证。我们现在投入了巨大努力在做评估工作,确保Agent在完成一个可能包含数百个步骤的任务时,每一步都不出错。这里面有非常繁重的验证工作,不像其他产品那样容易测试。

ZP:你们如何确保Agent输出准确性这一点,能否展开讲讲你们的具体实现方法?

Rachel:我不认为有任何Agent能够完全避免错误,目前世界上还没有出现这样的Agent。逻辑很简单:如果有一个Agent能够完全正确,它就能证明其他所有系统有错误的,但这样的系统尚未出现。这更像是在做科学研究,目标不是一开始就建立一个能完全避免错误的工程框架,而是最大限度地减少错误,就像自动驾驶技术一样。我们不可能第一天就实现L5级别,而是要不断覆盖各种边缘情况。在某些业务场景中,我们可以确保每一步、每个数字都有公式或原始数据支撑,而不是凭空猜测。

ZP:在这个过程中,产品是否形成了数据飞轮效应?

Rachel:长期来看肯定有这种逻辑。本质上,人们使用Excel或进行数据分析的场景是相对有限的。比如一个主要场景就是辅助决策,决策通常是通过分析未来几种可能的情景来实现。这些情景的前提假设和后续计算公式,其实都有专业研究领域几十年的积累作为基础。但是从给定情景到做出未来决策,这里面包含了大量用户意图。如果你只看到10个用户的意图,和看到10万个用户的意图,其分布模式是完全不同的,所以数据规模确实会影响我们对用户意图的理解。

ZP:你会先选择特定的垂直场景或用户群体切入吗?

Rachel:我们去年确实尝试了垂直领域策略,巧合之下切入了石油行业,服务了几个石油行业客户。我们与一家石油客户深入合作,研究如何使用AI优化钻井过程。AI在基础科学领域确实有巨大的应用空间,我们为他们开发了一个AI智能钻井Agent,帮助他们优化钻井作业。在海上钻井,一天的成本就高达约300万美元,如果决策出错,一天就会损失这么多成本,因此他们需要非常及时、快速且高质量的决策支持。

不过就个人而言,与大型企业合作的速度还是太慢了。我个人的风格更喜欢快速迭代、获得更多反馈,从事更前沿的领域,而不是在一个行业里深耕并试图垄断整个市场。这也是为什么我现在在阿布扎比,虽然与当地石油公司有合作,但总体而言,这种模式不如产品驱动增长(PLG)让我感到兴奋。

ZP:下一步计划服务的客户群体有哪些?

Rachel:这是我们内部正在探索的,目前有几个可能的定位:大公司里的分析师,或者需要做决策的战略部门、财务部门,以及CFO下属的团队。这些人每天都要与Excel打交道,就像我当年实习时一样,面临着Excel运行缓慢、数据量大时容易崩溃等传统问题。至于具体如何帮助他们,还需要更多的产品迭代,我不会说我们现在的产品已经是最终版本,我们还有很长的迭代之路要走。

ZP:能否介绍一下目前行业的竞争格局?产品的核心优势和差异化定位是什么?

Rachel:这个问题其实与我们之前讨论的技术难点相关。除了质量之外,还有速度和成本这两个关键因素,从长期来看,成本无疑是最重要的考量。目前在这个领域,既有像我们一样专注于“AI分析师”的创业公司,也有微软这类大厂推出的Excel聊天机器人插件。与这些方案相比,我们的核心区别在于提供的是“Agent任务”,因为用户使用电子表格时往往不仅限于表格本身。他们可能需要整合多个PDF、电子邮件中的表格或其他内容,与现有数据结合生成新的报表和决策分析,这远超出简单插件的范畴。

因此,我们为每位用户提供了一个完整的工作站环境,给予充分的操作空间。我经常观察用户行为,发现当某些功能尚未完善时,用户会直接进入工作站环境进行操作,这反过来也为我们提供了宝贵的产品反馈。这种环境设置是我们的关键差异化点。大多数竞争对手,例如Julius,其运行环境局限于Jupyter Notebook或聊天界面,Jupyter Notebook在处理大规模数据时存在明显的性能瓶颈。而我们的方案是直接为用户提供一台虚拟机,配备4G CPU,能够处理任何规模的数据,甚至运行PySpark。你可以将其理解为一个拥有自己电脑的AI实习生,而不仅仅是一个软件或插件。

另一个重要的差异化因素是成本,长期来看,竞争终将回归到成本。大模型就像电力,放到百年前,大家都是电器制造商,而大模型厂商则是发电厂。如果我们的产品能更省电、更节能,长远来看自然会赢得用户青睐。

ZP:作为公司创始人,你最关注的北极星指标是什么?

Rachel:目前我们关注多个指标,毕竟产品还处于早期阶段。核心是用户激活和留存率,即每周活跃用户的增长和用户粘性。此外,我们还内部定义了一个“顿悟时刻”指标,由于我们的任务是Agent处理,用户平均停留时间超过30分钟,这与即时回复的聊天机器人完全不同。因此,我们的关键指标是用户对处理结果是否满意,以及是否会提出后续问题,这才能真正说明产品是否切实帮助用户完成了任务。

ZP:如果满分100分,你给这个指标的现状打多少分?

Rachel:我认为分数不会特别高,大概在四五十分左右,还有巨大的提升空间。主要问题在于,Agent任务的成本仍然偏高。尽管我们的成本已经比通用Agent低了十倍,但由于每个任务可能涉及600到800个步骤,累计成本依然可观,单个任务可能达到几十美元。另一方面,用户等待时间过长,并且每一步都可能出现微小错误。这些错误累积起来,最终结果可能与用户的期望相去甚远。因此,我们当前的重点是进行微观优化,逐步改进每个环节,并根据用户反馈持续迭代。

ZP:作为公司创始人,未来几年你最希望达成的目标是什么?

Rachel:长期来看,优秀的产品最终需要通过自身的年度经常性收入来证明价值。我相信这个行业完全有可能实现从千万到数亿美元的ARR,行业天花板非常高。Gamma服务于PPT场景,拥有约5亿用户,而Excel的用户规模更大,且由于用户日常处理的是与资金、数据直接相关的工作,其商业价值天花板实际上更高,我认为这个领域将会诞生多家优秀的公司。

03 创业者的理性选择:潜力股优于“溢价”人才

ZP:就像你前面说的,科学家创业并不容易,因为创始人需要非常全面的能力。除了产品和技术,还有哪些因素对公司成功至关重要?

Rachel:如果用一个词概括,就是用户的“信任”。为什么最终大家都倾向于使用OpenAI?因为尽管它偶尔也会出错,但在大多数情况下确实帮我们解决了问题,这种信任是需要长期建立的。构建信任涉及多个层面:如何实现增长、如何进行信息分发、如何引导用户上手、如何确保用户完成任务后能持续参与并再次使用等,这其中包含了大量关于市场进入策略的学问,也是我作为创始人这两年才开始深入学习的方向。之前在AWS工作时,很多事情是站在大公司的平台上完成的,其难度与作为创始人从头开始是完全不同的,不过这个过程也非常有趣。

ZP:我们的读者中有不少希望去美国创业的华人创业者,作为有相关经验的先行者,你有哪些经验或经历可以与他们分享?

Rachel:说实话,我现在可能有点“逆流而行”——当大家都涌向美国时,我反而更多地待在中东。我认为,如果从事To B的生产力工具领域,美国无疑是一个极佳的市场。但关键在于,你是否必须身在美国运营?我们可以举消费硬件领域的例子,比如像Plaud这样的产品,它在美国市场销售表现非常好,但团队并非在美国,只是专注于在美国进行市场沟通和运营。就个人而言,我在硅谷招聘时遇到了太多困难,这也是为什么我现在来到中东招聘,在这里招聘比在美国顺畅得多。

ZP:这一点非常值得展开讲讲。一些人可能对美国市场抱有某种“滤镜”,但未必了解实际情况。你能否分享一些只有亲身实践过才知道的真相?比如你刚才提到在美国招聘踩过坑,能否具体举几个例子?

Rachel我在硅谷待了9年,周围有很多大厂的朋友。必须承认,在我身处硅谷的那段时间,大部分大厂的work-life balance非常好,可能好到不太适合初创公司需要的那种“狼性”文化。当然,大厂内部也有非常优秀的团队,我认识不少出自大厂的优秀创始人,但如果是招聘普通员工,我通常不会优先考虑。

ZP:除了招聘,还有其他可以分享的吗?

Rachel:硅谷和YC确实有它们的红利,但并没有外界想象的那么夸张。我融资的时候发现YC出来的项目有时反而会被某些美国VC“鄙视”,他们会觉得YC的估值过高了。甚至有位斯坦福教授和我聊了一小时,其中四十分钟都在批评YC。这部分人的观点是,YC推高了硅谷初创公司的估值。听说现在这届的平均估值已经达到2000万美元,我们当时是1400万美元左右。YC对每个项目都是一样的,占7个点。这意味着三个月后估值就可能翻十倍,这正是被硅谷VC批评的原因。

ZP:作为一个创始人,回顾这段创业旅程,你最快乐和最痛苦的时刻分别是什么?

Rachel:创业本身就是快乐与痛苦并存的,而且是两个极端。可能早上还非常快乐,晚上就陷入痛苦,这很正常。快乐其实很简单,就像种下一棵小树,看到它今天发芽、长叶、开花。任何一件之前没做到的小事突然做到了,或者产品成功发布,甚至只是收到用户的一封感谢信,这些小事都会让人非常开心,这种快乐源于看到自己和产品的成长。

痛苦也很直接,缺人、缺钱、缺客户,缺乏大厂拥有的各种资源。客户在等待新产品,招聘却不顺利,看中的人选被大厂抢走等等,这些都是家常便饭。但总体而言,我收获非常多,非常享受整个创业过程。现在回想,甚至觉得应该更早两年从大厂出来创业,不必等到大模型技术成熟,但现在开始也不晚。

ZP:十年后,对公司和你最大的期待是什么?

Rachel:十年后,我当然希望公司能够上市。在学生时代,我想象创业的终点更多是被收购,尤其是在硅谷,收购是常见的退出路径。但真正创业久了就会发现,成功需要天时地利人和。我们这一代人都是时代的产物,当前这个时代有太多低效环节可以通过AI提升十倍甚至百倍效率,有太多事情可以做。我相信这个时代会诞生许多最终走向IPO的公司,而我个人对此非常乐观。

ZP:过去两年AI行业经历了疯狂发展,有没有让你印象最深刻的一件事或一个人?

Rachel:我印象最深刻的是那些“套壳”公司,并非指特定的某一家,而是这一类公司。它们不自己研发大模型,却能实现惊人的年度经常性收入。比如Cursor或Claude Code这类产品。它们在极短时间内就达到了5亿美元的ARR,增长速度令人难以置信。当时我还在专注于模型研发,看到这些不涉及底层大模型的公司能实现如此高的收入和增长,这在之前的硅谷是很少见的。而且这不是个别现象,是遍地开花。这让我真切感受到我们正处在一个新的革命时代,就像工业革命一样,新时代处处是机遇。

ZP:你最近有看到什么有意思的AI产品?

Rachel:作为一个产品负责人和科研背景出身的人,我对产品的要求比较高。现在很多AI产品只是发布一个等待列表,产品本身并不成熟,更多是为了获取免费用户进行测试。你看到的宣传片大多只是演示,真正能投入生产环境的极少。如果要我推荐,我会选择真正进入我们公司工作流程、并且让我比较满意的产品,可能最突出的就是Claude Code。

ZP:你们团队最常用的是Claude Code?

Rachel:是的,我自己和团队都在用。它是真正能融入生产环境的工具,我们甚至对它产生了依赖,并且愿意为之付费。我的观点是,雇佣三个熟练使用Claude Code的员工,可能比雇佣十个普通员工产出更高。这是一个真实落地并产生价值的用例,而目前大多数AI产品还停留在演示阶段,在很多实际场景中并不好用。当然,行业肯定存在泡沫,但一万个产品中总会有一个真正优秀的,对我们来说,真正能提升生产效率的工具才是我们愿意持续使用的。我们很早就开始使用Claude Code,当时大约在二三月份,它的早期体验并不完美,所以我们没有立刻形成依赖。但你能看到,短短半年时间,一个产品就能从充满漏洞变得令人依赖,这是我们这一代AI创业者面临的独特机遇。

ZP:作为Claude Code的早期用户,能否展开讲讲它从二三月份到现在主要在哪些方面进步了?另外,你们重度使用Claude Code,与Cursor或Devin等工具相比,你觉得它最主要的优势是什么?

Rachel:我们其实也很早就开始使用Cursor,甚至把它纳入了应聘者的面试环节,当时很多人还不知道Cursor。回到你的问题,Claude Code在早期版本功能并不全面,比如缺少一些便捷功能,像聚焦改进单个文件的能力。与早期的Cursor相比,Claude Code一个最大的亮点是它的自动导航功能,我不需要一步步点击确认,它可以自动执行,如果每一步都需要确认,我就得一直守在电脑前。

二三月份的时候,它感觉还像个业余项目,像是Claude内部几个人做的副业。但后来发现它确实非常原生、好用,与Claude生态紧密结合。特别是当Claude 3.5 Sonnet发布后,你能明显感觉到它的代码编写质量比Sonnet模型高出一大截。在Claude Code里,你可以近乎无限地使用Sonnet模型,只要你不过度使用。这种代码能力上的优势是明显的。我认为这也是大模型厂商自身的一个优势,他们自己生产大模型,分配给第三方“电器公司”的算力可能比较有限,但分配给自家应用的资源通常慷慨得多。

ZP:能否给我们的读者推荐一本你最近读过且印象深刻的书或文章?

Rachel:我之前其实非常喜欢读书,在疫情期间一年能读150到200本,各种类型的书都看。当时比较空闲,在大厂工作节奏没那么紧张。那时候我甚至疯狂到组织读书会,做了很多类似的事情,不过最近读书量没有那时候那么大了。上个月初我读了一本对我启发很大的书是本杰明·富兰克林的自传。无论是查理·芒格还是贝佐斯,这些人都非常崇拜本杰明·富兰克林,这让我对他产生了好奇。

这个人生活在18世纪,比我们早200年,但他的思想影响了好几代人。比如美国的货币,1美元上印的是乔治·华盛顿,而100美元上印的就是本杰明·富兰克林。在他那个时代,他绝对是真正的伟人,影响了从查理·芒格、巴菲特到埃隆·马斯克、杰夫·贝佐斯等一代又一代的企业家。

读他的生平经历,我发现他10岁就开始工作了,这让我思考,现代社会某种程度上限制了孩子们的潜力,我10岁的时候还在玩泥巴。他18岁就离开波士顿的家乡去了费城,因为不想再为哥哥工作,那一代美国人拥有许多令人敬佩的品质:勤劳、节俭、自律,与现在的美国人很不一样。他早年是个商人,30多岁就实现了财务自由,然后转向科学研究。这与我对自己的定位也有些相似,我本质上喜欢基础科学和研究,但得先解决吃饭问题。他后来从政,参与独立战争,在战争中扮演了类似今天Sam Altman的角色,不过他是为整个美国融资。他非常擅长写作,又从事报业,拥有强大的传播渠道,能够动员更多人支持事业。无论是打仗还是建教堂,人们都会来找他融资,他确实是位具有跨时代影响力的非凡人物。

ZP:最后一个轻松点的话题,你日常有什么兴趣爱好吗?

Rachel:创业前最大的爱好肯定是读书,每天至少花三个小时阅读。创业后,我更多转向保持身心健康的爱好,比如练习瑜伽。在加州时我还考取了瑜伽教练证书。此外还有游泳,疫情期间我在湾区组织了一个大型飞盘社群,大家经常一起玩飞盘,现在我的一些创业伙伴甚至员工都是当年打飞盘认识的。

Rachel团队在招募: 产品经理 (https://shorturl.at/StblH) 和 后端软件工程师(https://shorturl.at/9Q0Sm)。感兴趣的同学请点击链接报名。

请注意,此次访谈内容已经过精心编辑,并得到了Rachel Hu的认可。欲了解更多关于CambioML的信息,敬请访问其官方网站https://www.energent.ai。我们也欢迎读者通过留言互动,分享您对本访谈或CambioML的看法。

Z Potentials 将继续提供更多关于人工智能、全球化市场、机器人技术等领域的创业者访谈。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。

-----------END-----------

🚀 我们正在招募新一期的实习生

🚀 我们正在寻找有创造力的00后创业

关于Z Potentials

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI Agent Excel CambioML 创业 数据
相关文章
2018年-2023年欧洲移动出行创业公司种子轮风险投资额(附原数据表) ​​​
2023年Q1-2024年Q1亚洲天使与种子轮风险投资额交易量(附原数据表) ​​​
大模型公司开始在应用层争抢占位
前天听一个85后女企业家分享她的创业故事,重点讲了几次大的失败。深受震撼。 她08年接的第一个外贸大单,是个一百多万货值的单子。当时她刚入行不懂,跑工厂跟...
创业的一个milestone可能是 不主动跟人提自己的过往背景(大厂、VC之类)且觉得那不是一个加分项
薇美姿拼营销官宣2位代言人,创始人王梓权股权近期遭冻结
今天发现了一个很聪明的创业点子,特别适合正在送外卖的小哥。 在一些工厂的附近,路边摆摊,卖盒饭。一份12元,中午2小时可以卖100份,三个人合伙。一天收入120...
大家知道现在有个小生意很火爆吗? 自助台球室。 我有个朋友去年年初开了一家,租了个不临街的铺面3000元。24小时营业,四张桌子,扫码进入。每天早上去打扫下卫...
见了一个消费品前辈,观点对我冲击蛮大 从1994到2024,过去30年简直疯狂;所以我们往后看,其实不是期待消费品的低迷周期什么时候结束,是就是看不见了,只能看...
《伟大始于无名》 在线阅读英文版:https://chipwilson.com/chapter/why-i-am-writing-this-book 网站内有PDF.EPUB 等格式下载。 本来想用沉浸翻一下,但是貌似...