科技最前沿的 2025-09-04 20:20 北京
实际落地真的很难,垂直场景才能做深做透。
- The Bitter lesson 依然生效,新一代Agent Model的"规划"和"工具调用"能力的提升,取代了过去大量基于规则的工作流编排等外围工程。隐性知识的获取是一个Agent的核心挑战,尤其在2B领域。Context,即隐性知识和业务逻辑的好坏决定了大模型如何能够在实际落地中完成任务,是否真正实现"可生产可交付"的价值。Workflow跟自主编排Agent各有用武之地,会长期并行。但价值重心很明显正在逐步向后者迁移。通用Agent的留存与付费转化偏弱,新客多、留存低成为常态,更务实的做法是从"通用"转向"垂直深耕"。即便在"通用"赛道,也先聚焦特定场景。长期来看,真正的护城河在于几个核心能力:深度的环境理解与操作能力、持续的学习记忆闭环、针对特定场景的模型优化,以及多Agent间的协作标准。
超 12000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。
邀请从业者、开发人员和创业者,飞书扫码加群:
进群后,你有机会得到:
最新、最值得关注的 AI 新品资讯;
不定期赠送热门新品的邀请码、会员码;
最精准的AI产品曝光渠道
01
热潮背后:
创业实践的教训、挑战与调整
今年Agent真正从"目标"变成了"手段"——过去大家谈论Agent更多是在描绘一个理想状态,现在则是在用它解决具体问题。随着底层模型能力加速进化,嘉宾们分享了痛苦的教训、面临的主要挑战以及相应的重心调整。Bitter lesson:今年最大的Learning是什么?之前做Agent的大量工程化工作都“交了学费”。一位嘉宾分享,两年前他们开始做Agent的时候,模型能力还不够,GPT-4虽然智商ok,但也有各种问题,包括工具调用、准确性、上下文长度、速度等。他们因此做了很多外围的工程化,做了各种工具,去年他的产品在 SWE-Bench 测试中两次拿到榜首。可是这样的方案不具有通用性,也不稳定。今年Claude Code出来后,他发现,过去做的这些工作都没有意义,都被大模型吃掉了。模型本身就是Agent,开发者只需要给它环境,这对他的冲击非常大。这个“交学费”的痛苦经历被多位嘉宾提及。教训的背后,是因为新一代Agent Model的"规划"和"工具调用"能力的提升,取代了过去大量基于规则的工作流编排等外围工程。Agent目前最主要的挑战是什么?隐性知识的获取是一个核心挑战,尤其在2B领域。大模型能力不再是主要瓶颈,但是Agent如何能够给到大模型足够的context来实际落地,依然面临几个方面的挑战。一是默会知识。在真实世界真实场景中,有很多默会知识,而这些是没有被记录、AI不知道的。以广告行业为例,什么样的创意是好的创意,什么样的slogan是好的slogan,行业内人士可能需要梳理出一套规则给到AI。二是协作需要的共识性知识。在真实的组织中,人和人之间的协作是口耳相传的。一个大之下有小组织,每个小组也有自己的生态。以字节为例,大家都用Golang,但是每个小组用Go的方法都不一样。这些组织内部的共识性知识,目前是严重缺乏的。三是企业内部在长期实践中形成的自定义规则。一位嘉宾分享了一个真实案例,很具有代表性。他在帮助客户计算ACV(年度合同价值)指标时发现,虽然业界有标准算法,但企业实际操作时却面临着各种复杂情况:哪些合同应该计算在内,哪些不算?合同截止时间能否延期?出于某些实际考虑,不在结算周期内的合同需要如何特殊处理?每家企业的处理方式都不同。同样一个指标,不同公司的计算方法可能完全不同。即便是看似标准的 Salesforce,不同企业对同一字段的定义也不尽相同。这些源自业务实践的自定义规则与术语,都是外部难以直接感知的“隐性层”。产生这些问题的本质,是AI完全改变了过去软件的工作方式。以前软件都是在做工具给人使用,因为工具直接解决问题的成本过高,问题由人来解决。在Agent时代,Agent需要直接解决问题,这就要求开发者把人脑如何解决问题的思路都做出来。这里包括默会知识、协作的共识性知识、各个企业内部自定义的规则等等。目前,Agent开发者花了大量时间和精力来构建这些context。创业者应该在哪里发力?聚焦上下文工程来构建环境。因为大模型能力的迅速提升,Agent实施重点不再是模型与工具,而是如何构建环境让大模型更好地落地。这个转变很关键,因为"环境"很可能就是那层不会被大模型淹没的地基。这里的“环境”包含三要素:- 执行能力:让 Agent 在真实界面、终端与移动端进行 Computer Use。业务连接:把企业系统、数据与权限工具化、可调度化。上下文载体:承载领域术语、企业知识与使用习惯等关键信息。
