原创 奇绩创坛 2025-09-29 19:32 北京
全自动化软件开发 Multi-agent System:从方向假设到转型迭代的经验与教训
起步:方向、产品、市场的三大核心假设与验证
转型:源于用户、创业初心与技术发展的触发信号与决策逻辑
产品迭代:围绕用户使用全生命周期构建体验闭环
AI 编程的未来:关于产品、技术、市场的四个趋势判断
给自己和年轻创业者的建议
如果你喜欢并期待看到更多前沿创业系列内容,请告诉我们(点击文末小爱心)。 
🚀 **明确方向与大胆假设**:跨赴科技创业初期就瞄准 L4 级自动化软件开发,认为这是未来趋势,并以 Multi-agent System 作为 AI for Software Engineering 的最优路径,而非单 Agent 方案。尽管早期尝试了 ToB 模式,但通过用户访谈发现,面向下沉市场的 C 端用户需求更为迫切,促使团队进行了大胆转型。
💡 **用户导向的产品迭代与转型**:通过深入的用户访谈,跨赴科技发现大众用户对软件部署和管理存在巨大门槛。为解决此问题,产品迭代加入了沙盒预览模式,极大降低了用户使用门槛,并促成了用户增长。同时,通过 AI 自动生成安装包、支持升级修改、数据迁移和一键回滚等功能,构建了用户使用的全生命周期体验闭环,提升了用户长期留存。
🌐 **AI 编程的未来趋势判断**:武鑫认为,未来“for human”的代码重要性将降低,AI 能够自主创造语言、调度资源,只需交付结果。应用将从传统软件走向内容化,构建经验共享和知识流动的网络。Agent 创业者应聚焦模型之外的“苦功”,如理解需求,而非模型上限本身,并坚持“China First, Impact Global”的市场策略。
🤝 **创业者的自我认知与团队建设**:武鑫强调,创业需要新的组织哲学和逻辑,要吸引和聚集更优秀的人才,即使他们背景不同。他建议年轻创业者找到支撑自己创业的底层动力,将其视为穿越不确定性的“烛火”,并认为近距离体验创业是寻找这团火光的好方法。
原创 奇绩创坛 2025-09-29 19:32 北京
全自动化软件开发 Multi-agent System:从方向假设到转型迭代的经验与教训
起步:方向、产品、市场的三大核心假设与验证
转型:源于用户、创业初心与技术发展的触发信号与决策逻辑
产品迭代:围绕用户使用全生命周期构建体验闭环
AI 编程的未来:关于产品、技术、市场的四个趋势判断
给自己和年轻创业者的建议
如果你喜欢并期待看到更多前沿创业系列内容,请告诉我们(点击文末小爱心)。方向假设:做软件工程领域的 Coding 创业,起步就要瞄准 L4 级自动化开发。
如果把 AI 编程类比为自动驾驶,同样可以按照自动化程度,分为 L1 到 L5。2023 年 8 月起步创业,我们就瞄准了 L4 级的软件自动开发。第一次有这个想法是在腾讯带团队做自动化代码生成的时候。22 年底 GPT-3.5 发布,我们抱着辅助业务的心态,尝试让它做一些定制化开发,结果它居然真的能写,而且效果相当不错。那一瞬间,我被震撼到——大模型在预训练中包含的开发知识,可能已经比我们想象的要多得多。当时我的判断有两点,一是 L2/L3 级的辅助开发(IDE 插件、代码补全、Copilot)是大厂的游戏,市场已经很卷;二是这个领域迟早会迈向 L4,创业公司只有面向未来才有生存机会。现在回头看,两年前的判断是准确的,但过程中的打法有些保守。如果回到两年前,我会更激进地寻找斜率最大、最能 scaling(规模化)的增长路线。对比和我们同期开始探索 L4 方向的 Lovable,从一开始就 think bigger,在种子轮就想办法筹集了 800 万美金,当时愿意投他们的不多,创始人甚至四处借钱。拿到足够的“子弹”后,Lovable 就开始专注运营 Discord 社区,吸收反馈,全力打磨产品。而我们当时的想法是先拿几百万人民币,打磨技术,活下来再说。和 Lovbale 一样,我们也先做了名为 DevOps GPT 的开源项目,用来验证技术原型,短短几个月就获得了大约 6000 个 star,但既没有走社区增长路线,又在后续产品打磨过程中分心做了些 ToB 项目。尽管这些项目对我们沉淀技术、打磨产品产生了很积极的作用,但整体而言产品上的投入不够极致。我一直在想,如果产品上投入更极致,我们会不会跑得更快。产品假设:Multi-agent system(多智能体系统)是 AI for Software Engineering 的最优路径。我过去长期做大厂研发管理类平台,这类平台最大的价值就是让大厂数以万计的产研人员可以高效协作。我觉得 AI4SE 也一样,只不过协作对象从人变成了 Agent。按人类在软件工程上的 40 多年经验积累,这件事天然需要产品经理、架构师、开发、测试、运维等多个角色,分阶段进行复杂协同。如果一定要把这个过程压缩到一个模型里,我认为更像是一个挑战模型能力上限的科研任务,不是追求效率和成本的工程任务,而我们显然是一家强调工程能力的 AI 应用公司,而不是基础模型公司。所以我们从第一天起,就专注 Multi-agent system,从未考虑过单 Agent 的路线。也许未来 AI 的进一步发展会催生新的路线,但目前来看 Multi-agent system 是 AI Coding 应用落地最有效的路径。早期目标市场假设:瞄准专精特新企业,做高客单价的 ToB 服务我们最早设想的用户是专精特新企业。他们自己养不起程序员,但高度依赖数字化。我们甚至做了数据分析,中国专精特新企业里只有 8% 是 IT 企业,剩下的都是新能源、新材料、智能制造等。我们做一个平台,用端到端的自动化技术为他们服务,这不是很完美吗?客单价高,需求又刚性。但实践后发现不是这么回事。可以做,但即便是到今年, L4 级自动化开发技术也还无法满足 B 端客户复杂的开发需求,仍需要投入人力保障交付。我们在 24 年初,能把通过 AI 辅助开发,将传统软件开发项目的成本压缩 50% 以上,比如一个市场价 30 万的外包项目,我们 15 万就能交付,而且交付质量还比软件外包公司要好。但现实是,只要业务里仍有人力介入,B 端规模化增长就很受限,因为有很多事 AI 干不了,比如和客户应酬、追尾款等等。我尴尬地意识到,这样下去,想实现进一步增长就要招聘很多销售和交付人员,那我们就变成了一家低毛利的人力驱动公司,这与最初技术驱动的创业想法背道而驰。目标市场误判的复盘:“尴尬”的用户访谈比高效的技术交流更有效通过这件事我们得出的教训是,纸面推演不靠谱。虽然奇绩创业营在产品和市场分享上强调最多的就是要多跟用户聊天,但我这样的理工科创始人可能天生回避和用户沟通。我们更喜欢和创业者或技术专家交流,因为信息密度极高,都是洞察和技术见解。和用户聊天总觉得是很漫长的过程,信息交换密度低。尤其现在转向 ToC 后,服务的用户有送水站的老板、猪肉铺老板、戒烟爱好者、研究精油配方的女生……你可以想象,我去访谈一个研究精油配方的女生,场景有多尴尬。但恰恰是在这样一次次略显尴尬的访谈中,我们逐渐找到了产品方向。这是一个最有效的“笨办法”,想快速找到用户和市场,找到 PMF,方法很简单——真的去聊 100 个用户。我们现在会定期进行全员参与的用户访谈,内容也很宽泛。我还特意向擅长用户访谈的朋友学习,听了他们的访谈录音,发现访谈很需要技巧。虽然最终目的还是问他为什么用我们的产品,用来做什么等等,但他们共情能力和同理心更强,会先了解用户的背景情况,再慢慢挖掘和探索。并且在访谈中更多的是应该是倾听,而不是在用户提到一个点,比如这个功能存在什么问题后,就立刻打断用户,说“你这个发现太对了!我们下个版本准备怎么做”,然后滔滔不绝讲 10 分钟规划,并问他们要不要现在就续费。转型:源于用户、创业初心与技术发展的触发信号与决策逻辑转向决策的依据:后台数据的正向反馈与 People Mission Fit。去年下半年我们把方向和所有资源转到了现在偏向 C 端的模式,决策过程也有心理挣扎。当时我们和所有 B 端客户关系都很好,甚至有一个老客户提出花几百万把我们团队包圆,只为他们做项目。而另一边,C 端产品虽然增速很快,但基数很小,像我们产品上线第一个月的收入只有千元级别。这个时候要做决策很考验我们的战略定力和团队之间的信任。幸运的是,接下来几个月业务开始了连续的爆发式增长,fortune favors the bold。理性地看,我们坚定转型的底气主要源于后台数据。去年 10 月产品上线后,我们慢慢发现,真的有人愿意花钱买单,很多完全不懂开发的普通人花大量时间使用我们的产品。他们虽然不懂技术,但会在平台上和 AI 交流自己的想法,甚至做出一个原型。当我们看到数据开始变化时,再去和这些用户沟通,了解了他们的场景和痛点,信心就足了。另外,这条路线也和我创业的初心——开发技术的普惠不谋而合。我有一个患有强直性脊椎炎的朋友,用我们的产品做了一个给 AS 病友们使用的小程序。他后来的反馈非常令我触动,他说这是第一次有一个产品经理愿意耐心地听他把需求讲完,即使这个产品经理是 AI。因为他的需求太小众,以前不给钱是没人帮他做需求分析和应用开发的。其实中国有大量的数字化场景,尤其是下沉市场,仍有大量的企业和个人很难享受到数字化带来的便利和益处,因为随便做个小程序也得好几万。把开发这件事的成本降低 1000 倍以上,真正普惠到每个人手中正好是我们的创业初心。转向决策背后的底层逻辑:AI 的泛化能力让长尾需求第一次可以规模化。在 AI 出现之前,软件开发被清晰地分为 ToB 和 ToC 市场。服务大企业客户时有严格的性能(QPS/TPS)、安全等级等要求。而 C 端的长尾需求场景相对来说要求没那么高,但难点在于 C 端需求非常长尾、发散。用户有做钓鱼应用的、红酒品鉴的,有做电竞卡牌、命理分析、精油配方的……如果按照上一代软件开发思路,每一个都能做成一个独立的小产品。在 LLM 时代之前,一个平台要满足这么多发散的场景是不可能,但现在完全可行。这源于 LLM 本身的泛化能力很强。比如,把一个学校信息管理系统的代码,完全改写成一个功能、细节、文档都匹配的医院信息管理系统,无论找大学生,还是淘宝店家代做,改一遍也得花两三天时间和几千元。但是 AI 几十分钟就能改完所有的代码,因为对 AI 来说底层技术都一样,只是需要进行一些泛化调整。长尾需求表面上是发散和复杂的,但底层技术高度一致和简单,这种剪刀差就产生了可以规模化的点。比如,做命理分析会产生一些数据处理的过程,我们会把它积累下来,变成一些可复用的 AI 组件。下一个用户也许是做四川麻将计分,虽然表面上看起来没有关系,但一些底层组件是通用的,可以直接调用,通过 AI 组件的积累,最后生成的效率和效果也能持续得到优化。我们的技术路线从一开始就不是让模型硬写所有代码。早在 MCP 流行前,我们就构建了一个 “AI-friendly library”(AI 友好的组件库),如果 AI 发现有些功能可以直接调用现有组件,就会直接拿来用,而不是从 0 开始写。当然现在再看,这就是一个庞大的 MCP 服务库。我们不但自己在快速积累各种 MCP 服务,同时也支持自动集成外部的 MCP 服务,这让我们产品的生成能力得到了很大的提升。另外,由于我们做 L4 级自动化开发,如果在完全开放的场景下做会非常痛苦,就像自动驾驶 L4 至今无法全面上路一样。所以我们参考自动驾驶的发展理念,我们称之为“室内低速 L4”。现在像酒店送餐机器人、园区配送之类的自动驾驶产业已经非常庞大,它们就是在限定场景下把端到端的效果做到了足够好。通过限定场景,比如在国内,我们专注做移动端应用比如小程序的端到端自动生成,我们就可以排除掉很多无需考虑的因素,把精力集中在有限场景的优化上。用户肯定不会在小程序里开发一个大数据平台,当用户场景变得聚焦,产品的优化路径也就变得清晰了。产品迭代:围绕用户使用全生命周期构建体验闭环打掉运维门槛:从交付代码到沙盒预览我们最初的产品形态是用户在平台描述需求,我们端到端生成好,交付代码和文档。但用户拿到代码后会遇到一个新问题——完全不知道怎么部署安装。于是我们想了一个办法,用 AI 自动生成安装包,以为这样问题就解决了。直到有一天,一位客户询问如何在手机上双击安装包,因为我们的文档里写的是“双击 。exe 文件安装”。那一刻我们意识到,大众用户的数字化水平可能远低于我们的预期。所以今年 2 月我们增加了沙盒预览模式。用户提出需求后,我们先在服务器的沙盒里完整地运行应用,让他看到最终效果,而不是只给他一堆代码。这个功能极大地促进了增长,因为它打掉了运维的门槛。随着用户越来越多,我们甚至发现只做开发和运维也还不够。比如,我们很早就开始为用户自动生成管理后台,因为我们认为这是应用能用起来的标配。结果发现他们还是不知道怎么用。做学生信息管理系统,想增加一个年级,这对懂软件的人来说,只是后台的一个配置操作,但用户不会,他会回到开发聊天窗口里说“给我增加一个年级”。这也让我深刻体会到必须去观察用户的真实使用行为,因为产品设计者的预想与用户的实际用法可能完全不同。我们现在也逐渐意识到,只做成一个应用开发工具是不够的,这些生成出来的应用的日常使用,甚至经营管理,也需要由 AI 来帮助用户完成。提升长期留存:生成效果走查、支持升级修改、数据迁移与一键回滚在 AI 生成效果的优化上,我们每天会做一件事情叫 “走查”。所有员工每天都会随机抽查当天用户生成的案例,看运行得怎么样,并让 AI 重跑一遍,分析是否有可优化的点。我们建立了一个迭代、优化产品的指标,叫“八十二十”。我们希望每个新版本都能解决上一版本中 80% 生成失败的案例,剩下 20% 暂时不能解决也没关系。当然,我们不会手动修改 AI 生成的代码,只会修改提示词、优化工作流,以及调整模型的后训练。另外,我们也发现,很多用户体验完第一次的惊艳后就走了,不会再回来。而那些希望真正把应用用起来的用户,最大的需求就是能改,而且能不断地改。所以,我们在应用的可修改和可升级上做了大量工作,甚至做了 Data Migration(自动化的数据迁移),当你用自然语言修改应用到下一个版本时,我们会把旧版本的数据自动迁移过去。如果新版本 AI 发挥得不好,你还可以 Rollback(一键回滚)到上一个版本。这些功能严格的说已经和 AI Coding 无关,都是产品层面的体验优化。但只有把这些所谓的 dirty work 脏活累活做好,用户才可能长期使用,产品才能获得长期增长和收入,而不是一次性的开发体验工具。我觉得所有垂直领域 Agent 应用在真正落地时都要思考这个问题。降低需求表达门槛:多模态交互挖掘用户意图要服务好大众用户,还面临另一大难题——他们说不清自己的需求。目前我们采用对话式交流,最后将需求梳理成 PRD(产品需求文档)。但我们发现用户看不懂 PRD ,于是又增加了将 PRD 转换成流程示意图的功能,结果发现他们还是看不懂。很多产品可能寄希望于用户变强,能写出更好的 prompt ,但我们却希望用户变“傻”,比如下一步,我们或许可以激进地引入一些多模态的形式来与用户确认需求。像是当用户有一个初步想法时,先用 AI 自动生成一张设计示意图,让他直观地看到并判断这是不是自己想要的东西,甚至生成一段演示视频是不是也可以?未来我们会在开发前的应用设计阶段,和开发后的应用使用阶段,引入更多的 Agent,帮助用户完成端到端的数字化。AI 编程的未来:关于产品、技术、市场的四个趋势判断产品趋势判断:for human 的代码重要性将越来越低,AI 可以自己创造语言、调度计算资源,只需给人类交付结果。现在所有开发工具生成的代码都是 for human(给人类看的),不是 for AI(给 AI)。比如,人类写的代码有很多空行、缩进,还要写注释,变量名要清晰可读。你可以尝试将一段复杂的 Java 代码压缩到一行,去掉所有空格,把所有变量名都换成 a、b、c,只要语法正确,AI 照样看得懂,甚至处理效率更高,因为消耗的 Token 更少了。想到这一点,你就会发现,未来 for human 的代码,其重要性会越来越低。当然,底层的框架和 Infra(基础设施)仍然需要少量顶尖工程师去维护,但在软件世界中,80% 以上的业务型和应用型代码,其实不再需要人类看懂,只要 AI 能看懂就行。沿着这个思路推演,AI 有没有可能自己选择用什么代码语言来实现功能呢?甚至它发现用汇编也可以实现,执行效率还更高。人类花了 40 多年的软件工程努力,就是为了把汇编变成自己能看懂的样子。未来,AI 甚至可能自己创造语言,或者直接调度计算资源,给你交付结果就行。当然,仍会有一小部分最顶尖的程序员使用专业的代码开发工具,去完成难度极高、对准确性和一致性要求极高的开发任务。这就像芯片产业,制造芯片已经高度自动化,但设计芯片图纸的 EDA 工具,仍然是人类在使用。这也是为什么我们的产品不开放语言选择的原因,我们觉得这个选项迟早会消失。很多同类产品会让用户选前端用 Vue 还是 React,用不用 TypeScript。用户使用我们的产品只需要告诉 AI 自己要什么,AI 直接交付结果。产品趋势判断:从传统应用走向经验共享和知识流动的知识经济共同体网络目前的 AI Coding 产品某种程度上生成的还是传统应用。我认为这个赛道最大的机会在于应用本身会变成 content(内容)——随着生成成本降低,应用会像文字、视频一样,成为承载人类经验、知识甚至情感的一种独特内容。一旦变成内容,就能构建起用户生态,形成强大的竞争壁垒。如何面向未来生成新的内容形态是需要思考的问题。我们很早就为生成的每个应用内置了一个称为 Agent Friendly Interface(Agent 友好接口)的东西——现在大家知道它叫 A2A(Agent-to-Agent)。当时我们就认定保证生成的应用之间可以互相理解、互相调用这件事情一定要做,因为我们认为为这些下沉市场用户做他们的第一个 App 只是第一步。下一步是做他们的第一个 Agent,甚至到未来,做他们的第一个数字分身。而一旦我们真的为送水店老板、精油配方师、钓鱼爱好者都做了数字分身,这些数字分身之间有没有可能进一步构建成一张更庞大的、用于经验共享和知识流动的知识经济共同体网络?这会非常有意思。这张由无数个 Agent 构成的多边网络,将比现有的互联网大十倍都不止。技术趋势判断:Agent 创业者无需关心模型上限挑战,要把苦功花在模型之外目前 AI 应用的技术难点可以分为两类:一类跟模型能力上限有关,另一类无关。跟模型能力上限有关的,我个人认为创业者不用太关注,那是模型公司要解决的。我们应该想象模型能力再提升十倍、百倍时,应用该是什么样。而且目前基础模型纯粹的 Coding 能力已经超过人类了。你可以做一个实验,从 Codeforces 上找一道编程题,可能只有 3% 的人类程序员能做出来。但你把这道题交给现在的 DeepSeek-R1,它能写出 30 页的推理过程并最终解决。与此同时,你会惊讶地发现,编程能力如此之强的大模型,做一些我们看来很简单的开发任务,比如做个签到打卡小程序,却表现得很差。这是因为软件开发分为两步——第一步是理解需求,第二步才是把需求翻译成代码。模型在第二步上已经足够好,甚至 overqualified,但它在第一步上却力不从心。比如,某个大型企业要给全集团做一个签到打卡小程序,和我个人做是完全不同的场景。模型之所以做不好理解需求这一步,是因为它缺少这些场景化的上下文,既不知道用户是谁,也不知道用户到底需要什么。而这部分理解需求的能力,需要基于大量个性化数据的积累才能得以提升,反而是价值越来越大的地方。所以 AI 应用或 Agent 的创业者,更应该把精力放在那些无论模型能力如何提升,在自己的应用场景下都存在的、独特的、需要解决的技术难点和痛点。这些问题现在看起来可能很棘手,但只要能解决一点,就能让产品进步很多。市场趋势判断:China First, Impact Global(中国优先,影响全球)客观层面,理想化的全球化已经不存在了。这是我坚持 China First,Impact Global(中国优先,影响全球)先服务好中国市场,再影响全球的第一个考量。我们这代创业者必须思考做的到底是中国主导的全球化还是海外市场主导的全球化。没有对错之分,但必须提前想好。其次也是市场机会的选择。我们做数字化下沉,西方市场未必是最好的切入点。Lovable 的成功就很好地证明了这一点,它的主战场在欧洲,不是北美。欧洲的数字经济占比低于美国,但付费能力和美国相当,所以它能获得高增长。我们选择的亚太市场,特点是付费能力稍低,但增速很高。在这类低数字化水平但高增长的地区,端到端交付结果的 AI 产品可能有更好的机会。我也坚信中国原生的创新力量已经到了可以靠产品品质影响全球的时代,我想做的是《黑神话:悟空》、DeepSeek、《哪吒》这样的产品。中国事实上已经是全球最大最复杂的市场,基于中国市场打磨出的产品,只要做得足够好,就一定能成为一个有全球影响力的产品。给自己和年轻创业者的建议给自己:管理大厂下属 VS 汇聚创业伙伴,需要新的组织哲学和逻辑我刚创业时选的联创和伙伴,都是我以前的下属或同事。因为我认识他们,聊得来,而且我有相应的领导经验。但我越来越意识到,靠我个人或团队过去的经验只能让我们走到今天。要到下一个阶段,就必须吸引更多更优秀的人加入,并通过吸引力法则,形成人才聚集的正向循环。这可能是目前最重要的一件事,也是我需要克服的挑战。现在我需要寻找的可能是那些即便我第一面不是很喜欢,但能力极强的人。我也许完全控制不了他,因为可能来自两个世界——他是 00 后,我是 80 后,成长背景也完全不同。但只要我们对这件事有共同愿景就足够了。我在大厂领导过近 200 人的团队,管理的是下属,但现在创业,面对的是合伙人、战友和伙伴,是一起穿越黑暗、寻找新大陆的人,这背后的管理逻辑完全不同。过去那些管理方法,现在虽然有用,但已不那么奏效。你需要寻找新的管理哲学和逻辑,才能把创业团队的战斗力激发到最大。给年轻创业者:找到支撑自己创业的底层动力坦率的讲,我觉得在大厂上班其实没那么难,因为它是个有限游戏,拿 RL 类比,奖励目标非常清晰,就是你在什么时间做了什么事。但创业是一场无限游戏,有太多的不确定性和困难,而且完全看不到尽头——小目标完成后有大目标,然后是更大的目标。我有时开玩笑讲,我原来在大厂,投入 50% 的精力就已经表现非常优秀了,但创业以来,我感觉自己花了 200% 的精力,依然做得还不够好。要想在这样一场 Very Hard 难度的无限游戏中一直走下去,需要有极强的底层动力,这个信念必须非常强烈。当然,这个信念可以是任何东西,赚很多钱、珍视的人、想做的事,但必须像你心灵深处一缕永远吹不熄的烛火,在无尽的黑暗中为你指引方向,同时随时可以绽放为一团熊熊烈火,迸发出蓬勃的生机和动力。其实寻找这个东西的过程,也是再一次认知自己、认知自己和世界的联系的过程,可能也是创业最有价值的收获之一,祝每个创业者都能找到自己心中的那团火光。找不到怎么办?也许加入一家创业公司,近距离的体验和感受创业,是最好的办法!比如我们就非常期待您的加入!目前我们有以下职位正在招聘:海外运营专家/实习生
产品运营经理/实习生
前端开发工程师/实习生
Agent 开发工程师/实习生
欢迎您与我们 career@kuafuai.net 取得联系,了解更多招聘信息!(全文完)AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。
鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑