index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html
![]()
近年来,AI大模型性能提升主要依靠扩大模型参数规模和增加训练数据与算力,但边际效益正在递减。AI系统工程架构的创新成为新的突破点,AI Agent(智能体)成为行业新焦点。Genspark公司率先引入MoA(多智能体混合)架构,将多个专长不同的模型组成协作体,实现更强大的功能。Genspark Super Agent采用MoA架构,由9个不同规模的大模型组成,并调用多种工具集,展现出强大的性能和灵活性。AI Agent产业的竞争将从模型竞争转向系统竞争,从算法思维转向工程思维,从卖功能转向卖结果。
🤖 AI大模型单模型性能提升空间有限,边际效益递减,需要通过系统工程架构创新实现突破。
🤖 AI Agent(智能体)成为行业新焦点,Genspark公司率先引入MoA(多智能体混合)架构,将多个专长不同的模型组成协作体。
🤖 Genspark Super Agent采用MoA架构,由9个不同规模的大模型组成,并调用多种工具集,展现出强大的性能和灵活性。
🤖 AI Agent产业的竞争将从模型竞争转向系统竞争,从算法思维转向工程思维,从卖功能转向卖结果。
🤖 Genspark的MoA架构代表了新一代AI Agent系统的未来发展方向,但仍有模型调用成本高、任务调度复杂等挑战需要解决。
原创 王艺 2025-10-20 17:13 北京

![]()
从“最强大脑”到“智能协作体”。
作者|王艺编辑|王博“单模型性能的边际提升,正在快速递减。”近期我们和一些大模型(LLM)研发者沟通时,不少人都有类似的感受。过去几年,AI模型性能的提升主要来自两个方向:模型参数规模扩大,训练数据与算力的增长。根据OpenAI、Anthropic、DeepMind等团队的研究,模型性能与参数规模之间呈幂律关系(Power Law),即性能随参数增加而提升,但提升幅度逐渐减小,表现出边际收益递减的趋势。这也和我们的观察所吻合,今年以来,我们看到的模型改进主要来自“上下文记忆增强”“多模态融合”“推理链优化”等方向,这些都不是纯粹靠“变大”实现的,而是靠“变巧”。单一模型的“性能天花板”已悄然出现。在海外,OpenAI、Anthropic、Google等大模型公司的最新模型,在性能上的差距越来越小。用户大体的感知是:GPT系列在创造性和逻辑推理方面略胜,Claude系列在编码和文本理解方面略优,Gemini系列在多模态方面略强。但对C端用户来说,这种差异不再能直接转化为新的付费理由。「甲子光年」发现,市场的竞争焦点从“模型谁更聪明”转向“谁能更好地用这些模型”,从“模型竞争”过渡到“系统竞争”。AI大模型参数规模不再是关键,AI系统工程架构的创新才是新的突破点。在这种背景下,AI Agent(智能体)的成为了AI行业新的叙事主体。甲子光年智库在《中国AI Agent行业研究报告》中,将AI Agent定义为具有自主性、反应性、交互性等特征的智能“代理” ,用公式表示就是:大模型时代的AI Agent=LLM x(规划+记忆+工具+行动)。而在众多AI Agent公司之中,一家几乎没有投放广告、仅24人规模的公司却被频频提起——Genspark。很多人对Genspark的印象还停留在华人硅谷创业公司、不断更新的产品功能以及45天3600万美元ARR(年度经常性收入)的商业成绩,但更有价值的是,这家从AI搜索起家的公司,用一套Mixture-of-Agents(多智能体混合,简称MoA)架构,把多模型融合成一个完整系统。Genspark代表了从“做出更聪明的模型”到“让模型们协作”的范式转变,这也是一个关于工程哲学的故事。1.在AI Agent领域率先引入MoA的概念Genspark是由小度前CEO景鲲(Eric Jing)与小度前CTO朱凯华(Kay Zhu)联合创立的MainFunc公司推出的AI Agent产品,2024年6月Beta版上线,初期定位为AI搜索引擎,通过生成无偏见的Sparkpages页面提供可信信息,主要面向美国市场。景鲲前下属、AI从业者刘佳(化名)告诉「甲子光年」,景鲲还在小度工作的时候,就多次提到要“重构搜索背后的内容生态”。后来,Genspark陆续加入Multi-Agent、Deep Research等功能,并于2025年4月升级为Super Agent产品,上线9天实现了1000万美元的ARR,上线45天就实现了3600万美元的ARR。对比来看,AI Coding领域的明星企业Cursor,实现1000万美元ARR,用了21个月。在众多AI Agent产品中,Genspark去年底引入了MoA的概念并将其工程化。可以说,Genspark是全球最早将MoA这一概念落地到消费级AI Agent产品中的团队之一。而Genspark在2024年12月的宣传视频中则称其为“world's first Mixture-of-Agents (MoA) system(世界首个MoA系统)”简单来说,MoA系统会让多个专长不同的模型组成一个多脑协作体:比如,OpenAI模型负责创造性与自然语言任务,Claude负责逻辑推理与结构化生成,Gemini负责视觉与多模态感知。当然,实际工作中MoA的机制会更复杂。图片来源:Genspark不过,MoA并非Genspark首创。2024年6月,Junlin Wang等作者在《Mixture-of-Agents Enhances Large Language Model Capabilities》论文中指出,随着LLMs数量的不断增加,如何利用多种LLMs的集体专长成为一个令人兴奋的开放方向,他们写道:“为此,我们提出了一种新方法,通过Mixture-of-Agents(MoA)利用多种LLMs的集体优势。在我们的方法中,我们构建了一个分层的MoA架构,每一层由多个LLM agent组成。每个agent在生成其响应时都会将上一层所有agent的输出作为辅助信息。MoA模型在AlpacaEval 2.0、MT-Bench和FLASK上取得了最先进的性能,超越了GPT-4 Omni。”MoA架构,图片来源:《Mixture-of-Agents Enhances Large Language Model Capabilities》这篇论文的作者都来自Together AI,这是一家以研究为驱动的AI公司,赋能开发者和研究人员训练、微调并部署生成式AI模型。2025年1月,Genspark在其官方博客中发布了一篇文章《Enhancements in Mixture of Agents(多智能体混合的改进)》,文中提到:Mixture of Agents方法代表了AI领域的重大进展,特别是在提升LLMs能力方面。通过利用多个模型的力量,MoA不仅提高了性能,还为AI应用的创新开辟了新途径。Genspark还指出,MoA架构并不限于两层结构;它可以扩展为三层甚至更多层,从而实现模型之间更复杂的交互。这种多层化的设计可以通过跨多轮的响应综合进一步优化输出质量,提升最终结果的整体水平。举例来说,在一个三层架构中,第一层生成的初始响应会被第二层进一步加工处理,随后在最终层进行聚合,从而得到一个更细腻、更全面的输出结果。值得注意的是,Genspark在这篇博客中引用了Together AI的MoA论文。《Enhancements in Mixture of Agents》,图片来源:Genspark今年4月,Genspark发布Super Agent,全面转型通用Agent,不再局限于AI搜索。朱凯华在Genspark Super Agent上线后发布的公开信中表示:“我们做出了一个违反直觉的决定。尽管我们旗下AI搜索产品已覆盖超过500万用户,但我们还是要将其放弃。至于理由,是因为我们认为传统AI搜索已经过时。”《Why I Killed Our AI Search Product With 5 Million Users》,图片来源:GensparkGenspark Super Agent的确也取得了不错的测评成绩。在今年4月的GAIA基准测试中,Genspark就超过了Manus和OpenAI Deep Research。图片来源:Genspark景鲲将这一成绩归功于“大模型、工具集、数据集”三者的协同作用,“它们让Genspark Super Agent快速、可靠、超级可控。”图片来源:Genspark转型后的Genspark,依然坚持了MoA架构。Genspark Super Agent利用由9个不同规模的大模型组成了MoA系统,该系统允许Agent针对特定任务动态选择最合适的模型,从而在各种场景中确保最佳性能。与依赖单一模型的传统AI系统不同,这种架构增强了灵活性和效率,让Genspark Super Agent成为用户的多功能工具。除此之外,我们还了解到,Genspark Super Agent可以调用图像生成模型、视频生成模型、音频生成模型以及专用功能模型(翻译、搜索、代码、分析等),其背后的模型有将近50种,而且会动态更新。「甲子光年」认为,随着新一代基础模型陆续登场,通用Agent的竞争格局也在重排。谁能最快吸纳新模型能力、谁能最平衡模型与体验,决定了下一个拐点。2.Less Control, More Tools要让多个模型协作,不仅是模型问题,而是工程问题。Genspark的核心突破是打造了一套称为Agent Engine的中枢系统。它由两个关键机制组成:模型编排(Model Orchestration)与改进循环(Improvement Loop)。MainFunc公司CTO朱凯华用一句话概括了Genspark团队的核心理念:“少控制,多工具(Less Control, More Tools)。”意思是不追求中心化智能,而让系统自己找到最优解。图片来源:朱凯华《Less Control, More Tools: How Genspark Built a Super Agent That Scales》演讲AI Agent的本质是在一个循环中,基于环境反馈来选择合适的工具,最终完成其任务的智能体。其核心架构包含大脑(Brain)、规划(Planning)、记忆(Memory)、工具使用(Tool Use)四个关键组件,主流的Agent框架有ReAct(Reason-Act)、Plan-Execute、Multi-Agent等。随着市场竞争的激烈,越来越多的AI Agent产品都在采用多智能体(Multi-Agent)架构。比如,Manus采用了规划-执行-验证三级代理架构,Skywork采用了五大专家Agent协同,Fellou推出了智能体网络,Comet推出了基于浏览器会话的Agent集群等。相关产品也给用户带来了不错的使用体验。多智能体实现模拟人类工作流程,图片来源:甲子光年智库《2024年AI Agent行业报告》不过,我们了解到,市面上有一些声称自己采用了Multi-Agent架构的Agent产品,实际上却只是单一模型的角色扮演:角色A负责规划、角色B负责执行、角色C负责验证。即使AutoGen、LangGraph等框架支持多Agent,但是底层依然依赖单一大模型。如果传统智能体的架构是“单一LLM→角色A(规划)→角色B(执行)→角色C(验证)”,本质是“一个大脑控制多个手”;那么Genspark MoA的架构则是“任务输入 → 模型A(专业分析) → 模型B(创意思考) → 模型C(逻辑验证) → 智能融合 → 最优输出”,本质是“多个大脑的协同思考”。这种“多个大脑协同思考”的MoA架构比起单一模型加持的Multi-Agent架构产品性能显著提升。MoA系统其实不仅是Genspark一家公司的优势,而是整个通用Agent行业的优势。曾经是OpenAI第五号员工,现在是Convergence AI工程负责人的郑浅,今年3月在锦秋基金组织的分享活动上就明确表示:“Agent公司的创业核心竞争力在于其Agent orchestrator(编排)。”郑浅认为,Agent核心是“大脑”即Agent orchestrator。若单纯缝合工具而不加强Agent orchestrator开发,就像没有大脑只有工具的人,无法很好执行任何任务。若Agent orchestrator能同时生成多个Agent,每个负责一篇报告并行处理,最后整合信息,效率将是线性处理的10倍。因此,并行Agent必然是未来趋势。如果说MoA系统是Genspark在“模型编排”领域下的重注,那么评分机制就是Genspark在“改进循环”领域的一步妙手。在Agent结构中,评分器(Scorer)是不可或缺的模块,它不仅是模型生成内容的“质量校准器”,更在Agent的动态策略调整、保障系统可信度、优化任务完成效率等方面发挥着重要作用。评估流程:从数据集中取样本,输入到应用,获得输出,然后由评估器(可结合真实答案)对输出进行打分,从而完成对产品的评估。 图片来源:LangChain不过,⽬前Agent领域的⼀个核⼼问题是到底什么是可以被评分的。比如在医疗和法律领域,有⼈批评某些评估⽅法过于简单,⽐如通过律师资格考试并不等于成为⼀名真正的律师,通过医学考试也不意味着能胜任医⽣的⼯作。和很多Agent产品一样,Genspark同样使用大模型作为“评分器”来评估整个代理会话,并生成整体奖励。然而,Genspark将这些奖励归因于会话中的每个步骤,这种细致的反馈(改进循环)能够准确揭示哪些工具在哪些情况下最有效。图片来源:朱凯华《Less Control, More Tools: How Genspark Built a Super Agent That Scales》演讲具体而言,Genspark的评分器则建立了多维度动态评分机制,在任务执行过程中持续评估中间输出(如PPT大纲结构合理性),动态调整后续生成策略;同时还内置了消费电子、医疗等垂直领域的知识图谱等10多个专业数据集,可以检测输出内容与行业常识的冲突。端到端的闭环评估系统则可以通过多Agent协同评分、可解释性报告生成等方式增强评分的准确性。3.去中心化的AI系统设计哲学工具集的数量也是Genspark的一个亮点,Genspark Super Agent集成了80多个工具集。AI Agent产品调用的工具大约是10~15个,如果调用的工具增多,会拖慢Agent的运行速度。此前OpenAI Agent产品负责人Nikunj就曾在访谈中表示,Agent下⼀步的发展⽅向是如何突破⽬前10~15个⼯具的限制,即如何让Agent 接⼊数百个⼯具,并能够⾃主判断调⽤哪个⼯具、如何使⽤它们。Agent调用工具步骤越多,得分越低,图片来源:CLUE中文语言理解测评基准而Genspark内部集成了80多个工具集,包含Python 解释器、幻灯片制作器、Crunchbase API、视频生成器、图像生成器、数据库连接器、分析平台等,在增强了智能体功能丰富性的同时,却并没有拖慢Agent的运行时间。这不仅得益于其MoA架构的分工协作,更是得益于他们的智能预筛选、分层搜索策略、懒加载优化和工程化优化策略。实质上,Genspark并非简单地“承载”这些工具集,而是构建了一个智能的工具管理和调度系统。这就像一个智能仓库,虽然有80种商品,但机器人不是盲目搜索全部,而是根据订单快速定位到相关区域,只检查最可能的5~8个选项。朱凯华认为,在设计工具集时,最重要的考虑因素是可组合性。每个工具都应提供简洁、文档齐全的API。就像搭建乐高积木一样——每个积木块都应该与其他积木块无缝连接,这让Agent系统能够以人从未预料到的方式自动选择和组合工具。能够做到这一点的公司不仅拥有工具,还拥有一个工具生态系统。图源:Kay Zhu《Less Control, More Tools: How Genspark Built a Super Agent That Scales》演讲“我们相信工具具有网络效应,Genspark技术架构的关键在于每增加一个新工具并非仅仅增加一项功能,而是与所有现有的工具形成指数级组合——工具A的输出可以输入到工具B,而工具B又可以与工具C结合。”朱凯华在演讲中表示。“Less Control, More Tools” 体现出一种去中心化的AI系统设计哲学。Genspark Super Agent的突破正在于此。它把控制权交给系统自身的反馈循环,用“工具的多样性”和“协作的智能性”取代“人为的流程控制”,最终实现可扩展、自优化的超级智能体。这不仅是技术架构的升级,更是思维方式的转变。自4月上线以来,Genspark Super Agent几乎以“每周一更”的疯狂节奏推进更新。本月初,Genspark推出了“Photo Genius(图片大师)”功能,将图片编辑带入全新的“口述即编辑”体验,用户可以用语音控制美颜,实现风格即时切换、场景魔术切换、照片拯救、合影魔术等。Photo Genius,图片来源:Genspark过去,我们崇拜“大模型”:GPT、Claude、Gemini。但未来,我们需要更重视“系统”:谁能把这些模型组织成高效、稳定、自优化的智能体系统,谁才真正掌握了AI生产力的钥匙。AI Agent产业的竞争格局正在转变:从模型竞争到系统竞争;从算法思维到工程思维;从卖功能到卖结果。Genspark的MoA架构,让人看到了“新一代AI Agent系统”前景。当然,它仍有风险与挑战——模型调用成本高、任务调度复杂、可解释性与一致性问题仍未彻底解决。我们认为,AI Agent未来要面临的,不是算法的极限,而是系统的边界。而Genspark正在扩张的,正是这种边界。(封面图来源:使用Genspark生成)END.阅读原文
跳转微信打开