国盛计算机 09月25日
AI发展进入下半场,自定义Agent成关键
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AI发展进入下半场,从解决问题转向定义问题。评估变得比训练更重要,需要开发针对现实效用的新型评估或任务。自定义Agent成为AI应用与算力闭环的重要因素,未来将有三种形式:用户自制、厂商驱动和企业定制。

🔍 AI发展进入下半场,评估变得比训练更重要,需要开发针对现实效用的新型评估或任务。

🤖 自定义Agent成为AI应用与算力闭环的重要因素,未来将有三种形式:用户自制、厂商驱动和企业定制。

🧠 提升Agent能力的关键是上下文处理能力,或记忆能力,只有在此基础上才能实现终身学习或在线学习能力。

🌐 未来有Agent的形式有三种:用户个人自制的Agent、模型厂商驱动的通用Agent和企业定制的Agent。

🚀 阿里巴巴正围绕AI+云和大消费两大战略重心坚定投入,已实现算力投入-模型创新-应用落地及云服务增长的初步闭环。

刘高畅/李可夫 2025-09-14 16:25 上海

前OpenAI研究员姚顺雨,观点再次强化自定义Agent

核心观点

国盛计算机自定义Agent相关报告:

2025年8月24日——【国盛计算机】第四次谈自定义Agent

2025年8月10日——【国盛计算机】GPT-5最受益的方向:自定义Agent

2025年7月27日——【国盛计算机】再谈这轮AI持续性

2025年7月19日——【国盛计算机】海外AI应用的持续性如何

Agent的下半场,从解决问题转向定义问题。OpenAIAgent研究员姚顺雨20254月发表文章《The Second Half》,认为AI发展到了下半场,此前训练>评估,之后评估>训练,从解决问题转向定义问题。前半部分专注于建立新的模型和方法,各个领域的基准性能不断提升,但目前已有较好的解决方案,即语言通过Agent的推理进行泛化,其要素包括大规模语言预训练、Scaling数据和计算以及推理和行动的理念。目前即使创建更严格的基准,它们很快也会被解决。因此下半场重点是开发针对现实效用的新型评估或任务。当今Agent发展最关键的两个方向一个是让它拥有自己的奖励,能自己探索;另一个是Multi-Agent,让它们之间能形成组织结构。提升Agent能力方面最重要的是上下文处理能力,或记忆能力,未来一类很有价值的,是能积累用户上下文,或者能构建特殊环境的公司。自定义AgentAI应用与算力闭环重要因素。我们认为未来有Agent的形式有三种:用户个人自制的Agent、模型厂商驱动的通用Agent和企业定制的Agent2025年上半年中国企业级市场大模型的日均总消耗量为10.2万亿Token,较2024年下半年日均调用量暴增363%,其中阿里通义占比17.7%,字节豆包占比14.1%DeepSeek占比10.3%。大模型在工作中的调用量不仅来自于企业的直接调用,MIT的研究显示AI 已经在改变工作,员工使用个人 ChatGPT 账户、Claude 订阅和其他消费工具来自动化他们工作的大部分内容,MIT调查的公司只有40%表示购买了官方 LLM 订阅,但调查的90%以上的公司员工报告说他们经常使用个人 AI 工具用于工作任务,侧面反映了大模型的使用量有许多是用户已经在用自定义的Agent完成任务,而没有体现在B端直接对大模型的采购。阿里AI进展不断,国内算力与应用形成初步闭环。910日阿里旗下高德地图宣布推出全球首个基于用户行为产生的榜单“高德扫街榜”,构建线下服务信用体系,高德AI模型能识别真实到达行为、现场照片等,剔除无效和虚假评论,同时启动“烟火好店支持计划”,通过发放超10亿元补贴等措施,鼓励用户到店消费,希望每天能为线下餐饮及其他服务业多带去1000万客流。模型方面。模型方面,912日阿里发布了下一代基础模型架构 Qwen3-Next,并开源了基于该架构的 Qwen3-Next-80B-A3B 系列模型。设计了全新的模型结构,改进了混合注意力机制、高稀疏度 MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多 token 预测机制。 Qwen3-Next-80B-A3B 在“思考模式”和“非思考模式”下的性能均与规模更大的 Qwen3-235B-A22B-2507 相当,同时在推理速度上显著提升,尤其在长上下文场景中表现更为突出。我们认为阿里已经实现了算力投入-模型创新-应用落地及云服务增长的初步闭环,以阿里为标杆,看好国内其他公司把握AI发展机遇创造更多成就。 

建议关注:算力:寒武纪、海光信息、东阳光、新易盛、胜宏科技、鸿腾精密科技、有方科技、协创数据、中际旭创、沪电股份、东山精密、伟仕佳杰、宏景科技、中芯国际、奥飞数据、云赛智联、科华数据、禾盛新材、潍柴重机、金山云、浙数文化、青云、大位科技、玉柴国际、亿田智能、弘信电子、圣阳股份、润泽科技、润建股份、深信服、神州数码、深桑达、品高股份、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、数据港首都在线

Agent:阿里巴巴、腾讯控股、拓尔思、阜博集团、快手、美图公司、金蝶国际、金山办公、金桥信息、鼎捷数智、慧辰股份、嘉和美康、海天瑞声、泛微网络、税友股份、朗新集团、壹网壹创、润达医疗、360、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。

自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。

军工AI拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。

风险提示技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险

报告正文

01

Agent的下半场,从解决问题转向定义问题

OpenAI研究language Agent的研究员姚顺雨于20254月发表文章《The Second Half》,文章认为人工智能的“下半场”从现在开始将从解决问题转向定义问题。在这个新时代,评估变得比训练更重要,不再只是问“我们能训练一个模型来解决X问题吗?”,而是问“我们应该训练人工智能做什么?我们如何衡量真正的进展?”为了在“下半场”蓬勃发展,我们需要及时转变思维方式和技能,或许更接近产品经理的水平。游戏的前半部分:专注于建立新的模型和方法,评估和基准是次要的。这项游戏已经运行了数十年,并激发了改变世界的理念和突破,体现在各个领域的基准性能不断提升。这项游戏究竟为何会发生改变?这些理念和突破的积累,在创建解决任务的有效方案上产生了质的改变。解决方案的要素包括大规模语言预训练、Scaling数据和计算以及推理和行动的理念。抽象的解释是:语言通过Agent的推理进行泛化上半场游戏的玩法是不断开发新的训练方法或模型,以攀登基准测试。然后创建更难的基准测试,并继续这个循环。

但目前即使创建更严格的基准,它们很快也会被解决。

 

图表1:更难的基准越来越快被解决

 

资料来源:github,国盛证券研究所

 

姚顺雨认为“我们应该从根本上重新思考评估。这意味着不仅仅是创建新的、更难的基准,而是从根本上质疑现有的评估设置并创建新的,这样我们就被迫发明新的方法,而不仅仅是遵循现有的配方。”下半场新游戏的办法是

——我们开发针对现实效用的新型评估设置或任务。

——我们用方案来解决它们,或者用新颖的组件来增强方案。继续这个循环。

姚顺雨也在社交媒体发文称:“现在是一个我称之为中场休息的特殊时刻。在此之前,训练>评估,在此之后,评估>训练”

图表2:姚顺雨认为AI发展之后评估>训练

 

资料来源:36kr,国盛证券研究所

“语言即世界language is world”访谈中,姚顺雨也再次提到基于语言的Agent的主线正从“上半场”转向“下半场”,当前从语言出发,去定义Reasoning(推理)、定义Agent,终于有了一个非常通用的方法,而且这个方法是可泛化的。这带来一个本质变化:“以前我面对很多怪兽,需要造出各种不同武器去打它们;现在我有了一把通用武器,比如机关枪,我不需要再为每个怪兽单独造武器。接下来要思考的问题就变成:我该朝哪个方向开枪?现在方法的问题已基本解决,真正重要的是——我们要用这个通用方法,解决什么问题?”今天Agent发展最关键的两个方向:

一个是让它拥有自己的reward(奖励),能自己探索;另一个是Multi-Agent(多智能体),让它们之间能形成组织结构。提升Agent能力,姚顺雨最看重的是Context(上下文)处理能力,或记忆能力。因为只有在这个基础上,才能进一步实现Lifelong Learning(终身学习)或Online Learning(在线学习)的能力。未来一类很有价值的,是能积累用户上下文,或者能构建特殊环境的公司,现在有很多用户数据或用户上下文的公司,有点像发明车之前的煤炭、煤矿,或者像发明汽车之前的石油公司,例如微信还是一个易守难攻的好平台,它积攒大量的上下文。对于应用型创业公司担心大模型公司的模型能力溢出,会把他们做的Agent吞掉这一问题,姚顺雨认为创业公司最大机会是:能设计不同的interface(交互方式),或者说人和数字世界交互的方式

02

自定义AgentAI应用与算力闭环重要因素

我们认为未来有Agent的形式有三种:用户个人自制的Agent、模型厂商驱动的通用Agent和企业定制的Agent

图表1:Agent的落地形式

 

资料来源:国盛证券研究所绘制

用户给自己做AgentAI Agent革命的一个重要趋势是AI带来的技术普惠。借助一系列强大的无代码/低代码平台,不具备编程背景的个人用户也能为自己高度特定的个人及工作任务,构建和部署定制化的AI Agent。这标志着一个新时代的到来:自动化不再是大型企业的专属,而是成为人人可及的个性化工具。厂商给用户做Agent全球顶尖的科技巨头,正在投入巨资,构建功能强大、应用广泛的通用CAgent。如字节旗下Agent应用“扣子空间”,字节定义为是精通各项技能的“通用实习生”与各行业的“领域专家”,具备无限拓展能力的 AI Agent单位给员工做AgentAgent的第三种形式,是在企业内部的部署Agent不再仅仅是个人工具,而是作为强大的数字同事数字员工,与人类员工并肩工作。尤其是垂直的行业AgentAgent不再是通才,而是被训练成特定行业的“领域专家”。它们旨在增强员工的专业能力、自动化复杂的业务工作流,带来可衡量的投资回报。我们认为当下自定义Agent是支持AI应用与算力闭环的重要因素:大模型token调用量快速增长:B端,91日,国际市场调研机构沙利文发布了最新的《中国GenAI市场洞察:企业级大模型调用全景研究,2025》,报告显示2025年上半年,中国企业级市场大模型的日均总消耗量为10.2万亿Tokens2024年下半年,2025年上半年日均调用量暴增363%,其中,阿里通义占比17.7%,字节豆包占比14.1%DeepSeek占比10.3%,前三名合计占⽐超40%同时大模型在工作中的调用量不仅来自于企业的直接调用MIT发表的《The GenAI Divide STATE OF AI IN BUSINESS 2025》中提到,AI 已经在改变工作,只是不是通过官方渠道。MIT的研究揭示了一个蓬勃发展的“影子 AI 经济”,员工使用个人 ChatGPT 账户、Claude 订阅和其他消费工具来自动化他们工作的大部分内容,通常不需要 IT 知识或批准。规模是惊人的。虽然只有40%的公司表示购买了官方 LLM 订阅,但调查的 90%以上的公司员工报告说他们经常使用个人 AI 工具用于工作任务。事实上,几乎每个人都在某种形式上使用了LLM 用于他们的工作。我们认为这一数据侧面反映了大模型的使用量有许多是用户已经在用自定义的Agent完成任务,而没有体现在B端直接对大模型的采购上。

03

阿里AI进展不断,国内算力与应用形成初步闭环

阿里巴巴正围绕AI+云和大消费两大战略重心坚定投入。据证券时报今年2月底,阿里宣布未来三年投入3800亿元建设云和AI硬件基础设施,并于4月底上线即时零售业务,7月阿里宣布投入500亿元用于消费领域。

 

AI+云方面,阿里巴巴2025自然年第二季度财报显示,该季度集团在AI+云的Capex(资本支出)投资达386亿元,创历史新高。阿里云收入增长继续加速至26%,创三年新高,AI相关产品收入已连续8个季度实现三位数同比增长。

910日阿里在杭州举办高德扫街榜发布会。阿里旗下高德地图宣布推出全球首个基于用户行为产生的榜单“高德扫街榜”,构建全新的线下服务信用体系,以全力支持线下餐饮及服务消费。高德AI模型能识别真实到达行为、现场照片等,剔除无效和虚假评论。高德同时启动“烟火好店支持计划”,通过发放超10亿元补贴等措施,鼓励用户到店消费,希望每天能为线下餐饮及其他服务业多带去1000万客流。

图表1:高德扫街榜店铺界面

 

资料来源:阿里巴巴公众号,国盛证券研究所

我们认为,阿里此举有望将分散在饿了么、高德、支付宝的消费订单+商户评价+用户画像数据聚合起来,构建具备强大竞争力的本地生活消费决策平台,与大众点评、抖音等平台的到店业务产生激烈竞争。

模型方面,912日阿里发布了下一代基础模型架构Qwen3-Next并开源了基于该架构的Qwen3-Next-80B-A3B 系列模型。阿里设计了全新的Qwen3-Next的模型结构。该结构相比Qwen3MoE模型结构,进行了以下核心改进:混合注意力机制、高稀疏度 MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多 token 预测机制。Qwen3-Next-80B-A3B-Base模型,该模型拥有800亿参数仅激活30亿参数。该Base模型实现了与Qwen3-32B dense模型相近甚至略好的性能,而它的训练成本(GPU hours) 仅为Qwen3-32B的十分之一不到,在32k以上的上下文下的推理吞吐则是Qwen3-32B的十倍以上,实现了极致的训练和推理性价比。

图表2:Qwen3-Next模型架构

 

资料来源:通义千问Qwen公众号,国盛证券研究所

Qwen3-Next-80B-A3B 在“思考模式”和“非思考模式”下的性能均与规模更大的 Qwen3-235B-A22B-2507 相当,同时在推理速度上显著提升,尤其在长上下文场景中表现更为突出。通过此次发布,阿里旨在赋能开源社区,使其能够与前沿架构创新同步演进。阿里将持续优化这一架构,开发 Qwen3.5,致力于实现更高的智能水平与生产力。我们认为,阿里已经实现了算力投入-模型创新-应用落地及云服务增长的初步闭环。以阿里为标杆,我们看好国内其他互联网大厂以及各领域应用公司把握AI发展机遇创造更多成就。

04

建议关注

算力:寒武纪、海光信息、东阳光、新易盛、胜宏科技、鸿腾精密科技、有方科技、协创数据、中际旭创、沪电股份、东山精密、伟仕佳杰、宏景科技、中芯国际、奥飞数据、云赛智联、科华数据、禾盛新材、潍柴重机、金山云、浙数文化、青云、大位科技、玉柴国际、亿田智能、弘信电子、圣阳股份、润泽科技、润建股份、深信服、神州数码、深桑达、品高股份、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、数据港、首都在线。

Agent:阿里巴巴、腾讯控股、拓尔思、阜博集团、快手、美图公司、金蝶国际、金山办公、金桥信息、鼎捷数智、慧辰股份、嘉和美康、海天瑞声、泛微网络、税友股份、朗新集团、壹网壹创、润达医疗、360、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等

自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。

军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。

05

风险提示

技术迭代不及预期风险:技术迭代不及预期,则对产业链相关公司会造成一定不利影响。

经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响。

行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。

具体分析详见2025年9月13日发布的报告《Agent的下半场,从解决问题到定义问题

分析师 刘高畅 分析师执业编号S0680518090001

分析师 李可夫 分析师执业编号S0680525060001

特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。

 

重要声明:本订阅号是国盛证券计算机团队设立的。本订阅号不是国盛计算机团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。

本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。

 

版权所有,未经许可禁止转载或传播。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI发展 自定义Agent 算力闭环 阿里巴巴 AI+云
相关文章