国盛计算机 09月25日
DeepSeek-V3.1发布,迈向Agent时代
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek-V3.1正式发布,包含混合推理架构、更高的思考效率、更强的Agent能力、上下文扩展至128K等变化。模型在工具使用与智能体任务中的表现有较大提升,编程智能体和搜索智能体能力增强。模型开源,并使用UE8M0 FP8 Scale的参数精度,推动AI与国产硬件自主发展。

🔍DeepSeek-V3.1引入混合推理架构,支持思考模式与非思考模式,并通过实时路由器根据对话类型、复杂度、工具需求以及明确意图选择模型,降低了用户手动选择模型的复杂度。

💻GPT-5和DeepSeek-V3.1的编程能力提高,降低了大众通过AI编程开发Agent的门槛,使得更多人能够参与到Agent的开发中来。

🛠️工具调用能力提升,GPT-5和DeepSeek-V3.1的智能体能力增强,能够帮助Agent完成更复杂的任务,例如多工具调用和内部系统交互。

✅幻觉显著下降,Agent可靠性跃升,使得Agent在处理信息时更加准确和可靠,为用户提供更好的服务。

⚡推理效率提高,减少token消耗,使得Agent应用更具经济性价比,降低了Agent应用的门槛,推动了Agent的普及和应用。

刘高畅/李可夫 2025-08-24 14:41 上海

再一次强调理解了自定义Agent才能理解这轮AI和算力的长度

核心观点

国盛计算机自定义Agent相关报告:

 2025年8月10日——【国盛计算机】GPT-5最受益的方向:自定义Agent

2025年7月27日——【国盛计算机】再谈这轮AI持续性

2025年7月19日——【国盛计算机】海外AI应用的持续性如何

DeepSeek-V3.1 发布,迈向 Agent 时代的一大步。2025年8月21日,DeepSeek-V3.1正式发布,包含以下主要变化:1)混合推理架构支持思考模式与非思考模式;2)更高的思考效率:V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与   R1-0528 持平;3)更强的 Agent 能力,新模型在工具使用与智能体任务中的表现有较大提升;4)上下文已扩展为128K。5)Base 模型与后训练模型均开源。DeepSeek-V3.1报告中还提及使用了UE8M0 FP8 Scale的参数精度,针对即将发布的下一代国产芯片设计,我们为这意味着 DeepSeek 正在构建软硬协同的生态,推动AI与国产硬件自主发展。

模型能力持续进步,Agent落地加速。近期DeepSeek/OpenAI等厂商的模型进步多方面利好Agent落地:1)架构整合统一模型入口:DeepSeek-V3.1混合推理架构把思考模式与非思考模式结合。GPT-5 通过实时路由器根据对话类型、复杂度、工具需求以及明确意图选择模型。降低了需要用户手动选择具体模型的使用复杂度。2)模型编程能力提高,降低了大众通过AI编程开发Agent的门槛。3)工具调用能力提升,GPT-5和DeepSeek-V3.1的智能体能力增强,能帮助Agent完成更复杂任务。4)幻觉显著下降,Agent可靠性跃升。5)推理效率提高减少token消耗,使得 Agent 应用更具经济性价比。6)上下文窗口扩大,Agent能处理更长任务更大量数据。7)模型开源:DeepSeek-V3.1的Base 模型与后训练模型均开源,OpenAI也发布gpt-oss-120b和gpt-oss-20b两款性能卓越的开源模型,预计能进一步推动 Agent开发生态的繁荣。

未来有三种Agent:用户给自己做Agent、厂商给用户做Agent、单位给员工做Agent。Agent是当下大模型产业的重要方向,我们认为未来Agent的形式有三种:1)用户给自己做的Agent:AI带来的技术普惠让不具备编程背景的个人用户也能为自己高度特定的个人及工作任务,构建和部署定制化的AI Agent。2)模型厂商给用户做Agent,科技巨头为抢夺流量入口构建功能强大的通用Agent。3)单位给员工做Agent,作为企业中强大的“数字同事”或“数字员工”,带来可衡量的投资回报。除了将Agent分为三类以外,我们还认为Agent落地的三大要素分别是数据、模型、接口。近期的DeepSeek-V3.1和GPT-5模型的进步,编程能力的提升利好用户自定义Agent的推广渗透,进一步会带来广泛的算力需求,幻觉降低尤其有利于严肃2B场景Agent。

建议关注:

算力:寒武纪、海光信息、有方科技、协创数据、新易盛、东阳光、胜宏科技、鸿腾精密科技、中际旭创、沪电股份、东山精密、伟仕佳杰、奥飞数据、云赛智联、潍柴重机、科华数据、禾盛新材、金山云、浙数文化、青云、大位科技、玉柴国际、亿田智能、宏景科技、弘信电子、圣阳股份、润泽科技、润建股份、深信服、神州数码、深桑达、品高股份、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、数据港。

Agent:阿里巴巴、腾讯控股、快手、拓尔思、阜博集团、美图公司、金蝶国际、金山办公、金桥信息、鼎捷数智、嘉和美康、慧辰股份、海天瑞声、泛微网络、税友股份、朗新集团、润达医疗、360、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。

自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。

军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。

建议关注

算力:寒武纪、海光信息、有方科技、协创数据、奥飞数据、新易盛、东阳光、胜宏科技、鸿腾精密科技、沪电股份、中际旭创、东山精密、伟仕佳杰、云赛智联、潍柴重机、科华数据、禾盛新材、青云、金山云、浙数文化、大位科技、玉柴国际、亿田智能、宏景科技、弘信电子、圣阳股份、润泽科技、润建股份、深信服、神州数码、深桑达、品高股份、金山云、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、数据港。

Agent:阿里巴巴、腾讯控股、快手、拓尔思、美图公司、金蝶国际、金山办公、金桥信息、鼎捷数智、海天瑞声、慧辰股份、嘉和美康、泛微网络、税友股份、朗新集团、润达医疗、360、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。

自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等

军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。

风险提示技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险

报告正文

01

DeepSeek-V3.1 发布,迈向 Agent 时代的一大步

2025821日,DeepSeek-V3.1正式发布,包含以下主要变化:混合推理架构:一个模型同时支持思考模式与非思考模式;更高的思考效率:相比DeepSeek-R1-0528DeepSeek-V3.1-Think 能在更短时间内给出答案;更强的Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升上下文均已扩展为128K编程智能体:在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的DeepSeek 系列模型有明显提高

图表1:编程智能体测评(SWE 使用内部框架测评,相比开源框架 OpenHands 所需轮数更少;Terminal Bench 使用官方 Terminus 1 framework

资料来源:DeepSeek,国盛证券研究所

搜索智能体:DeepSeek-V3.1 在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528

图表2:搜索智能体测评

资料来源:DeepSeek,国盛证券研究所

思考效率提升:经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。同时,V3.1 在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。

图表3:在各项评测指标得分基本持平的情况下R1-0528  V3.1-Think  token 消耗量对比图

资料来源:DeepSeek,国盛证券研究所

模型开源:V3.1Base 模型在 V3 的基础上重新做了外扩训练,一共增加训练了 840B tokensBase模型与后训练模型均已在 Huggingface 与魔搭开源。DeepSeek-V3.1报告中还提及使用了 UE8M0 FP8 Scale 的参数精度,在公众号评论区,官方指出该参数精度针对即将发布的下一代国产芯片设计,我们认为这意味着 DeepSeek 正在构建软硬协同的生态,推动 AI 与国产硬件自主发展。

02

模型能力持续进步,Agent落地加速

我们认为近期DeepSeek/OpenAI等厂商的模型进步将加速Agent应用落地。架构整合统一模型入口:DeepSeek-V3.1通过混合推理架构,把思考模式与非思考模式结合。GPT-5是一个统一的系统,包含一个能够解答大多数问题的智能高效模型、一个能够解决更复杂问题的更深层次的推理模型(GPT-5 thinking),以及一个实时路由器,可以根据对话类型、复杂度、工具需求以及明确意图选择模型。我们认为模型将不同模式的入口整合,降低了需要用户手动选择具体模型的使用复杂度编程能力提高,降低Agent开发门槛编程语言用简洁、优雅的语法和语义规则,定义清晰明确的指令,让计算机完成各种任务。代码是数字世界的基础生产力工具。GPT-5DeepSeek-V3.1的编程能力提高,进一步降低了大众通过AI编程开发Agent的门槛。工具调用能力提升,能完成更复杂任务。Agent执行中可能需要与多个API、数据库或内部系统交互。GPT-5工具调用能力提升,在遵循工具指令、处理工具错误以及自主实现串行或并行的多工具调用方面表现更佳。DeepSeek-V3.1也在工具使用与智能体任务中的表现有较大提升,如搜索智能体能力增强,也能帮助Agent完成更复杂任务。幻觉显著下降,Agent可靠性跃升。大模型的幻觉问题是Agent落地的一大障碍,尤其在一些高风险领域模型出现幻觉可能造成严重后果,GPT-5的幻觉显著下降提高了Agent 的可靠性。推理效率提高,Agent经济性价比提升复杂的Agent工作流通常涉及大量的LLM调用,模型成本也是影响Agent落地的重要因素。GPT-5o3相比在各种推理任务中使用的输出token减少了50-80%DeepSeek-V3.1 在维持准确率的同时减少 20%-50% token消耗。对企业部署来说,推理成本预计可以显著下降,使得大规模Agent 应用更具商业可行性。上下文窗口扩大,Agent能处理更长任务更大量数据。建立在有限上下文窗口模型之上的Agent,无法处理长期任务、记住过往交互或消化大型文档,它们会忘记关键信息,迫使用户不断重复,从而中断复杂的工作流程。GPT-5配备了高达400k的上下文窗口,DeepSeek-V3.1也有128K长上下文,能帮助Agent处理更复杂场景。模型开源推动 Agent开发生态的繁荣。DeepSeek-V3.1Base 模型与后训练模型均开源,此前在85OpenAI发布gpt-oss-120bgpt-oss-20b两款性能卓越的开源模型,预计能进一步推动 Agent开发生态的繁荣。

03

未来有三种Agent:自己给自己做Agent、厂商给用户做Agent、单位给员工做 Agent

我们认为未来有Agent的形式有三种:用户个人自制的Agent、模型厂商驱动的通用Agent和企业定制的Agent

图表4:Agent的落地形式

资料来源:国盛证券研究所绘制

1)用户给自己做AgentAI Agent革命的一个重要趋势是AI带来的技术普惠。借助一系列强大的无代码/低代码平台,不具备编程背景的个人用户也能为自己高度特定的个人及工作任务,构建和部署定制化的AI Agent。这标志着一个新时代的到来:自动化不再是大型企业的专属,而是成为人人可及的个性化工具。

据市场研究机构 Straits Research数据2024年全球无代码AI平台的市场规模为 36.8 亿美元,预计到 2025年将达到 47.7 亿美元,到 2033 年将达到 379.6 亿美元,在预测期间(2025-2033年)以 29.6% 的复合年增长率增长。例如字节的扣子开发平台可以帮助用户零基础进行Agent 专业开发,OpenAI推出的GPTs让用户可以自己创建结合了指令、额外知识和任何技能组合的自定义版本的 ChatGPT

 

Lovable公司通过其AI驱动的应用程序构建平台,Lovable让非技术背景的用户也能创建功能性软件,如电商网站等。今日头条20255月报道Lovable团队规模仅18人,于短短6个月内实现了5000万美元的ARR

图表5:Lovable平台上的大量AI创作项目

资料来源:Lovable官网,国盛证券研究所

2)厂商给用户做Agent全球顶尖的科技巨头,正在投入巨资,构建功能强大、应用广泛的通用CAgent字节旗下Agent应用“扣子空间”,字节定义为是精通各项技能的“通用实习生”与各行业的“领域专家”,具备无限拓展能力的 AI Agent

图表6:扣子空间

资料来源:扣子官网,国盛证券研究所

3)单位给员工做 AgentAgent的第三种形式,是在企业内部的部署,Agent不再仅仅是个人工具,而是作为强大的“数字同事”或“数字员工”,与人类员工并肩工作。它们旨在增强员工的专业能力、自动化复杂的业务工作流,带来可衡量的投资回报(ROI)。尤其是垂直的行业Agent,在这里,Agent不再是通才,而是被训练成特定行业的“领域专家”,拥有深厚的专业知识。

除了将Agent分为三类以外,我们还认为Agent落地的三大要素分别是数据、模型、接口:1)垂类数据是Agent能力拓展到各行业的关键。2)基础大模型的能力提升是Agent进步的核心动力。3Agent需要通过各类接口与外部系统交互,获取上下文或执行操作,也即使用工具扩展Agent能力。

图表7:Agent的要素包括模型、数据、接口

资料来源:国盛证券研究所绘制

综上我们认为,近期GPT-5Deepseek-v3.1等模型的能力进步将大幅利好各类Agent加速落地,其中编程能力的提升利好用户自定义Agent的推广渗透,进一步会带来广泛的算力需求,幻觉降低尤其有利于严肃2B场景Agent

04

建议关注

算力:寒武纪、海光信息、有方科技、协创数据、新易盛、东阳光、胜宏科技、鸿腾精密科技、中际旭创、沪电股份、东山精密、伟仕佳杰、奥飞数据、云赛智联、潍柴重机、科华数据、禾盛新材、金山云、浙数文化、青云、大位科技、玉柴国际、亿田智能、宏景科技、弘信电子、圣阳股份、润泽科技、润建股份、深信服、神州数码、深桑达、品高股份、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、数据港。

Agent:阿里巴巴、腾讯控股、快手、拓尔思、阜博集团、美图公司、金蝶国际、金山办公、金桥信息、鼎捷数智、嘉和美康、慧辰股份、海天瑞声、泛微网络、税友股份、朗新集团、润达医疗、360、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。

自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。

军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。

05

风险提示

技术迭代不及预期风险:技术迭代不及预期,则对产业链相关公司会造成一定不利影响。

经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响。

行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。

具体分析详见2025年8月24日发布的报告《第四次谈自定义Agent

分析师 刘高畅 分析师执业编号S0680518090001

分析师 李可夫 分析师执业编号S0680525060001

特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。

 

重要声明:本订阅号是国盛证券计算机团队设立的。本订阅号不是国盛计算机团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。

本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。

 

版权所有,未经许可禁止转载或传播。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-V3.1 Agent AI 国产芯片 算力
相关文章