36kr 09月05日
DeepSeek计划2025年底发布AI Agent系统,兼顾多任务处理与自我改进
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek宣布计划在2025年第四季度推出一款具备多步骤任务处理和自我改进能力的AI Agent系统。该公司同时发布了关于数据来源和安全的声明,承认“幻觉”问题难以根除,AI准确性仍有局限。此次发布的AI Agent是其R1推理模型的升级版,旨在减少人工干预,实现独立完成复杂任务并自我调整。DeepSeek还详细说明了其训练数据的筛选过程,强调已剔除有害内容。AI Agent已成为大模型竞争的下一个关键战场,OpenAI、微软、Anthropic以及国内的阿里巴巴、腾讯等都在积极布局。DeepSeek的此举被视为一个高风险但可能带来高回报的策略,其成功将对工作流程、行业价格体系及地缘政治产生深远影响,核心在于将竞争焦点从模型分数转向任务完成度和成本效益。

🤖 **AI Agent系统升级与核心功能:** DeepSeek计划在2025年第四季度发布其AI Agent系统,该系统将是其R1推理模型的代理化升级版。核心卖点在于能够独立完成多步骤任务,最大程度减少人工干预,并具备根据过往行为进行自我调整的能力,这标志着AI向更自主的智能体迈进。

⚖️ **数据安全与“幻觉”问题的坦诚披露:** DeepSeek公开了其训练数据的筛选方式,明确剔除了仇恨言论、色情、暴力、垃圾信息及潜在侵权素材。同时,公司坦承AI的“幻觉”问题目前无法根除,AI的准确性仍有局限,体现了对AI安全和伦理的务实态度,这在当前AI发展背景下尤为重要。

🌐 **AI Agent的竞争格局与DeepSeek的策略:** AI Agent已成为大模型领域的重要赛道,OpenAI、微软、Anthropic以及国内的阿里巴巴、腾讯等都在加速布局。DeepSeek选择押注单一但更强大的代理系统,而非频繁推出过渡版本,这是一种高风险的策略,旨在通过卓越的性能在激烈的市场竞争中脱颖而出。

💡 **AI Agent对未来工作与商业的影响:** 一个可靠的AI Agent系统有望重塑工作流程,实现任务的自动化和集成化,从而提高效率并降低成本。DeepSeek的崛起挑战了高昂的训练成本论,可能迫使企业重新定义AI的价值,并对云服务、软件模式和AI宣传方式产生冲击,同时也会引发关于技术扩散和监管的讨论。

📈 **DeepSeek策略的双重考验:** DeepSeek的双线策略——雄心勃勃的AI Agent计划与坦率的安全披露——是对其工程稳健性和监管务实性的考验。在标准化竞赛中,DeepSeek能否以其独特策略击败快速迭代的竞争对手,将在很大程度上决定其在AI领域的未来地位。

DeepSeek计划在2025年第四季度发布一款能处理多步骤任务、自我改进的

AI Agent(AI智能体)系统。与此同时,公司还发布了一份数据来源与安全说明,警告“幻觉”问题仍无法根除,并声明AI准确性仍有局限。

两个重点

第一,DeepSeek在推R1推理模型的“代理化”升级版,这个模型1月曾让市场惊叹。新目标是:系统能独立完成多步骤任务,尽量少靠人工引导,还能根据之前的行为调整。这是代理系统的核心卖点。

第二,DeepSeek公开了训练数据的筛选方式,剔除了仇恨言论、色情内容、暴力、垃圾信息及可能侵权的素材,并直言“幻觉”问题目前无解。

竞争格局

AI Agent(AI智能体)是大模型的下一个战场。

OpenAI七月推出ChatGPT代理,能浏览网页、登录系统、跨工具完成任务;微软五月为Copilot推出多代理协同功能,还扩展了代理SDK;Anthropic则发布代理指南,并推出面向企业的“计算机使用”功能。

这些都不算完美,但越来越实用。

国内玩家也在加速冲刺。阿里巴巴的Qwen团队在代理框架和界面自动化研究上很激进;腾讯等公司也在把代理功能嵌入用户日常服务中。

由中国人创立、现总部在新加坡的Manus,靠推销“通用AI代理”处理复杂工作流,引发全球关注和政策审视。

很显然,AI Agent已经不再是实验性项目,而是已经成为大模型的一个核心主赛道。

相比之下,DeepSeek自R1后动作谨慎。国内媒体称R2时间表慢是因创始人梁文锋追求完美,也有人说是普通工程延误。押注单一但更强的代理系统,而非频繁推出过渡版本,是个高风险策略。

后续展望

如果DeepSeek成功了,会怎样?

首先是工作流程。

靠谱的代理系统能规划、点击、撰写、修改,等于把五个应用整合成一个自动化流程。查旅游信息、审报销单、找供应商、处理基础IT工单——这些脑力活儿都能变成“配方式”操作。延迟、工具使用准确度和权限管理将决定实际应用能走多远。

其次是价格。

DeepSeek的崛起挑战了“只有几十亿才能赢”的训练预算论。如果它能以低成本推出高自主性的代理,将逼企业重新定义价值:不只看模型质量,还要看每美元、每分钟的任务完成效率。这会冲击云服务利润、软件捆绑模式和厂商“AI赋能”的宣传方式。

最后是地缘政治。

出口管制限制了中国获取顶级GPU,迫使企业追求效率而非粗暴扩规模。如果DeepSeek的代理表现出色,华盛顿和布鲁塞尔会视其为证据:管制虽能减慢,但无法阻止技术扩散。预计会有更多呼声要求为代理系统的认证、交易和行为审计设限。

为啥重要?

AI Agent正把竞争焦点从模型分数转向任务完成度、可靠性和成本,重塑企业评估“AI价值”的方式。

DeepSeek的双线策略——AI Agent雄心加上坦率安全披露——考验的是稳健工程和监管务实,能否在标准化竞赛中击败快节奏发布的其他竞争对手。

成功则一鸣惊人,失败则可能被市场甩在身后。

本文来自微信公众号“锦缎研究院”,作者:布朗,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek AI Agent 人工智能 AI Agent 大模型 Large Models 多任务处理 Multi-tasking 自我改进 Self-improvement 数据安全 Data Security 幻觉问题 Hallucinations 竞争格局 Competitive Landscape
相关文章