09月18日
阿里通义DeepResearch开源,3B参数模型性能超越多款旗舰
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里巴巴于9月17日凌晨开源了其首个深度研究Agent模型——通义DeepResearch。该模型凭借3B激活参数,在多项权威Agent评测中表现优异,性能超越了基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent。通义DeepResearch在处理长周期任务时,通过创新的训练链路和推理模式,有效解决了传统Agent面临的“认知空间窒息”和“噪声污染”问题,提升了推理能力。此次开源丰富了阿里在AI智能体领域的布局,为开发者提供了轻量化高性能的解决方案。

💡 **性能卓越,超越旗舰:** 阿里巴巴开源的通义DeepResearch模型,以其3B激活参数,在Humanity's Last Exam、BrowseComp等多个权威Agent评测集中,展现出超越OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent的性能。这标志着轻量化模型在复杂研究任务中也能达到领先水平。

🛠️ **创新训练与推理机制:** 为解决传统Agent在长周期任务中易出现的“认知空间窒息”和“噪声污染”问题,通义DeepResearch构建了合成数据驱动的完整训练链路,并设计了ReAct和自研的Heavy两种推理模式。Heavy模式通过test-time scaling策略,确保模型在长任务中能实现高质量推理。

🌐 **丰富开源生态,赋能开发者:** 通义DeepResearch模型、框架和方案已在Github、Hugging Face和魔搭社区全面开源。这不仅进一步丰富了阿里巴巴在AI智能体领域的开源布局,也为全球开发者提供了攻克长周期复杂研究任务的关键工具,推动了AI研究的普及和应用。

2025-09-17 23:09 上海

3B参数超越OpenAI o3、DeepSeek V3.1。

▲头图由AI生成

3B参数超越OpenAI o3、DeepSeek V3.1。

作者 |  王涵

编辑 |  漠影

智东西9月17日报道,今天凌晨,阿里巴巴开源了其首个深度研究Agent模型:通义DeepResearch

在Humanity's Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等权威Agent评测集中,通义DeepResearch模型凭借3B激活参数,性能超越基于OpenAI o3DeepSeek V3.1Claude-4-Sonnet等旗舰模型的ReAct Agent(推理-行动智能体)。

▲基准测试成绩排名

▲基准测试分数

目前,通义DeepResearch的模型、框架和方案已在Github、Hugging Face和魔搭社区全面开源,开发者和用户可自行下载模型与代码。

下载地址:

Github:

https://github.com/Alibaba-NLP/DeepResearch

Hugging Face:

https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B

魔搭社区:

https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B

深度研究作为近一年的AI研究热点,吸引了谷歌、OpenAI、Anthropic等众多主流企业投入研发。

深度研究研发的现有方法大多采用“单窗口、线性累加”的信息处理模式,在处理长周期任务时,Agent易遭遇“认知空间窒息”与“不可逆的噪声污染”,导致推理能力降低,难以完成复杂研究任务。

据介绍,为解决这些问题,阿里通义团队构建了一套合成数据驱动的完整训练链路,覆盖预训练与后训练阶段。

该链路以Qwen3-30B-A3B模型为基础进行优化,设计了RL算法验证与真实训练模块,涵盖真实与虚拟环境,并借助异步强化学习算法及自动化数据策展流程,有效提升了模型的迭代速度与泛化能力。

在推理阶段,通义团队还设计了ReAct基于自研IterResearch的Heavy两种模式。ReAct用于精准评估模型的基础内在能力,Heavy则通过test-time scaling策略,充分挖掘模型的性能上限,确保在长任务中也能实现高质量推理。

结语:阿里进一步补全开源布局

今年以来,阿里已陆续开源WebWalker、WebDancer和WebSailor等多款检索和推理智能体,且均取得开源SOTA成绩。通义DeepResearch的开源,进一步丰富了阿里在AI智能体领域的开源布局。

通义DeepResearch的开源为深度研究Agent赛道提供了“轻量化高性能”的新选择,也为全球开发者攻克长周期复杂研究任务提供了关键工具支撑。

(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

阿里通义 DeepResearch Agent模型 开源 人工智能 Alibaba Tongyi DeepResearch Agent Model Open Source Artificial Intelligence
相关文章