掘金 人工智能 09月20日
阿里DeepResearch开源,轻量级Agent模型引领AI研究新方向
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里通义正式开源其首个深度研究Agent模型DeepResearch,该模型能自主完成信息搜集、分析、推理并形成结论,在HLE、GAIA等权威评测集上取得SOTA成绩。其独特之处在于,仅用3B激活参数便超越了参数量更大的模型驱动的Agent,这得益于以合成数据为核心的完整训练体系,实现了高效准确的学习。模型提供ReAct和IterResearch驱动的Heavy模式,以应对不同复杂度的任务。DeepResearch已应用于“小高老师”旅行规划和通义法睿法律研究等实际场景,证明了其解决现实问题的能力。此次开源不仅丰富了阿里的AI开源生态,也为行业提供了轻量级Agent模型的新思路,预示着AI正从“回答问题”迈向“深入研究问题”,并加速了AI成为复杂决策伙伴的进程。模型及框架已在GitHub等平台开放。

💡 **模型创新与性能卓越**:阿里通义开源的DeepResearch是一款先进的深度研究Agent模型,其核心亮点在于高效的参数利用。仅需3B激活参数,它在HLE、GAIA、BrowseComp等权威评测集上取得了SOTA(State-of-the-Art)的成绩,性能超越了OpenAI的o3、DeepSeek-V3.1和Claude-4-Sonnet等更大、更复杂的模型驱动的Agent。这种卓越性能并非依赖于参数堆砌或海量数据,而是得益于一套以合成数据为核心、贯穿预训练和后训练的完整训练体系,使得模型能够以更聪明、更高效的方式学习,实现学得快、学得准并具备举一反三的能力。

🚀 **灵活的推理模式与实际应用**:DeepResearch在推理阶段设计了两种创新模式:ReAct模式用于评估模型的基础能力,而其自研的IterResearch驱动的Heavy模式则专注于挖掘模型在长时间、复杂任务中的潜力。这种设计使其能够像经验丰富的研究员一样,从基础问题到压轴难题都能稳健应对。模型已成功落地于实际场景,例如与高德合作的“小高老师”能够进行复杂的旅行规划,以及通义法睿在法律领域提供案例检索和法规分析的深度研究,充分证明了其解决现实问题的强大能力,而非仅仅是“刷榜神器”。

🌐 **推动AI社区发展与未来展望**:DeepResearch的开源,标志着阿里在Agent领域持续发力的又一重要里程碑,进一步丰富了其在开源生态中的布局。此次开源不仅提供了模型本身,还包括了框架和方案,代码托管在GitHub、Hugging Face和魔搭社区,便于全球开发者研究和二次开发。这体现了阿里开放的态度,将极大地推动AI社区的进步,促进技术的快速进化和应用场景的拓展。该模型的出现预示着AI正从“能回答问题”向“能深入研究问题”迈进,未来的AI将不再仅仅是聊天工具,而是能够真正帮助我们解决复杂问题、参与决策过程的强大伙伴,DeepResearch正在加速这一愿景的实现。

大家好,我是小悟。

最近,阿里通义正式开源了他们的首个深度研究Agent模型——DeepResearch。

简单来说,它是一种能像人类研究员一样,自主完成信息搜集、分析、推理,最后形成有价值结论的AI模型。

根据公开信息,它在多个国际权威评测集上,比如HLE、GAIA、BrowseComp这些“硬核考试”中,都拿到了SOTA的成绩。

更厉害的是,它只用了3B的激活参数,就超越了像OpenAI的o3、DeepSeek-V3.1和Claude-4-Sonnet这些动辄更大更复杂的模型所驱动的Agent。

并不是靠堆参数或者砸数据来硬推效果,而是搭建了一套以合成数据为核心、贯穿预训练和后训练的完整训练体系。

说白了,就是用更聪明、更高效的方式去“教”这个模型,让它不仅学得快,而且学得准,还能举一反三。

另外,在推理阶段他们也做了创新,设计了两种模式:一个是ReAct,用来考察模型的基础能力。

另一个是他们自研的IterResearch驱动的Heavy模式,专门用来挖掘模型在长时间、复杂任务中的潜力。

这就好比一个学生,不仅能答好基础题,还能在面对压轴大题时稳住心态、一步步拆解问题,最终给出高分答案。

值得一提的是,这个模型可不是只存在于实验室里的“理论派”。阿里已经把它用在一些实际场景中了,比如跟高德合作推出的“小高老师”,能帮你做复杂的旅行规划。

还有通义法睿,据说能像初级律师那样,自动检索案例、分析法规,做法律方面的深度研究。

这些落地应用,证明DeepResearch不只是刷榜神器,而是真的有能力在现实世界中解决问题。

其实,这并不是阿里第一次在Agent领域发力。今年他们还陆续开源了WebWalker、WebDancer、WebSailor等项目,在智能体的数据合成和强化学习方面也取得了很不错的成绩。

可以说,DeepResearch的开源,是他们在这一方向上的又一个重要里程碑,也进一步丰富了他们在开源生态中的布局。

从个人角度来看,这次DeepResearch的开源,不仅仅是一个技术突破,更像是一种信号:AI正在从“能回答问题”向“能深入研究问题”迈进。

而阿里用一个相对轻量级(3B激活参数)的模型做到这一点,给整个行业都提供了新的思路和可能性。

未来的AI,肯定不是只会聊天的工具,而是能真正帮我们解决问题、甚至参与到复杂决策过程中的伙伴。而像DeepResearch这样的模型,正在让这一天加速到来。

阿里这次不仅开源了模型本身,连框架和方案都一并开放了,代码托管在GitHub、Hugging Face和魔搭社区,可以直接去下载、研究和二次开发。

快速入门

1、环境配置

推荐 Python 版本:3.10.0(使用其他版本可能导致依赖问题)。

强烈建议使用 conda 或 virtualenv 创建隔离环境。

# Example with Condaconda create -n react_infer_env python=3.10.0 conda activate react_infer_env

2、安装

安装所需的依赖项:

pip install -r requirements.txt

3、准备评估数据

在项目根目录下创建一个名为 eval_data/ 的文件夹。

将您的QA文件以JSON格式放置在这个目录中,例如 eval_data/example.json。

每一行必须是一个包含以下两个键的 JSON 对象:

{"question": "...","answer": "..."}

在 eval_data 文件夹中提供了一个示例文件供参考。

如果你计划使用文件解析器工具, 需将文件名添加到问题字段前 ,并将引用的文件放置在 eval_data/file_corpus/ 目录内。

4、配置推理脚本

打开 run_react_infer.sh,并按照注释中的说明修改以下变量:

MODEL_PATH - 本地或远程模型权重的路径。

DATASET - 评估集的路径,例如 example。

OUTPUT_PATH - 用于保存预测结果的路径,例如 ./outputs。

根据您启用的工具(检索、计算器、网络搜索等),提供所需的 API_KEY、BASE_URL 或其他凭证。每个密钥在 bash 脚本中均有内联说明。

5、运行推理脚本

bash run_react_infer.sh

这种开放的态度,对于整个AI社区的推动作用是巨大的。毕竟,只有更多人参与进来,这个技术才能更快进化,应用场景也能更广。

谢谢你看我的文章,既然看到这里了,如果觉得不错,随手点个赞、转发、在看三连吧,感谢感谢。那我们,下次再见。

您的一键三连,是我更新的最大动力,谢谢

山水有相逢,来日皆可期,谢谢阅读,我们再会

我手中的金箍棒,上能通天,下能探海

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepResearch 阿里通义 Agent模型 AI研究 开源 轻量级模型 合成数据 推理能力 自然语言处理 人工智能 Alibaba Tongyi Agent Model AI Research Open Source Lightweight Model Synthetic Data Inference Capability Natural Language Processing Artificial Intelligence
相关文章