2025-10-27 11:40 湖北
层级 名称 典型特征 工业示例 L1 流程执行系统 单次指令→单次输出 Text-to-SQL 报表生成 L2 交互式问题求解 人机闭环、工具调用 金融报表问答、GUI 自动化 L3 端到端自主系统 自主分解-执行-反思 AI Scientist 自动生成论文 L4 协同智能系统 多 Agent 分工协作 数字孪生工厂排产优化 L5 自适应社会系统 自主目标演化、文化涌现 城市级能源-交通共生治理 阶段 关键词 代表工作 工业落地提示 瞬时记录 Context Window ReAct、LongChat 单轮工单处理 被动检索 RAG ChatDB、MemoryBank 维修手册秒级查询 主动内化 经验蒸馏 Reflexion、ExpeL 设备故障模式自学习 集体记忆 共享池 AutoGen、MetaGPT 跨班组知识不丢失 阶段 能力 案例 工业价值 指令驱动 固定 API PAL、CoT 把计算器塞进 LLM 目标驱动 动态选型 ToolLLM、Gorilla 万级 API 自动匹配 组合编排 toolchain 规划 Chameleon、ToolChain* 复杂工艺一键串联 创造工具 代码即工具 CREATOR、AutoGPT 现场缺啥 API 自己写 层级 数字工程 科学发现 具身智能 商业执行 社会模拟 L1 Text-to-SQL - - 报表抽取 - L2 GUI 自动化 ChemCrow - 金融投顾 - L3 AutoDev 编程 AI Scientist Voyager 采矿 智能运维 - L4 多 Agent 编码 材料设计 机器人集群 供应链协同 城市交通仿真 L5 - - - DAO 自治组织 城市-能源共生 维度 代表基准 工业级痛点 记忆 MemoryAgentBench、LoCoMo 长周期遗忘、隐私泄露 规划 FlowBench、NATURAL PLAN 真实业务规则复杂 工具 ToolBench、Seal-Tools API 格式漂移、权限黑洞 行业 SWE-bench、FinArena、MedChain 合规、实时、高风险 推荐阅读 动手设计AI Agents:(编排、记忆、插件、workflow、协作)2. 为什么需要“工业 Agent 专用标尺”?
工业 Agent 五层能力成熟度框架
🔍 观点:工业场景高可靠、高合规、高实时,通用 Agent 的“玩具 Demo”无法直接平移,必须按“成熟度”逐级爬升。
3. 三大技术支柱如何“爬楼梯”?
3.1 记忆:从瞬时上下文到群体文化记忆记忆机制的四阶段演化
3.2 规划:从线性链式到自主目标生成规划能力四连跳线性链式(L1) → CoT、Plan-and-Solve反应式闭环(L2) → ReAct、LLM+PDDL 符号规划全局深度探索(L3) → Tree-of-Thought、LLM-MCTS、Reflexion协同-自主目标(L4-L5) → HuggingGPT、AI 城市规划师,机器自己提出 KPI!3.3 工具:从“会调用”到“会造轮子”
工具使用的四阶段
4. 产业地图:50+ 场景全覆盖
5. 评测:300+ 基准大盘点
Empowering Real-World: A Survey on the Technology, Practice, and Evaluation of LLM-driven Industry Agents https://arxiv.org/pdf/2510.17491
每天一篇大模型Paper来锻炼我们的思维~已经读到这了,不妨点个👍、❤️、↗️三连,加个星标⭐,不迷路哦~
