热点
"Flow-GRPO" 相关文章
AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o
36氪 - 科技频道 2025-10-24T16:04:32.000000Z
AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o
36氪 - 科技频道 2025-10-24T16:04:32.000000Z
AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o
量子位 2025-10-24T09:45:59.000000Z
Stanford Researchers Released AgentFlow: In-the-Flow Reinforcement Learning RL for Modular, Tool-Using AI Agents
MarkTechPost@AI 2025-10-09T02:26:00.000000Z
Stanford Researchers Released AgentFlow: In-the-Flow Reinforcement Learning RL for Modular, Tool-Using AI Agents
MarkTechPost@AI 2025-10-09T02:26:00.000000Z
In-the-Flow Agentic System Optimization for Effective Planning and Tool Use
cs.AI updates on arXiv.org 2025-10-08T04:06:30.000000Z
首次!流匹配模型引入GRPO,GenEval几近满分,组合生图能力远超GPT-4o
掘金 人工智能 2025-05-13T09:48:01.000000Z