热点
关于我们
xx
xx
"
Flow-GRPO
" 相关文章
AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o
36氪 - 科技频道
2025-10-24T16:04:32.000000Z
AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o
36氪 - 科技频道
2025-10-24T16:04:32.000000Z
AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o
量子位
2025-10-24T09:45:59.000000Z
Stanford Researchers Released AgentFlow: In-the-Flow Reinforcement Learning RL for Modular, Tool-Using AI Agents
MarkTechPost@AI
2025-10-09T02:26:00.000000Z
Stanford Researchers Released AgentFlow: In-the-Flow Reinforcement Learning RL for Modular, Tool-Using AI Agents
MarkTechPost@AI
2025-10-09T02:26:00.000000Z
In-the-Flow Agentic System Optimization for Effective Planning and Tool Use
cs.AI updates on arXiv.org
2025-10-08T04:06:30.000000Z
首次!流匹配模型引入GRPO,GenEval几近满分,组合生图能力远超GPT-4o
掘金 人工智能
2025-05-13T09:48:01.000000Z