SimpleVLA-RL：清华团队发布轻量级强化学习视觉-语言-动作模型

oschina.net 09月16日

清华与上海AI Lab合作团队推出SimpleVLA-RL，强化学习扩展视觉-语言-动作模型训练，提升长时规划能力，超越监督微调基线。

清华联手上海AI Lab组建的PRIME-RL团队发布SimpleVLA-RL，这是一个基于强化学习扩展Vision-Language-Action模型训练的轻量框架。项目受DeepSeek-R1启发，仅用0/1规则奖励即可在仿真环境中完成在线RL，显著提升长时规划能力并超越监督微调基线。该框架利用强化学习扩展视觉-语言-动作模型的训练，有效提升了模型的长时规...

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签