oschina.net 09月30日
北京人形机器人中心研发SEEA-R1强化微调框架
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

北京人形机器人创新中心与北京大学合作研发的强化微调框架SEEA-R1被NeurIPS接收,通过‘数据进化+模型进化’机制支持多模态大模型稳定训练。

北京人形机器人创新中心发文称,其大模型研发团队携手北京大学计算机学院多媒体信息处理国家重点实验室研发的强化微调框架 SEEA-R1,已被人工智能顶级会议 NeurIPS 接收。 根据介绍,SEEA-R1 通过“数据进化 + 模型进化”的闭环机制破解难题:Tree-GRPO 将稀疏奖励转化为逐步密集反馈,支持多模态大模型稳定训练;MGRM ...

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

人形机器人 强化学习 SEEA-R1 NeurIPS 大模型
相关文章