智源社区 09月17日
宇树发布UnifoLM-WMA-0,世界模型助力机器人动作规划
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

宇树科技发布了其最新的开源模型UnifoLM-WMA-0,一个集成了世界模型与动作架构的通用机器人学习解决方案。该模型的核心在于其世界模型能够理解机器人与环境的物理交互规律,并在真机部署中展现出色的表现,如精准的堆积木操作和精细的文具收纳。UnifoLM-WMA-0能预测后续动作视频,并与实际操作高度吻合。该模型属于UnifoLM系列,专为通用机器人学习设计,可适配多种机器人本体。其训练代码、推理代码及模型Checkpoints均已开源,并在GitHub上获得广泛关注。模型训练策略包括对视频生成模型的微调以及基于世界模型的策略架构,该架构支持决策和仿真两种模式,通过预测关键信息和模拟环境反馈来优化动作生成,并利用宇树科技的开源数据集完成了全流程训练,在仿真引擎应用上效果突出。

🤖 **世界模型理解物理交互**: UnifoLM-WMA-0的核心亮点在于其世界模型,该模型能够深刻理解机器人与环境进行物理交互时的规律。通过真机测试,模型在堆积木等任务中表现出极高的稳定性,并且能够准确预测后续动作视频,与实际操作情况高度吻合,这为机器人执行复杂任务提供了强大的底层支持。

🛠️ **通用机器人学习架构**: 作为UnifoLM(Unitree机器人统一大模型)系列的新成果,UnifoLM-WMA-0专为通用机器人学习量身打造,具备高度的适配性,能够支持多种不同的机器人本体。这意味着该模型有望成为机器人领域的一个通用性解决方案,降低机器人学习和部署的门槛。

🧠 **双模式策略架构**: 该模型采用了基于世界模型的策略架构,该架构支持两种关键功能模式:决策模式和仿真模式。决策模式能够提前预测机器人与环境交互的关键信息,辅助策略生成更精准的下一步动作;仿真模式则能根据机器人已执行的动作,生成高度还原真实场景的环境反馈,为机器人提供逼真的模拟训练环境,从而提升其在复杂场景下的适应能力。

一觉醒来,宇树带着最新开源模型来了!

这次开源的是一个世界模型-动作架构,名叫UnifoLM-WMA-0。它的核心之处在于拥有一个世界模型能够理解机器人和环境相互作用时的物理规律

咱先瞧瞧真机部署后的表现。

玩堆积木,稳稳当当。重点是,右上角小窗口呈现出世界模型对后续动作视频的预测,能发现和实际操作情形十分吻合

两只机械臂搭档干活也可以:

像收纳文具这类稍精细的活儿,都能轻松拿捏:

将相机放入包装盒,世界模型的预测同样和实际操作几乎无差:

官方称,UnifoLM-WMA-0属于UnifoLM(Unitree机器人统一大模型)系列成果,是团队专为通用机器人学习量身打造的,能适配多种机器人本体

目前UnifoLM-WMA-0训练代码、推理代码、模型Checkpoints通通开源,GitHub迅速揽获100+Star。

网友看后纷纷点赞。

如何训练的?

官方介绍了模型的训练策略,具体流程和设计思路可以拆解成这几步来看。

首先,团队先拿Open-X数据集对视频生成模型做了针对性微调,核心目的就是让模型原本的生成能力适配机器人的实际作业场景。

至于微调后模型在测试集上的实际生成效果,是这样婶儿的:

团队进一步提出了基于世界模型打造的策略架构,即UnifoLM-WMA-0。

这个架构里的世界模型不是单一模式运行,而是支持两种核心功能模式。

一种是决策模式,简单说就是能提前预测机器人和环境进行物理交互时的关键信息,辅助策略更精准地生成下一步动作。

另一种是仿真模式,主要是根据机器人已经做出的动作,生成高度还原真实场景的环境反馈,相当于给机器人模拟出一个逼真的交互环境。

针对这两种模式,团队在下游任务数据集上分别做了后训练优化。

以下是完整的系统架构及工作流程:

团队用了宇树科技公开的五个开源数据集,最终完成了全流程训练。

从测试结果来看,这个模型要是当作仿真引擎来用,效果突出。

只要给它“当前场景的图像”,再加上一定数量的“机器人未来要做的动作指令”,它就能实现可控的交互生成,生成的内容能精准匹配预期。

生成结果和原视频的对比情况,大家可以通过下面的图直观感受:

面对长程任务的持续交互生成也能应对,生成结果和原视频的对比如下:

GitHub:https://github.com/unitreerobotics/unifolm-world-model-action/tree/main
项目主页:https://unigen-x.github.io/unifolm-world-model-action.github.io/

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

📺 明晚20点得到APP联创和Get笔记负责人快刀青衣将做客AI 100访谈间,从Get笔记的经验与思考出发,聊聊知识领域的AI新时代。欢迎扫码预约直播!Have Fun~

一键关注 👇 点亮星标

科技前沿进展每日见

内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

UnifoLM-WMA-0 宇树科技 世界模型 机器人学习 动作规划 AI 开源模型 Unitree Robotics World Model Robot Learning Action Planning Open-Source Model
相关文章