波士顿动力公司的四足机器人Spot近日通过强化学习掌握了后空翻技能。这一能力并非客户直接需求,但能显著提升机器人在复杂地形下的生存能力,如跌倒后迅速调整姿态以保护关键传感器。训练过程经历了从计算机模拟到在体操垫上测试,再到高风险环境的逐步演进。Spot成功完成连续后空翻后,其行走姿态也变得更加自然流畅,接近真实四足动物的运动模式。强化学习通过大量的试错和反馈调整,赋予了Spot精确的身体控制能力,甚至能在前腿安装滚轮的情况下保持平衡。
🤖 **后空翻技能提升机器人适应性**:波士顿动力Spot机器人通过强化学习掌握了后空翻这一高难度动作,这并非客户的直接需求,但能够显著增强机器人在复杂或极端情况下的生存能力,例如在意外跌倒、滑倒或被绊倒后,能够更有效地调整姿态,从而保护其机身及背部昂贵的传感器免受损坏。
🤸 **循序渐进的训练挑战**:Spot的后空翻训练过程经过精心设计,首先在计算机中进行模拟,随后在真实机器人上应用。为了降低风险,团队先在体操垫上进行初步测试,然后逐步增加难度,让Spot在更高风险的环境中完成动作,确保了训练的安全性和有效性。
🐾 **行走姿态的优化**:解锁连续后空翻技能为Spot带来了意想不到的“副产品”——其行走姿态变得更加自然和流畅,动作模式更接近真实的四足动物。这表明了强化学习在提升机器人运动协调性和灵活性方面的潜力。
🧠 **强化学习的核心作用**:整个训练过程的核心是强化学习。通过大量的试错和反馈调整,Spot逐渐学会了精确的身体控制能力,甚至在技术挑战更大的前腿安装滚轮的情况下,依然能够保持身体的平衡,展现了AI在复杂运动控制领域的强大能力。
IT之家 8 月 28 日消息,科技媒体 notebookcheck 昨日(8 月 27 日)发布博文,报道称波士顿动力公司宣布,其四足机器人犬 Spot 通过强化学习掌握了多次后空翻。
IT之家附上演示视频如下:
官方表示这一动作并非客户的直接需求,但这背后的强化学习训练能显著提升 Spot 在极端情况下的生存能力,例如在跌倒、滑倒或绊倒时更好地调整姿态,从而保护机身及背部昂贵的传感器免受损坏。

在研发过程中,波士顿动力首先在计算机中模拟后空翻动作。然而,正如公司机器人工程师阿伦・库马尔在视频中介绍的那样,初期将训练成果应用到真实机器人上几乎每次都会失败。
为了减少损坏风险,团队最初在体操垫上进行测试,随后逐渐增加挑战难度,直至让 Spot 在更高风险的环境中完成动作。
波士顿动力表示,Spot 解锁连续后空翻这个高难度技能后,还带来了意外收获 —— 其行走姿态变得更加自然,接近真实四足动物的动作模式。
强化学习是此次训练的核心方法。通过大量试错与反馈调整,Spot 逐渐掌握了精确的身体控制能力,甚至能在前腿安装滚轮的情况下保持平衡。