对话星动纪元陈建宇：世界模型是VLA的一个路径，未来5年家庭机器人会爆发

星动纪元创始人、清华大学交叉信息研究院助理教授陈建宇

关于究竟该发展 VLA 模型，还是深耕世界模型，如今似乎已有了新的判断方向。

8月12日消息，2025世界机器人大会（WRC）主论坛演讲上，星动纪元创始人、清华大学交叉信息研究院助理教授陈建宇表示，通用人形机器人一定是未来AI技术的一个趋势。由于机器人有更强大、更通用的移动和操作能力，未来必将给人类生产力和社会服务能力带来革新。

“我们如何构建一个通用人形机器人？最短的路径就是直接向人学习，因为人类是现实世界中唯一存在的通用的具身智能体。”陈建宇表示，通用大脑、通用本体相融合，使得我们能够找到一个构建通用人形机器人的范式。

会后媒体群访中，陈建宇对笔者表示，VLA被认为是一个更广泛的概念，只要机器人用到视觉感知、语言、行为动作，我们都认为是一个VLA模型。因此，从整个意义上来说，世界模型是VLA技术的一个路径。

“我们认为，下一个范式的VLA，更倾向于说更广义上的VLA模型，不局限于某一个VLA模型架构，只要是端到端的模型，它能够跟人进行语言交互、视觉感知，可以在物理世界里面干活，它就是一个VLA的模型。只不过，世界模型会在现有狭义VLA模型范式上进一步通过技术（包括RL强化学习等），改进它的精细化操作、泛化、认知能力等。”陈建宇称。

对于数据和模型目前孰重孰轻，陈建宇表示，相比数据瓶颈，现阶段大家应该更关注模型。

“未来迭代模型需要的数据绝对数量肯定越来越大，但我强调的是数据利用效率，在同样的情况下，只需要更少的数据，让数据利用效率更高，但数据量仍需要很大，因为现在数据量还是不够。”陈建宇称，大家关注数据，其实更上层是模型，如果只关注一个的话，应该先关注模型。

陈建宇强调，未来五年，可能是家用机器人爆发的时间点。“扫地机器人等产品已逐步进入家庭。未来几年将很快出现相对简单形态的机器人进入到家庭里面，也可能有少部分的高净值人士家庭，会直接用到比较通用的人形机器人以尝鲜使用。”

据悉，星动纪元成立于2023年8月，最初是清华大学交叉信息研究院的孵化项目。从成立起，星动纪元便坚持软硬一体的技术路线，致力于打造物理世界中的通用智能体，让AI从思考走向行动，实现机器人赋能千行百业、走进千家万户的愿景。星动纪元创始人陈建宇，目前还是上海期智研究院PI，清华大学交叉信息研究院助理教授。

融资层面，在成立不到两年里，星动纪元已完成3轮融资，背后集结了众多知名投资方，包括联想创投、海尔创投、华映资本等产业资本与专业投资机构。今年7月初，公司宣布完成近5亿元A轮融资，由鼎晖VGC和海尔资本联合领投。

产品层面，星动纪元主要在通用大脑、通用本体等多个方面进行具身智能机器人的研发和落地。

其中，通用大脑侧，星动纪元提出融合理解与生成的VLA模型ERA-42，将视觉、理解、预测、行动等功能统一到一个端到端的模型中，目前星动纪元机器人产品，通过语音命令即可完成上百种复杂操作，包括柔性物品分拣、扫码，使用螺钉枪、移液器等。此外，星动纪元还构建了物理世界AI“模型-本体-场景数据”，进一步提升具身智能机器人的交互能力。

通用本体侧，星动纪元自研人形机器人在性能上逼近人类身体，并作为与物理世界交互的“通用接口”。其中，星动L7是一款全尺寸双足人形机器人，采用模块化设计思路，能更灵活地适配不同场景的落地需求，尤其是物流领域的分拣、扫码等任务，通过自研端到端的VLA模型直接控制机器人精准完成操作；另一款产品星动Q5，是公司面向服务业打造的人形机器人。这让它在生活化服务场景中更具优势，比如完成递水等日常操作，或是实现高度拟人化的交互沟通。目前星动Q5已在零售门店等场景中推进落地探索。

此外，星动纪元还自研灵巧手XHand 1，具备12个主动自由度和内置的触觉传感器，能够实现高度精确地控制，能完成上千个灵巧动作。

陈建宇认为，人形机器人是具身智能发展的终极形态。这是因为人形机器人不仅在数据获取方面有显著优势，能够直接从人类行为中更自然地学习，还具备高效的双足移动与双手操作能力，极大地扩展了机器人的应用边界。星动纪元正通过结合具身智能模型与创新硬件，逐步实现人形机器人的通用性与实用性。

对于为何难以实现端到端VLA，陈建宇表示，主要有两点：一是世界模型需要融入到生成式模型当中，实现对未来的预测、认知和生成式行为；二是RL，即VLA的强化学习、运动控制模型，提升机器人的通用泛化能力，这将成为通用范式。

“王兴兴总这边提到的，其实也是我们想说的。世界模型这一板块，其实我们做出来了全球首个融合世界模型和生成式模型工作，去年就陆续发布好几篇论文，在业内也形成比较多的讨论。所以，现在已经有不少同行开始关注合作（世界模型）这块，我们认为，未来很快就会形成一个新的共识。”陈建宇表示，目前星动纪元已开源了全球第一个做出运控强化学习的算法以及VLA生成式模型，后续公司还会做开源，因为具身智能还是需要整个生态共同努力和繁荣，实现更多突破。

对于商业化，陈建宇曾表示，星动纪元将优先聚焦B端场景落地，无论是工业制造领域的自动化作业，还是服务业中的场景化服务，都会以B端市场为切入点，逐步渗透并验证商业价值。

今天群访中，陈建宇补充称，在一些真实工业场景中，目前智能机器人已经达到人类70%的效率，明年能达到90%左右。未来是软件和硬件的打磨阶段和过程，也是发挥端到端模型的优势——能实时反馈、实时控制。“假以时日，我相信（机器人）能达到人类的水平。”

陈建宇近期还表示，具身智能行业尚未出现所谓的“泡沫”。在他看来，行业估值规模未达到智能汽车同等量级，原因在于周期更长且尚未找到核心规模化商业应用的闭环，未来一旦头部企业（如特斯拉等）实现规模化商业落地，行业有可能将迎来第二波大的资本爆发。

陈建宇强调，人形机器人的“杀手级”应用场景，最终还是要进入家庭。但是前期，大家需要在一些企业（B）端场景里面落地先行，并且磨炼机器人数据积累等整套技术，让机器人产业飞轮先转起来。

“但人形机器人最终杀手级的应用，我认为一定在家庭里面。”陈建宇称。

（本文首发于钛媒体App，作者｜林志佳，编辑｜盖虹达）

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签