钛媒体:引领未来商业与生活新知 08月12日
对话星动纪元陈建宇:世界模型是VLA的一个路径,未来5年家庭机器人会爆发
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

星动纪元创始人陈建宇在2025世界机器人大会上指出,通用人形机器人是未来AI技术的重要趋势,其强大的移动和操作能力将革新人类生产力。他认为,通过学习人类这一现实世界中的通用具身智能体,是构建通用人形机器人的最短路径。陈建宇对VLA模型的理解更偏向广义概念,强调端到端模型在物理世界中的交互能力,并认为世界模型是VLA技术发展的一个重要路径。他同时指出,当前应更关注模型而非数据瓶颈,并预测未来五年将是家用机器人爆发期,人形机器人最终的杀手级应用场景将出现在家庭。

🌟 通用人形机器人是未来AI趋势:陈建宇认为,通用人形机器人因其强大的移动和操作能力,将为人类生产力和社会服务带来革命性变革。构建通用人形机器人的关键在于“向人学习”,将通用大脑与通用本体融合。

💡 VLA模型与世界模型的辩证关系:陈建宇将VLA视为一个更广泛的概念,包含视觉感知、语言和行为动作。他认为世界模型是实现VLA技术的一个重要路径,能通过RL等技术提升机器人的精细操作、泛化和认知能力,是下一代VLA模型的方向。

🚀 模型迭代比数据更关键:在当前阶段,陈建宇强调应更关注模型的迭代和效率,而非仅仅是数据量。提高数据利用效率,用更少的数据实现更好的模型效果,是未来发展的重点,但同时需要大量的数据支撑。

🏠 家用机器人市场潜力巨大:陈建宇预测,未来五年将是家用机器人爆发的时期,简单形态的机器人将逐步进入家庭。尽管初期主要聚焦B端场景落地,但最终人形机器人的“杀手级”应用场景会出现在家庭。

🛠️ 星动纪元的技术路线与产品布局:星动纪元坚持软硬一体路线,致力于打造物理世界中的通用智能体。其产品包括融合VLA模型ERA-42的通用大脑,以及性能逼近人类的自研人形机器人星动L7和星动Q5,并已开源运控强化学习算法与VLA生成式模型,推动行业生态发展。

星动纪元创始人、清华大学交叉信息研究院助理教授 陈建宇

关于究竟该发展 VLA 模型,还是深耕世界模型,如今似乎已有了新的判断方向。

8月12日消息,2025世界机器人大会(WRC)主论坛演讲上,星动纪元创始人、清华大学交叉信息研究院助理教授陈建宇表示,通用人形机器人一定是未来AI技术的一个趋势。由于机器人有更强大、更通用的移动和操作能力,未来必将给人类生产力和社会服务能力带来革新。

“我们如何构建一个通用人形机器人?最短的路径就是直接向人学习,因为人类是现实世界中唯一存在的通用的具身智能体。”陈建宇表示,通用大脑、通用本体相融合,使得我们能够找到一个构建通用人形机器人的范式。

会后媒体群访中,陈建宇对笔者表示,VLA被认为是一个更广泛的概念,只要机器人用到视觉感知、语言、行为动作,我们都认为是一个VLA模型。因此,从整个意义上来说,世界模型是VLA技术的一个路径。

“我们认为,下一个范式的VLA,更倾向于说更广义上的VLA模型,不局限于某一个VLA模型架构,只要是端到端的模型,它能够跟人进行语言交互、视觉感知,可以在物理世界里面干活,它就是一个VLA的模型。只不过,世界模型会在现有狭义VLA模型范式上进一步通过技术(包括RL强化学习等),改进它的精细化操作、泛化、认知能力等。”陈建宇称。

对于数据和模型目前孰重孰轻,陈建宇表示,相比数据瓶颈,现阶段大家应该更关注模型。

“未来迭代模型需要的数据绝对数量肯定越来越大,但我强调的是数据利用效率,在同样的情况下,只需要更少的数据,让数据利用效率更高,但数据量仍需要很大,因为现在数据量还是不够。”陈建宇称,大家关注数据,其实更上层是模型,如果只关注一个的话,应该先关注模型。

陈建宇强调,未来五年,可能是家用机器人爆发的时间点。“扫地机器人等产品已逐步进入家庭。未来几年将很快出现相对简单形态的机器人进入到家庭里面,也可能有少部分的高净值人士家庭,会直接用到比较通用的人形机器人以尝鲜使用。”

据悉,星动纪元成立于2023年8月,最初是清华大学交叉信息研究院的孵化项目。从成立起,星动纪元便坚持软硬一体的技术路线,致力于打造物理世界中的通用智能体,让AI从思考走向行动,实现机器人赋能千行百业、走进千家万户的愿景。星动纪元创始人陈建宇,目前还是上海期智研究院PI,清华大学交叉信息研究院助理教授。

融资层面,在成立不到两年里,星动纪元已完成3轮融资,背后集结了众多知名投资方,包括联想创投、海尔创投、华映资本等产业资本与专业投资机构。今年7月初,公司宣布完成近5亿元A轮融资,由鼎晖VGC和海尔资本联合领投。

产品层面,星动纪元主要在通用大脑、通用本体等多个方面进行具身智能机器人的研发和落地。

其中,通用大脑侧,星动纪元提出融合理解与生成的VLA模型ERA-42,将视觉、理解、预测、行动等功能统一到一个端到端的模型中,目前星动纪元机器人产品,通过语音命令即可完成上百种复杂操作,包括柔性物品分拣、扫码,使用螺钉枪、移液器等。此外,星动纪元还构建了物理世界AI“模型-本体-场景数据”,进一步提升具身智能机器人的交互能力。

通用本体侧,星动纪元自研人形机器人在性能上逼近人类身体,并作为与物理世界交互的“通用接口”。其中,星动L7是一款全尺寸双足人形机器人,采用模块化设计思路,能更灵活地适配不同场景的落地需求,尤其是物流领域的分拣、扫码等任务,通过自研端到端的VLA模型直接控制机器人精准完成操作;另一款产品星动Q5,是公司面向服务业打造的人形机器人。这让它在生活化服务场景中更具优势,比如完成递水等日常操作,或是实现高度拟人化的交互沟通。目前星动Q5已在零售门店等场景中推进落地探索。

此外,星动纪元还自研灵巧手XHand 1,具备12个主动自由度和内置的触觉传感器,能够实现高度精确地控制,能完成上千个灵巧动作。

陈建宇认为,人形机器人是具身智能发展的终极形态。这是因为人形机器人不仅在数据获取方面有显著优势,能够直接从人类行为中更自然地学习,还具备高效的双足移动与双手操作能力,极大地扩展了机器人的应用边界。星动纪元正通过结合具身智能模型与创新硬件,逐步实现人形机器人的通用性与实用性。

对于为何难以实现端到端VLA,陈建宇表示,主要有两点:一是世界模型需要融入到生成式模型当中,实现对未来的预测、认知和生成式行为;二是RL,即VLA的强化学习、运动控制模型,提升机器人的通用泛化能力,这将成为通用范式。

“王兴兴总这边提到的,其实也是我们想说的。世界模型这一板块,其实我们做出来了全球首个融合世界模型和生成式模型工作,去年就陆续发布好几篇论文,在业内也形成比较多的讨论。所以,现在已经有不少同行开始关注合作(世界模型)这块,我们认为,未来很快就会形成一个新的共识。”陈建宇表示,目前星动纪元已开源了全球第一个做出运控强化学习的算法以及VLA生成式模型,后续公司还会做开源,因为具身智能还是需要整个生态共同努力和繁荣,实现更多突破。

对于商业化,陈建宇曾表示,星动纪元将优先聚焦B端场景落地,无论是工业制造领域的自动化作业,还是服务业中的场景化服务,都会以B端市场为切入点,逐步渗透并验证商业价值。

今天群访中,陈建宇补充称,在一些真实工业场景中,目前智能机器人已经达到人类70%的效率,明年能达到90%左右。未来是软件和硬件的打磨阶段和过程,也是发挥端到端模型的优势——能实时反馈、实时控制。“假以时日,我相信(机器人)能达到人类的水平。”

陈建宇近期还表示,具身智能行业尚未出现所谓的“泡沫”。在他看来,行业估值规模未达到智能汽车同等量级,原因在于周期更长且尚未找到核心规模化商业应用的闭环,未来一旦头部企业(如特斯拉等)实现规模化商业落地,行业有可能将迎来第二波大的资本爆发。

陈建宇强调,人形机器人的“杀手级”应用场景,最终还是要进入家庭。但是前期,大家需要在一些企业(B)端场景里面落地先行,并且磨炼机器人数据积累等整套技术,让机器人产业飞轮先转起来。

“但人形机器人最终杀手级的应用,我认为一定在家庭里面。”陈建宇称。

(本文首发于钛媒体App,作者|林志佳,编辑|盖虹达)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

人形机器人 具身智能 VLA模型 世界模型 星动纪元
相关文章