Datawhale 09月12日
NeurIPS 2025世界模型Workshop聚焦具身决策
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Datawhale成员王琦与多所高校学者共同组织了NeurIPS 2025世界模型Workshop“Embodied World Models for Decision Making”,会议将在美国圣迭戈举行,截稿日期为9月1日。本次Workshop聚焦于世界模型在决策制定中的应用,探讨了基于模型的强化学习、长程规划、机器人学习中的仿真与现实物理对齐、交互式场景生成、视频-语言-动作模型以及开放世界应用等多个前沿方向。Genie 3的核心贡献者Philip Ball也将进行分享,欢迎学者们投稿参与。

⭐ **Workshop主题与组织:** Datawhale成员王琦与上海交通大学、香港科技大学、清华大学等机构学者共同组织了NeurIPS 2025世界模型Workshop,主题为“Embodied World Models for Decision Making”,旨在探讨世界模型在具身决策中的理论基础、算法创新及实际应用。会议将在美国圣迭戈举行,投稿截止日期为9月1日UTC-0。

🧠 **核心议题与研究方向:** Workshop重点关注多个前沿研究方向,包括:1. **基于模型的强化学习与长程规划**,探讨世界模型如何提升样本效率和长程规划能力;2. **机器人学习中的仿真与现实物理对齐**,研究如何弥合仿真与现实的差距;3. **交互式场景生成与下游任务构建**,开发物理合理、语义一致的交互式视频模拟模型;4. **视频-语言-动作(VLA)模型与大语言模型中的世界知识利用**,探索多模态表示统一与世界知识引导决策;5. **更广泛场景的应用**,如开放世界游戏与自动驾驶中的具身智能体部署。

📚 **组织者背景与贡献:** Datawhale成员王琦不仅是本次Workshop的组织者,也是上海交通大学人工智能教育部重点实验室的博士研究生,专攻视觉强化学习与世界模型。他同时也是《Easy RL:强化学习教程》、《深度学习详解》、《Joy RL:强化学习实践教程》等书籍的作者,并在开源学习社区贡献了如“Easy-RL”和“LeeDL-Tutorial”等广受欢迎的项目,其中“Easy-RL”获得了牛津大学的馆藏收录和多位学者的推荐。

2025-08-25 22:21 浙江

 Datawhale顶会 

组织者:王琦,Datawhale成员

Datawhale 成员王琦与来自上海交通大学、香港科技大学、清华大学、宁波东方理工大学等机构的学者组织了 NeurIPS 2025 世界模型 Workshop “Embodied World Models for Decision Making”。

地点:San Diego, CA, USA 

截稿时间:91 11:59PM UTC-0 

网站:https://embodied-world-models.github.io/

Datawhale组织者王琦

Datawhale 成员,上海交通大学人工智能教育部重点实验室博士研究生,主要研究方向为视觉强化学习与世界模型。《Easy RL:强化学习教程》《深度学习详解》、《Joy RL:强化学习实践教程》 书籍作者,在开源学习社区持续参与贡献:

1. Easy-RL(蘑菇书)

面向初学者的强化学习中文教程,包含经典理论与实战案例。GitHub星标超12.3K,被牛津大学墨顿学院图书馆收录,获李宏毅、汪军、周博磊等学者推荐,豆瓣评分8.3。

被牛津大学墨顿学院图书馆馆藏收录

2. LeeDL-Tutorial(李宏毅深度学习教程)

李宏毅《机器学习》课程的配套开源教材,覆盖深度学习全领域,得到台大李宏毅教授本人的认可和推荐,目前GitHub星标达15.6K,并被百所高校采用为教辅。

3. JoyRL-Book(强化学习实践教程)

Datawhale打造的强化学习进阶实践指南,聚焦工业级应用,获得浙江大学人工智能研究所所长吴飞、上海交大ACM班创始人俞勇的推荐。

投稿 NeurIPS workshop

NeurIPS 是机器学习和计算神经科学领域的顶级国际会议之一。本次举办的 NeurIPS 2025 世界模型 workshop,主题为“Embodied World Models for Decision Making”,关注世界模型相关的理论基础、算法创新或实际应用。Genie 3 的核心贡献者 Philip Ball 也会给 Talk。欢迎大家参加、投稿~

投稿主题

基于模型的强化学习与长程规划

探讨世界模型如何助力基于模型的强化学习,重点关注样本效率、性能表现以及可扩展性。特别强调长程规划(long-horizon planning)问题,即要求智能体在时间跨度较大的任务中,推理并执行一系列连续动作、预测延迟反馈结果,并在面对不确定性和有限反馈的情况下,仍能在时间上保持策略一致性。

机器人学习中的仿真与现实物理对齐

研究如何弥合仿真环境与现实世界物理之间的差距,以提升机器人学习效果。这包括使用生成模型更准确地捕捉物理动态,从而改进感知、规划与控制;建模不确定性和反馈效应;并学习可从仿真环境稳健迁移到现实世界的扩散策略。

交互式场景生成与下游任务

构建能生成物理合理、语义一致的交互式视频模拟模型。研究重点包括:基于动作条件的场景合成、智能体与环境之间的可控动态模拟,以及面向下游任务(如规划与策略学习)的评估方法和基准的开发,特别关注视频保真度、时间一致性与可控性等指标。

视频-语言-动作(VLA)模型与大语言模型中的世界知识利用

研究大规模预训练模型如何统一视频、语言与动作的表示,以支持鲁棒且具泛化能力的策略学习。关键研究方向包括:构建多样的多模态数据集、提升跨模态对齐能力、开发高效的参数微调方法,以及使智能体在仿真或真实环境中执行复杂的语言引导任务。同时也关注如何利用大语言模型中蕴含的结构化与非结构化世界知识来引导智能体决策。

更广泛场景中的应用:开放世界游戏与自动驾驶

将世界模型推广至真实环境与高保真模拟器中的具身智能体应用场景。重点研究方向包括:感知与控制的集成、从仿真到现实的迁移(sim2real)、持续学习与适应能力,以及在 Minecraft、自动驾驶和真实互动环境等开放式任务中的部署与执行。

一起“三连

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

NeurIPS 2025 世界模型 Embodied World Models Decision Making 强化学习 Reinforcement Learning 长程规划 机器人学习 具身智能 Datawhale 王琦
相关文章