Datawhale 08月26日
Datawhale成员组织NeurIPS 2025世界模型Workshop
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Datawhale成员王琦与多所知名高校学者共同组织了NeurIPS 2025的“Embodied World Models for Decision Making”Workshop。该Workshop聚焦世界模型在决策制定中的理论基础、算法创新及实际应用,特别关注基于模型的强化学习、长程规划、机器人学习中的仿真与现实物理对齐、交互式场景生成、视频-语言-动作模型以及在开放世界游戏和自动驾驶等领域的应用。Workshop的投稿截止日期为9月1日UTC-0,旨在汇聚全球研究者,共同探讨具身世界模型的前沿进展。

🌟 **Workshop聚焦具身世界模型与决策制定**:由Datawhale成员王琦与多所高校学者联合组织的NeurIPS 2025 Workshop,主题为“Embodied World Models for Decision Making”,旨在深入探讨世界模型在决策过程中的理论、算法及应用,汇聚相关领域的研究者。

💡 **核心议题涵盖多方面前沿研究**:Workshop将重点关注基于模型的强化学习与长程规划,探讨世界模型如何提升样本效率和性能;研究机器人学习中仿真与现实物理的对齐问题;探索交互式场景生成与下游任务构建;以及分析视频-语言-动作模型和大语言模型在世界知识利用方面的潜力。

🚀 **推广世界模型至更广泛应用场景**:Workshop还将探讨将世界模型应用于更广泛的场景,如开放世界游戏和自动驾驶,重点研究感知与控制的集成、仿真到现实的迁移(sim2real)、持续学习与适应能力,以及在真实互动环境中的部署。

📚 **Datawhale成员的学术贡献**:组织者王琦是上海交通大学博士研究生,在视觉强化学习与世界模型领域有深入研究,并著有多本关于强化学习和深度学习的畅销书籍,其开源项目如“Easy RL”和“LeeDL-Tutorial”在学术界广受好评,拥有大量GitHub星标和高校采用。

2025-08-25 22:21 浙江

 Datawhale顶会 

组织者:王琦,Datawhale成员

Datawhale 成员王琦与来自上海交通大学、香港科技大学、清华大学、宁波东方理工大学等机构的学者组织了 NeurIPS 2025 世界模型 Workshop “Embodied World Models for Decision Making”。

地点:San Diego, CA, USA 

截稿时间:9月1日 11:59PM UTC-0 

网站:https://embodied-world-models.github.io/

Datawhale组织者王琦

Datawhale 成员,上海交通大学人工智能教育部重点实验室博士研究生,主要研究方向为视觉强化学习与世界模型。《Easy RL:强化学习教程》《深度学习详解》、《Joy RL:强化学习实践教程》 书籍作者,在开源学习社区持续参与贡献:

1. Easy-RL(蘑菇书)

面向初学者的强化学习中文教程,包含经典理论与实战案例。GitHub星标超12.3K,被牛津大学墨顿学院图书馆收录,获李宏毅、汪军、周博磊等学者推荐,豆瓣评分8.3。

被牛津大学墨顿学院图书馆馆藏收录

2. LeeDL-Tutorial(李宏毅深度学习教程)

李宏毅《机器学习》课程的配套开源教材,覆盖深度学习全领域,得到台大李宏毅教授本人的认可和推荐,目前GitHub星标达15.6K,并被百所高校采用为教辅。

3. JoyRL-Book(强化学习实践教程)

Datawhale打造的强化学习进阶实践指南,聚焦工业级应用,获得浙江大学人工智能研究所所长吴飞、上海交大ACM班创始人俞勇的推荐。

投稿 NeurIPS workshop

NeurIPS 是机器学习和计算神经科学领域的顶级国际会议之一。本次举办的 NeurIPS 2025 世界模型 workshop,主题为“Embodied World Models for Decision Making”,关注世界模型相关的理论基础、算法创新或实际应用。Genie 3 的核心贡献者 Philip Ball 也会给 Talk。欢迎大家参加、投稿~

投稿主题

基于模型的强化学习与长程规划

探讨世界模型如何助力基于模型的强化学习,重点关注样本效率、性能表现以及可扩展性。特别强调长程规划(long-horizon planning)问题,即要求智能体在时间跨度较大的任务中,推理并执行一系列连续动作、预测延迟反馈结果,并在面对不确定性和有限反馈的情况下,仍能在时间上保持策略一致性。

机器人学习中的仿真与现实物理对齐

研究如何弥合仿真环境与现实世界物理之间的差距,以提升机器人学习效果。这包括使用生成模型更准确地捕捉物理动态,从而改进感知、规划与控制;建模不确定性和反馈效应;并学习可从仿真环境稳健迁移到现实世界的扩散策略。

交互式场景生成与下游任务

构建能生成物理合理、语义一致的交互式视频模拟模型。研究重点包括:基于动作条件的场景合成、智能体与环境之间的可控动态模拟,以及面向下游任务(如规划与策略学习)的评估方法和基准的开发,特别关注视频保真度、时间一致性与可控性等指标。

视频-语言-动作(VLA)模型与大语言模型中的世界知识利用

研究大规模预训练模型如何统一视频、语言与动作的表示,以支持鲁棒且具泛化能力的策略学习。关键研究方向包括:构建多样的多模态数据集、提升跨模态对齐能力、开发高效的参数微调方法,以及使智能体在仿真或真实环境中执行复杂的语言引导任务。同时也关注如何利用大语言模型中蕴含的结构化与非结构化世界知识来引导智能体决策。

更广泛场景中的应用:开放世界游戏与自动驾驶

将世界模型推广至真实环境与高保真模拟器中的具身智能体应用场景。重点研究方向包括:感知与控制的集成、从仿真到现实的迁移(sim2real)、持续学习与适应能力,以及在 Minecraft、自动驾驶和真实互动环境等开放式任务中的部署与执行。

一起“三连

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

NeurIPS 世界模型 Embodied World Models 强化学习 Reinforcement Learning 决策制定 Decision Making Datawhale Workshop 长程规划 Long-Horizon Planning 机器人学习 Robotics Learning 自动驾驶 Autonomous Driving
相关文章