机器之心 10月20日 22:13
OmniPart:像玩乐高一样自由生成和编辑3D部件
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

香港大学等机构的研究者们推出了OmniPart框架,解决了3D内容创作中自由生成、编辑和组合对象部件的挑战。该框架采用“先规划,后生成”的两阶段策略,通过2D图像和掩码引导,生成高质量、结构协调的独立3D部件,并支持部件级别的编辑和动画制作。OmniPart在生成质量和效率上均优于现有方法,为游戏、VR等领域带来更灵活的3D内容创作体验。

💡 OmniPart框架通过创新的“规划-生成”两阶段流程,巧妙解决了3D内容创作中部件自由生成、编辑和组合的核心难题。它将复杂的3D生成任务解耦,首先根据2D输入规划出部件的3D包围盒,然后生成高质量的独立部件,并确保它们能完美组合成一个整体。

🎨 该框架的核心优势在于其高度的可控性。用户可以通过简单的2D掩码来指导部件的分解粒度,实现多粒度生成,并能对特定部件进行独立的材质编辑和几何处理。这种精细的部件控制能力极大地增强了后续的编辑、定制化和动画制作效果。

🚀 OmniPart在生成质量和效率上均取得了显著突破。与现有方法相比,它生成的3D部件在几何细节、语义准确性和结构一致性上表现更优,并且端到端生成时间大幅缩短至不到1分钟,为3D内容创作带来了前所未有的速度和便利。

🌐 OmniPart的出现为游戏开发、虚拟现实、数字孪生等领域带来了新的可能性。其部件级别的可解释性和可编辑性,使得创建更精细、更具交互性的3D世界成为可能,推动了3D内容创作向更智能、更灵活的方向发展。

2025-10-20 12:49 四川

像玩乐高一样,自由生成、编辑和组合对象的各个部件。

本文的主要作者来自香港大学、VAST、哈尔滨工业大学及浙江大学。本文的第一作者为香港大学博士生杨运涵。本文的通讯作者为香港大学刘希慧教授与VAST 公司首席科学家曹炎培博士。

在3D内容创作领域,如何像玩乐高一样,自由生成、编辑和组合对象的各个部件,一直是一个核心挑战。香港大学、VAST、哈尔滨工业大学及浙江大学的研究者们联手,推出了一个名为 OmniPart 的全新框架,巧妙地解决了这一难题。该研究已被计算机图形学顶会 SIGGRAPH Asia 2025 接收。

如今,从游戏、VR到数字孪生,高质量的3D世界构建变得至关重要 。尽管现有的AI模型能够生成令人惊叹的3D整体形状,但它们大多是“一体式”的模型,缺乏内在的部件结构。这种结构上的不透明性,极大地限制了模型在部件编辑、动画制作、材质分配等关键应用中的价值 。

为了破解这一难题,研究者们提出了 OmniPart,一个创新的“部件级别”3D生成框架。它的核心思想是将复杂的生成任务解耦为两个协同工作的阶段:“先规划,后生成”,在保证部件之间高度独立(语义解耦)的同时,也确保它们能完美地组合成一个整体。

效果展示

OmniPart 以简单的2D图像(如图中画框所示)和掩码为输入,首先通过自回归模型规划出三维部件结构,然后同步生成所有高质量、带纹理的独立部件(如透明展柜中所示)。这些部件能够无缝地融合成一个结构协调的完整对象,并提供了显式的部件控制能力,从而极大地增强了后续的编辑、定制化和动画制作效果。

方法介绍:两阶段“规划-生成”策略

OmniPart 的流程优雅而高效,它将复杂的部件生成任务分解为两个核心模块:可控的结构规划(Controllable Structure Planning)和空间感知的部件生成(Spatially-Conditioned Part Synthesis)。

第一阶段:基于2D掩码的结构规划

首先,模型需要规划出3D对象的部件布局 。OmniPart 采用了一个自回归Transformer模型,它会根据输入的2D图像,预测出一系列3D包围盒(Bounding Boxes),每一个包围盒都代表一个部件的空间位置和大小。

这里最巧妙的创新在于,用户可以通过提供简单、灵活的2D部件掩码(Part Masks)来直观地控制部件的分解粒度。这些掩码无需与3D部件一一对应,也无需语义标签,大大降低了控制的难度。例如,用户可以决定机器人的手臂和手掌是一个部件还是两个独立的部件。

为了确保生成的包围盒能完整地覆盖对应部件,团队还引入了一种新颖的“部件覆盖损失”(Part Coverage Loss),鼓励模型生成稍大一些的包围盒,避免部件信息在后续阶段丢失。

第二阶段:空间感知的部件生成

有了部件的“空间蓝图”(包围盒)后,第二阶段的任务就是生成所有高质量的3D部件,并确保它们能无缝拼接。

该模块基于一个强大的预训练3D整体生成器(TRELLIS)进行高效微调。它将所有部件的潜在编码(latent codes)进行并行联合优化,而不是孤立地生成每个部件。这种全局与局部信息结合的去噪过程,确保了最终部件之间的高度一致性。

此外,为了解决部件边界处体素重叠和噪声问题,OmniPart 提出了一种新颖的“体素丢弃机制”。该机制能精确判断每个体素是否真正属于其分配的部件,从而生成清晰的部件接口,让组合后的整体更加完美。

实验效果:质量与效率全面领先

    生成质量对比

如下图所示,与 Part123、PartGen 等现有方法相比,OmniPart 生成的3D部件在几何细节、语义准确性和结构一致性上都表现出明显优势。其他方法或只能生成表面分割,或几何质量较差,而 OmniPart 则能生成结构完整、细节丰富且能完美组合的独立部件。

    生成效率

值得一提的是,OmniPart 的生成效率也实现了大幅提升。相较于需要复杂多视图重建流程的 Part123(约15分钟)和 PartGen(约5分钟),OmniPart 的统一框架能够在不到1分钟(约0.75分钟)的时间内完成从单张图像到所有3D部件的端到端生成 。

方法

Part123

PartGen

OmniPart (Ours)

时间(分钟)

~15

~5

~0.75

    Huggingface demo 展示

丰富的下游应用

得益于其出色的部件可控性,OmniPart 自然地支持一系列激动人心的下游应用:

总结

OmniPart 框架通过其创新的“规划-生成”两阶段流程,并引入灵活的2D掩码作为引导,成功地实现了高质量、可控的部件级3D内容生成。它不仅在生成质量和效率上树立了新的标杆,其强大的可编辑性和应用潜力也为游戏开发、动画制作和虚拟现实等领域铺平了道路,推动了可解释、可编辑3D内容的创作边界。

值得一提的是,该团队近期在3D部件领域已经积累了多篇高质量的研究成果,形成了系统性的探索。其中包括专注3D部件分割的工作SAMPart3D(https://yhyang-myron.github.io/SAMPart3D-website/),该研究旨在实现对任意3D物体进行精细化的部件分割。另一项相关研究HoloPart(https://vast-ai-research.github.io/HoloPart/) 则致力于解决从不完整的表面部件信息(Amodal Segmentation)中生成完整的3D部件几何。从部件的分割 (SAMPart3D)补全 (HoloPart)到如今的生成 (OmniPart),这些工作共同构建了一个围绕“部件级3D物体”的AIGC技术矩阵。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OmniPart 3D内容生成 部件级生成 AI 计算机图形学 SIGGRAPH Asia 2025 3D Generation Part-Aware Generation AI Computer Graphics
相关文章