智源社区 10月29日 15:36
华为发布WorldGrow:AI生成超大室内场景
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

华为联合上海交通大学、华中科技大学推出了世界模型WorldGrow,能够生成1800㎡的超大室内场景,单卡30分钟即可生成272㎡。该模型解决了传统3D场景生成中存在的几何不连贯、纹理断裂、布局混乱等问题。WorldGrow通过数据精准预处理、3D块补全机制以及粗到精生成策略,实现了场景的无缝拼接和照片级真实感。其几何重建指标在3D-FRONT数据集上达到SOTA,FID低至7.52,效率是同类技术的6倍。该技术由华为实习生与田奇教授团队合作完成,聚焦于计算机视觉与图形学。

🚀 **AI赋能超大室内场景生成:** 华为推出的WorldGrow模型,能够生成高达1800平方米的超大室内场景,并在单张A100显卡上仅需30分钟即可完成272平方米的生成,大幅提升了3D场景构建的效率和规模。

💡 **解决传统3D生成痛点:** WorldGrow通过三大核心技术,有效解决了现有3D场景生成中常见的几何不连贯、纹理断裂、布局不合理(如冰箱出现在卧室)等问题,确保生成场景的真实感和逻辑性。

🧩 **精细化场景拼接技术:** 该模型采用3D块补全机制,在生成新区块时,通过结构生成器和latent生成器重建结构化潜变量特征,保证了外观风格的统一,并能根据现有区块的上下文信息精准生成,消除拼接缝隙,实现无缝衔接。

📈 **卓越的性能与质量:** 在3D-FRONT数据集上,WorldGrow的几何重建指标MMD和COV达到SOTA水平,FID(生成质量评估指标)低至7.52,显著优于主流方法。即使在扩展到7x7块的超大场景时,边缘质量依然稳定,展现出高分辨率和连续的纹理。

AI大house真来了。

华为联合上海交通大学、华中科技大学推出了世界模型WordGrow,可以生成1800㎡超大室内场景(19x39块),单卡30分钟就跑了272㎡。

里面的虚拟人还能顺畅导航,不带迷路的。(小声说:大平层确实需要导航)

并且场景具备连贯的几何拓扑和照片级真实感外观,智能体的导航则是在复杂空间布局中自主规划路径。

这可以说是走到哪建到哪了,那场景是怎么搭的?

具备连贯的几何拓扑和照片级真实感外观

以前想造个像样的3D大场景,坑不少。

比如有些技术先靠2D模型画张图,再硬掰成3D,结果换完视角一看,沙发腿歪了、墙壁纹理断了……

还有一些方法最多只能造单个房间,扩展成套房就卡壳;

更离谱的是没有布局逻辑——出现冰箱塞进卧室,床摆在厨房的情况。

现在,WorldGrow来搞装修了(bushi),用三个核心技术填坑。

第一步是先做数据精准预处理,从3D-FRONT这类大规模数据集里提取优质样本,用Blender执行场景切片,通过布尔交集对场景进行区块切分,再靠occupancy检测确保区块内容密度(可见内容≥95%)

同时,构建了粗、细两个数据集,粗块来确定宏观布局,细块保留纹理细节。

第二步靠3D块补全机制实现了无缝拼接,在生成新区块时,先让结构生成器确定3D结构框架,再让latent生成器重建结构化潜变量(SLAT)特征,保证外观风格统一。

并且,在输入模型时,会把带噪潜变量、补全区域二进制掩码、已掩码的已知区域特征打包融合,让模型依据现有区块的上下文信息精准生成,消除边缘断裂、纹理错位等拼接缝。

第三步是粗到精生成策略,把场景扩展变成了补全缺失块的任务。

先通过粗结构模型敲定整体规划,比如窗户朝向、走廊连接等布局;随后对粗结构进行三线性插值上采样,将分辨率匹配至细块级别,再调用细结构生成器补全家具、纹理等细节。

对比可以看出,WorldGrow能够生成高分辨率、连续的室内场景,且场景具有真实且连贯的纹理。

实验数据显示,在3D-FRONT数据集上,它的几何重建指标MMD、COV均达SOTA,FID(用于评估生成质量的核心指标,越低越优)低至7.52,大幅优于SynCity、BlockFusion等主流方法;

即便扩展到7×7块的超大场景,边缘质量仍然稳定。

在效率上,单张A100显卡,30 分钟即可生成10×10区块(约272㎡)的室内场景,速度是同类技术的6倍。

团队介绍

本文一作是来自上海交通大学的Sikuang Li和Chen Yang,研究完成于他们在华为实习期间。

Chen Yang目前仍为华为研究实习生,研究聚焦于计算机视觉和计算机图形学,导师之一就是这项研究的通讯作者、AI大牛田奇。

田奇,华为终端BG首席科学家,国际欧亚科学院院士,ACM/IEEE Fellow。

论文地址:https://arxiv.org/abs/2510.21682

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🏆 年度科技风向标「2025人工智能年度榜单」评选报名火热进行中!我们正在寻找AI+时代领航者 点击了解详情

❤️‍🔥 企业、产品、人物3大维度,共设立了5类奖项,欢迎企业报名参与 👇 

一键关注 👇 点亮星标

科技前沿进展每日见

内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

WorldGrow 华为 人工智能 3D场景生成 计算机视觉 计算机图形学 AI Huawei 3D Scene Generation Computer Vision Computer Graphics
相关文章