通过文本生成全景图后加上深度估计生成完整3D场景的模型有不少了,但是这个应该是目前看到质量最好的一个,而且还可以直接导出mesh。
《WorldGen:几秒内生成任意交互式3D场景》
🧐WorldGen 是一个能够基于文本或图像输入,在数秒内生成可360°探索的3D场景的模型,它跳过复杂建模流程,通过全景图+结构重建两步,极大降低3D内容创作门槛,有望成为AIGC时代的“3D世界生成器”。
➡️链接:
worldgen.github.io✨重点
●⚡ 文本/图像秒变3D世界:用户只需提供一句Prompt或一张图,WorldGen即可生成完整三维空间,场景从写实客厅、火星地表到卡通珊瑚城一应俱全。
●🌐 核心技术:两阶段“全景转场景”流程:先生成360°高分辨率全景图,再将其转为3DGS或mesh,实现视角一致性与空间几何重建,是效率与保真度的折中解法。
●🔄 支持360度自由探索与回环一致性:生成场景不仅可任意视角漫游,还保证环视不跳帧、不错位,体现几何重建算法的空间连续性优势。
●🎨 风格迁移灵活,从Minecraft像素风到赛博朋克光影皆可:通过Prompt控制风格与细节,可广泛应用于游戏场景构建、元宇宙编辑、建筑可视化等3D内容需求。
●🛠️ 不依赖复杂Buzzword,架构直白可复现:官网明确列出技术路径,无“神秘术语”包装,更适合科研开发者学习参考,GitHub仓库开放可直接上手。
●📦 Demo在线体验即点即用:内置交互式浏览器Demo,支持用户自行测试生成场景并实时漫游体验,感受空间逻辑与真实感。