通过文本生成全景图后加上深度估计生成完整3D场景的模型有不少

即刻App年轻人的同好社区

下载

Simon的白日梦

12月前

通过文本生成全景图后加上深度估计生成完整3D场景的模型有不少了，但是这个应该是目前看到质量最好的一个，而且还可以直接导出mesh。

《WorldGen：几秒内生成任意交互式3D场景》
🧐WorldGen 是一个能够基于文本或图像输入，在数秒内生成可360°探索的3D场景的模型，它跳过复杂建模流程，通过全景图+结构重建两步，极大降低3D内容创作门槛，有望成为AIGC时代的“3D世界生成器”。
➡️链接：worldgen.github.io
✨重点

●⚡ 文本/图像秒变3D世界：用户只需提供一句Prompt或一张图，WorldGen即可生成完整三维空间，场景从写实客厅、火星地表到卡通珊瑚城一应俱全。
●🌐 核心技术：两阶段“全景转场景”流程：先生成360°高分辨率全景图，再将其转为3DGS或mesh，实现视角一致性与空间几何重建，是效率与保真度的折中解法。
●🔄 支持360度自由探索与回环一致性：生成场景不仅可任意视角漫游，还保证环视不跳帧、不错位，体现几何重建算法的空间连续性优势。
●🎨 风格迁移灵活，从Minecraft像素风到赛博朋克光影皆可：通过Prompt控制风格与细节，可广泛应用于游戏场景构建、元宇宙编辑、建筑可视化等3D内容需求。
●🛠️ 不依赖复杂Buzzword，架构直白可复现：官网明确列出技术路径，无“神秘术语”包装，更适合科研开发者学习参考，GitHub仓库开放可直接上手。
●📦 Demo在线体验即点即用：内置交互式浏览器Demo，支持用户自行测试生成场景并实时漫游体验，感受空间逻辑与真实感。

3 03

来自圈子

人工智能讨论组

475471人已经加入