《晚点聊》157 期 【26Q1 具身季报】中讨论的 Top 5 进展之一就是英伟达的系列成果:DreamDojo、DreamZero、Ego Scale。
这一期,我邀请了英伟达 GEAR DreamDojo 的联合一作高深远,分享他眼中的“世界模型”。
深远看到了一个正在形成的“自进化循环”,它由三个互相优化的部分组成:世界模型、策略(VLA 和现在 DreamZero 的 WAM 等)和连接二者的 Agent。一旦相互强化的正循环出现,可能会出现一种突破物理时空限制的实验和训练条件。这和 DeepMind 哈萨比斯讲述的“用 SIMA 在 Genie 里做科学实验”的想法类似。
这种循环真能出现吗?今天我们 mark 一下,未来再见。