即刻App年轻人的同好社区
下载
App内打开
dexteryy
3月前
我不确定有没有传达出GameNGen(m.okjike.com)背后的重大意义,关键词是:端到端、Stable Diffusion、可交互。意义是三体式的:客户端软件技术不存在了

这种模型跟现在用AI写代码、生成UI或搭建整个应用(不仅限于 GUI 应用,也包括 chatbot)有本质不同。
它不需要生成任何代码。
它(模型)就是应用本体。
包括可交互虚拟世界在内的GUI应用,不再由代码组成,而是由模型的参数权重组成。
它直接像画画一样生成组成UI的每个像素。
它内部隐含了特定客户端应用的整套业务逻辑(跟具体UI无关的纯数据逻辑)。

任何客户端应用的代码,都是在:
- 处理交互输入(把交互输入层层转换成客户端业务逻辑和 UI 架构能使用的数据)
- 生成交互输出(包括各种UI架构中海量UI状态的组织关系、排列组合、更新计算、传递和依赖关系,以及基于最终UI状态的图形渲染)
- 提供两者之间的客户端业务逻辑

在端到端的模型中,代码都不存在了,而所有代码都必然是工作在某个软件抽象层之上的,因此人类持续不断建设和积累的所有这些抽象层也没了。什么游戏引擎、应用框架、UI 组件库、状态管理、依赖管理、运行时、编译工具链、API、操作系统中除跟硬件打交道和画面合成上屏之外的部分,都不需要了。

最底层的输入直接被模型转变为最底层的输出,没人类啥事了。彻底的奇点,人类从此只需要当好消费者,消费内容和生产内容,后者虽然「生产」但本质仍然是对 AI 提供的内容平台应用能力的消费。

所以说是「最大噩梦」和「AGI 奇点提前到来」并不夸张。幸好就像原贴分析的,这暂时还不是真正的「趋势」——真正实现起来是有瓶颈和悖论。而一旦能实现,也会先在软件开发之外的现实世界领域变成现实——在客户端软件技术不存在之前,现实世界中更多人熟悉和掌握的东西会先不存在 XD

Google 的论文只列出了以下短期可能实现的目标:
- 简化为已有游戏加入修改和新行为的工作量,比如根据一组画面自动生成的可玩新关卡,根据画面自动生成游戏中的可交互角色。
- 把游戏程序「压缩」到一个模型之后,有新的机会优化帧率和内存占用
01

来自圈子

圈子图片

JitHub程序员

383841人已经加入