对CPU的看法空翻多了,开始建仓CPU资产。最近做这个游戏分析agent的时候感触颇深,虽然分析每个游戏要几十个LLM请求和几万到几十万token,但很多配套逻辑作为确定性的CPU计算固化到了代码里,而且还没涉及工具使用、沙盒和多agent等指数级增加CPU计算的实现
总结下CPU需求来源和半导体需求规模排序:
数据中心里增量CPU需求的主要来源(数据中心里的存量CPU服务器需求则预计大部分会被GPU服务器取代)
1. Agent 的自主触发+永续运行
2. Agent 的 Tool Use
2.1 比人更快、更熟练灵活、更多样广泛的使用软件工具
2.2 每个云端 Agent 都至少需要一套专用客户端环境来使用软件工具,由此新增的客户端计算需求远超来自真人的客户端消费需求天花板
3. 像 subagent、swarm 这样用多个 agent 并发、分工、协作完成一个任务
4. 为了让 Agent 像 Serverless 里的 FaaS 一样按需使用,需要预留的冗余资源
5. Agent 的多模态交互带来的多模态数据输入前的预处理和输出后的后处理
可以理解为:AI 会指数级的增加世界上的「劳动力人口」,而且还不是普通人口,而是可以神速使用海量软件、把这些软件玩出花的超级人口(相当于 power user、pro user),这些人口都需要自己专用的客户端(虚拟化、沙盒化的),在其中24/7疯狂使用各种软件工具,在消耗大量 token 用爆 GPU 的同时,也用爆 CPU
Intel 最新的财报已经有所体现(图4)。最近人们因为 Clawdbot 突然都要买 mac mini ,有的人还买了几十台,也是这种「客户端」需求的体现
Clawdbot 创造出的增量「客户端」需求里,很大部分本质上是对「自主触发+永续运行」和「全功能客户端软件工具环境」的需求,并不是真的要靠本地客户端设备来满足
本地客户端需求有自己独特的两类来源:
第一类来自与现实世界结合的多模态交互需求、本地软件环境和现实环境中实时隐私数据的访问需求、人和 AI 共用一套客户端环境紧密协作操作软件的需求。
涉及PC/手机/可穿戴XR等由人类配备、增强人类自身能力的设备
第二类来自非软件 Tool Use 需求(比如现实世界中有物理实体的Tool)、对现实世界施加影响的需求、访问现实世界中实时多模态隐私数据的需求。
涉及各种具身不具身的机器人式 Agent,包括那些只能通过 IoT 传感器网络获取输入、没有「手脚」无法对现实世界输出(无法使用物理工具)的广义机器人(Clawdbot 很适合的领域)
这两类 AI 驱动的本地客户端需求中,第二类(广义机器人)比第一类(增强人类的设备)的规模会高至少一个数量级,因为第二类可以独立自主运行,第一类需要附加在真人身上被真人使用、受限于人类的生育率(有生物和文化层面的天花板),两者的 scaling 能力不一样
但即便是第二类本地客户端需求,跟云端 AI 的 token 算力和 agent 算力(含 CPU 算力)需求相比,规模又会至少低一个量级,因为前者就像北京限制购车一样,scaling 有更多物理层面的约束(物理空间、物理材料等),后者则更多是软件的 scaling 模式,只有最少量的物理约束(长期来说只有能源约束,短期还有内存产能等制造约束)
整体的排序:
云端 GPU/ASIC 需求(token 生产)
>
云端 DRAM 存储需求(SIMD 或其他并行算力模式)
>
云端 NAND 存储需求(比如海量权重、checkpoint、LoRA,海量多模态数据)
>
云端 CPU 需求(Tool Use、虚拟客户端、Agent 逻辑)
>
本地机器人/IoT中的 Agent 硬件需求(前面介绍过的第二类本地客户端需求,广义机器人)
>
本地纯软件 Agent 的硬件需求(前面介绍过的第二类本地客户端需求,PC/手机/可穿戴XR)
P.S. 本帖提到的游戏分析Agent:
steam-review.dexmage.com