为啥都在讲卖Token:AI 时代,云厂商正从卖 Compute 和 Storage Hours,转向卖 Token。表面看,是更细颗粒度的产品封装与计价单位变化;本质上,是一种更先进的商业模式。
过去云计算卖的是基础设施租赁。bare metal、CPU、GPU,本质上都是“设备时间”的售卖:租一块卡、一个实例、几个小时,收入大致与供给规模线性挂钩。扩一倍产能,理论上多一倍收入(不精确但便于理解概念),商业模式更接近“出租机器”。
但在 AI,尤其是推理逐渐成为大头的时代,这种定价方式已经越来越不能准确捕捉真实价值。因为 GPU 不再只是冷冰冰的算力设备,而更像一座持续产出智能的工厂,甚至可以说是一个 intelligence generator。用户真正购买的,不再是“这块卡跑了多久”,而是“系统输出了多少有用智能”。
所以,计费单位从 hours 转向 tokens,不只是计量方式变化,而是产品定义变化:从卖算力投入,变成卖智能产出。且AI时代的东西向计算迸发East-West Traffic (GPU-to-GPU, rack to rack) 又比互联网时代的南北向迸发不是同一个量级。
但进一步说,not all tokens are made equal。词元和词元并不平等。未来真正成熟的 AI 云服务,也不会只是简单按 token 数量统一收费,而会像 Jensen 所暗示的那样,进一步按 throughput 和 latency 分层定价。同样是生成 1 million tokens,低延迟、高吞吐、稳定 SLA、支持更复杂 agent workflow 的 token,显然比慢速、拥堵、质量不稳定的 token 更有价值。届时云厂商卖的就不只是 token,而是不同等级的“智能服务”。
一旦定价锚点从“hours”切换到“tokens × service quality”,收入天花板就被重新打开了。因为供给侧仍然受先进制成、封装、存储、网络互联、电力和系统优化约束,但需求侧的支付意愿,开始不再只对应硬件成本,而是对应业务价值、响应速度和替代人工的程度。
更重要的是,AI 已经不只是在吃 IT 预算,而是在开始吃人力成本预算。
这才是更大的变化。
过去企业买云,更多是为了支撑已有软件系统和数据基础设施,预算池主要来自 IT 部门。但今天企业购买模型与 agent,并不只是为了“运行软件”,而是为了替代部分研究、客服、编程、销售支持、运营、分析等人的工作时间。换句话说,AI 正在从 technology spend 走向 labor substitution。
一旦预算来源从 IT 扩展到 payroll,市场空间的想象力就完全不一样了。企业原来可能愿意为一个软件 seat 支付几十到几百美元一个月;但如果一个 AI 系统真能承担一个高价值白领岗位的部分工作,它对应的定价锚点就不再是 SaaS seat,而是人的工资成本。
从这个角度看,Claude Max 每月 100 美元,其实可能只是一个极早期、极不充分的价格。如果未来的模型真能稳定完成更复杂、更完整、更高价值的知识工作流程甚至进入到物理世界,那么它的合理定价,不应该只参考软件订阅,而应该参考它为用户节省了多少时间、替代了多少人力、创造了多少额外产出。那时,今天看起来“贵”的 AI,回头看可能反而便宜得离谱。