云厂商的 Token 购买方式,大体可以分三类:
1 / API 调用
按具体模型单独计费,通常支持最新模型,不限制工具和调用场景。
计费维度最细:输入、输出、缓存创建、缓存命中、Batch 等分别计费。
优点是透明、开放;缺点是成本波动大,普通用户很难直观感知一次调用到底花了多少钱。
2 / Token Plan
按坐席订阅,实际使用时再按 Token 消耗折算成 Credits。
它把不同模型、不同 Token 消耗统一包装成 Credits,看起来更适合团队管理预算。
但问题是:工具有限制,模型和场景也有边界,额度到期自动清零。
3 / Coding Plan
面向 AI 编程场景,按“请求次数”计费,而不是直接按 Token 计费。
模型池通常不是最新最全的,且有 5 小时、7 天、月度等多层限额。
同时工具限制更强,不能用于 Dify、Postman、自动化脚本、自定义应用后端等非编程场景。额度同样到期清零。
4 / 一个有意思的规律:
越底层的 API,越透明,但越难控成本;越上层的套餐,越好理解,但限制越多。
5 / 云厂商真正高(JI)明(ZEI)的地方在于:
它不是简单卖 Token,而是把 Token 包装成不同口径的商品——有的按输入输出算,有的按 Credits 抵扣,有的按请求次数算。
最后形成一种典型的"不可比性":
你很难直接判断:198 元的 Token Plan、200 元的 Coding Plan、200 元的 API 调用,哪个更划算。
因为它们的计费单位不同、模型范围不同、工具限制不同、额度周期不同、清零规则不同。
表面上是在给用户更多选择,实际上是在制造计费黑盒。
6 / 云厂商不是在卖 Token,而是在卖一套"看起来便宜、算起来复杂、用起来受限"的套餐体系。
通过不可比性和黑盒设计,实现稳稳【包赚】