最近All-In Podcast做了一期特别节目,请来了英伟达CEO黄仁勋做了一场将近两个半小时的深度对话。
All-In的四位主持人大家应该都不陌生了,Chamath、Jason Calacanis、David Sacks、David Friedberg,全是硅谷顶级投资人和创业者。
能让他们打断常规节目专门录一期的嘉宾,屈指可数。
这期的信息量非常大,从英伟达收购Groq聊到太空数据中心,从Agent爆发聊到AI行业的公关危机,几乎覆盖了当下AI领域所有最热的话题。
我花了不少时间反复看了几遍,有些观点确实让我重新审视了对整个行业走向的判断。
1️⃣ 英伟达已经不是一家GPU公司了
黄仁勋在访谈里反复强调了一个概念叫分离式推理(Disaggregated Inference)。
简单来说就是AI推理的处理流程太复杂了,不能再靠单一类型的芯片搞定,得把不同的计算任务拆开,分配给最合适的硬件去跑。
GPU跑一部分,CPU跑一部分,网络处理器跑一部分,现在收购了Groq之后,Groq的LPU也加入了这个组合。
他提到英伟达两年半前就发布了AI工厂操作系统Dynamo,名字来源于西门子发明的发电机,寓意是要做新一轮工业革命的底层引擎。
收购Groq并不是心血来潮,而是整个异构计算战略的一环。
他甚至给出了具体比例:数据中心里大约25%的空间应该分配给Groq LPU和GPU的组合。
英伟达的TAM(可触达市场)可能因此增长了三到五成。
这不是在卖芯片,而是在卖整个AI基础设施。
2️⃣ 推理计算两年涨了一万倍,而且还没开始真正爆发
这个数字听起来很夸张,但黄仁勋的推导逻辑其实很清楚。
从生成式AI到推理(Reasoning),计算量涨了大概100倍;从推理到Agent,又是100倍。
两步叠加就是一万倍,而且这个过程只花了两年。
更关键的是他说的一句话:人们愿意为信息付费,但人们更愿意为完成工作付费。
聊天机器人回答问题很好,但真正能帮你干活的Agent系统,商业价值完全不在一个量级。
Chamath在节目里也分享了一个例子,他的团队用自动研究工具(Auto Research)在30分钟内完成了一项本来需要读一个七年博士才能产出的研究,这个效率提升的冲击力可想而知。
3️⃣ 一个50万美元年薪的工程师,应该花掉至少25万美元的token
这大概是整期节目里最出圈的一个观点了。
黄仁勋做了一个思想实验:如果你给一个工程师50万美元的年薪,年底一看他只花了5000美元的token费用,那你作为管理者应该非常担忧。
他的原话大意是说,这就好比芯片设计师告诉你他打算用纸笔画电路图,不需要CAD工具一样离谱。
这背后的逻辑是,在Agent时代,知识工作者的生产力取决于他能调动多少AI算力。
不是你省token就是好员工,恰恰相反,token消耗量可能会成为衡量一个工程师是否真正高效工作的新指标。
黄仁勋还预测,未来每个工程师都会有一百个Agent在帮他干活。
4️⃣ 开源和闭源不是二选一,两条路都要走
关于开源模型和商业模型之争,黄仁勋的态度非常明确:这不是A还是B的问题,而是A加B。
对普通用户来说,ChatGPT、Claude、Gemini这些产品化的模型用起来最方便,没必要自己去折腾微调。
但对垂直行业来说,开源模型提供了不可替代的控制力和定制空间。
他还特别提到了OpenClaw这个开源Agent框架的重要性。
它不只是一个工具,更像是定义了一种新的计算范式,有内存管理、有任务调度、有IO子系统、有技能API,本质上就是AI时代的个人电脑操作系统。
这个判断如果成立,影响会非常深远。
5️⃣ AI行业正在经历一场公关危机,需要自救
黄仁勋直接点名说了Anthropic在沟通策略上的问题。
他肯定了Anthropic的技术实力和安全意识,但也指出,警示公众和吓唬公众之间有一条很重要的界限。
用他的话说,预测未来需要谦逊,没有证据的灾难性预言可能造成的伤害比人们以为的要大得多。
黄仁勋对AI产业的理解深度和广度,远远超出了大多数人对一个硬件公司CEO的预期。
他不只是在卖芯片,他在构建一整套AI时代的基础设施和生态体系。
几个趋势值得持续关注:Agent计算需求的指数级增长、开源AI操作系统的崛起,以及AI行业如何修复与公众之间日益紧张的信任关系。