即刻App年轻人的同好社区
下载
App内打开
君泽
303关注1k被关注4夸夸
自由人 | 孩子他爸
There's million things I haven't done
君泽
5天前
上海确实会歧视外地人,北京不会,北京平等地不拿你当人
10
君泽
11天前
跟某科技大佬奇怪的交集:想约采访时候发现他知乎上把我拉黑了
00
君泽
12天前
联系一个高中同学,她是机器人Gelsight这个领域最权威的人之一。
问她要不要来我播客,她说可以啊。
我说我会好好准备把你论文看一遍。
她说千万不要,没必要,很多都是水的。
又补充了一句:我水的算比较少的。
最后说:你要判断不出来随时给我消息,我电话给你讲。
10
君泽
12天前
00
君泽
13天前
二胎是有这个问题,会提前接触娱乐。我有些朋友家里直接把电视扔了,不给孩子接触屏幕,但我咨询了下我的育儿老师,说每天二十分钟,每次不超过十分钟,还是可以接受的。电视的问题不光是蓝光刺激,还有会让孩子无互动,这个日常会补足一下 //@WoodyBuendia: 我比较保守,我觉得越晚看视频或者动画越好。我儿大班现在每天晚上看一集汪汪队。
我们家有群晖,我给他下好了,他自己开电视看一集,然后关掉。
问题是,妹妹现在三岁半,每天也跟着看😂

君泽: 说个最近的养娃的事情。 桔子现在习惯洗澡之后看个电视,叫巴塔木,儿歌动画。那我允许他看,但不想让他看太久,于是腾讯视频有个儿童锁功能,可以限制孩子看多少集。 最早的时候,桔子很乖,他会跟着电视一起说,电视机先生累了,然后讨论下那个屏幕上的小电视没盖被子会不会着凉,乖乖自己关掉电视去睡觉。 但是,我犯了个错误。 前几天,桔子看完电视,但姥姥没洗完澡(都是姥姥带睡),于是我解开了锁,给他看了一集小猪佩奇。 桔子大概发现了,那个锁是骗人的,并不是客观存在的,而且是可以解开的。 于是最近几天,他每天都会看完巴塔木吵着再看一集佩奇--但倒也是很乖,看完佩奇就自己关电视去睡了。 问了下我的育儿老师,老师说,首先这个孩子很聪明,他很清楚规则边界在哪儿,而且你们制定规则时候,没有经过他同意。 所以要再跟他商量,比如为什么只能看十分钟(对眼睛不好,对身体不好),也可以商量十分钟可以看什么。 明天试试看。

30
君泽
14天前
在星巴克看一个采访对象的资料,翻出来他大学时候写的东西,星巴克里响起来这首歌。如果现在是冬天,一切就都恰好了

Gilmore Girls

00
君泽
14天前
说个最近的养娃的事情。
桔子现在习惯洗澡之后看个电视,叫巴塔木,儿歌动画。那我允许他看,但不想让他看太久,于是腾讯视频有个儿童锁功能,可以限制孩子看多少集。
最早的时候,桔子很乖,他会跟着电视一起说,电视机先生累了,然后讨论下那个屏幕上的小电视没盖被子会不会着凉,乖乖自己关掉电视去睡觉。
但是,我犯了个错误。
前几天,桔子看完电视,但姥姥没洗完澡(都是姥姥带睡),于是我解开了锁,给他看了一集小猪佩奇。
桔子大概发现了,那个锁是骗人的,并不是客观存在的,而且是可以解开的。
于是最近几天,他每天都会看完巴塔木吵着再看一集佩奇--但倒也是很乖,看完佩奇就自己关电视去睡了。
问了下我的育儿老师,老师说,首先这个孩子很聪明,他很清楚规则边界在哪儿,而且你们制定规则时候,没有经过他同意。
所以要再跟他商量,比如为什么只能看十分钟(对眼睛不好,对身体不好),也可以商量十分钟可以看什么。
明天试试看。
72
君泽
19天前
中国的约束结构正好跟美国反过来——这比单纯的"中国电力够用"有意思得多。

镜像困境

芯片

: 芯片

美国: H100/B200,但交付周期长

中国: 没有高端 GPU,被制裁

电力

: 电力

美国: 不够——电网扩容每年 1-2%,AI 需求涨 25%

中国: 相对充裕,尤其西部

冷却水

: 冷却水

美国: 亚利桑那已经在限制新建

中国: 西部水资源紧张,但东部还好

**核心瓶颈**

: 核心瓶颈

美国: 有芯片,没电插

中国: 有电,没芯片插

这是两个完全相反的约束条件,导致了两个完全不同的进化方向。

中国的真实瓶颈不是电

中国 2024 年发电量约 9.4 万亿度,是美国的近两倍。过去十年中国电网扩容速度远超美国——特高压、西电东送、新能源装机都是世界第一。一个万卡集群的 7MW 功耗,在中国西部(贵州、内蒙古、宁夏)的电力系统里不算什么。

中国的瓶颈是:你有一屋子插座,但没有能插进去的插头。

具体来说,四层瓶颈:

1. 芯片数量不够
- 华为昇腾 910B 的单卡算力约为 A100 60-80%(取决于精度和负载)
- 好消息是能用了。坏消息是需要更多卡才能达到同等算力——功率需求就上去了
- SemiAnalysis 估算,中国 AI 公司的 GPU 总算力约等于美国的 5-10%
- 而且不只是训练卡缺——推理卡也缺。长上下文推理的 KV Cache 需要大量显存,低端卡放不下

2. 互联带宽低于英伟达
- NVLink + InfiniBand 的组合不只是"更快"——它让几千张 GPU 可以近似"一张 GPU"来编程
- 国产芯片的互联方案(比如昇腾的 HCCS)在单机 8 卡级别可以,但跨节点(几百几千张卡)的通信效率和稳定性还是比不过
- 这就是朱亦博在聊的那个东西——不是单卡算力,是卡和卡之间的通信

3. 软件生态——CUDA 的护城河
- AMD 做了跟 H100 算力接近的 MI300X,但用得很少。因为 CUDA 上有几十万行优化过的 kernel、调试过的训练脚本、验证过的部署流程
- 华为的 CANN(对标 CUDA)在进步,但生态差距巨大。很多开源模型不能在昇腾上直接跑——需要移植适配
- 这不是"华为不行"——是英伟达用 15 年建了一套别的公司不可能用 3 年追上的软件体系

4. 人才结构
- 中国不缺 AI 算法人才(NeurIPS 论文作者中国占比很高)
- 但缺懂芯片和系统协同设计的人——这样的人全中国可能不超过三位数
- 因为过去十年中国 AI 人才的流向是算法 > 应用 > 产品,很少流向 Infra 和芯片

"电力充足"产生了什么意外影响

这个约束结构产生了几个反直觉的结果:

1. 制裁迫使效率创新——DeepSeek 不是故事,是样本

DeepSeek 的成功不是偶然的天才灵光——是在"没有足够 H100"这个约束下被逼出来的。如果梁文锋可以随便买到 5 万张 H100,他不会花那么多精力做 MLA 压缩 KV Cache、做细粒度 MoE、做自研通信库。

约束条件本身就是创新方向的选择器。 美国公司面对"电不够"的约束,创新方向是降低功耗(液冷、更高效芯片、低精度训练)。中国公司面对"芯片不够"的约束,创新方向是用更少的算力做更多的事(MoE、MLA、GRPO)。

这两个方向最终可能交汇——你最终想要的是"每瓦算力的智能产出最大化"——但路径完全不同。美国从"更多算力→优化功耗"走,中国从"更少算力→优化利用率"走。

2. "电力充足 + 芯片短缺"催生了西算东数

中国 2022 年启动"东数西算"工程——在西部(贵州、内蒙古、甘肃、宁夏)建巨型数据中心,东部做应用。西部的优势不是芯片——是电便宜、水便宜、地便宜、气候凉快。

这意味着中国不需要像美国那样在每个城市附近建数据中心——可以集中建在西部,用特高压送电、用光纤送数据。光纤的传输成本远低于输电成本。

这是中国在物理层的一个结构性优势——可以用空间换算力。美国的数据中心必须在用户附近(延迟敏感),中国可以把推理放东部、训练放西部。

但前提是:你得有足够多的芯片。否则西部的数据中心就是空房间。

3. 芯片短缺意外保护了中国电力系统

这不是开玩笑。如果中国有跟美国一样的 GPU 供应——以中国的数据中心建设速度,电力瓶颈可能比美国更严重。

2023 年中国数据中心用电量约 2700 亿度,占全国 3%。如果 GPU 不限购,这个数字可能翻倍甚至翻三倍——而中国的电力系统虽然比美国强,但要快速消化几十个 GW 的新增负荷仍然困难。

制裁反而给了中国电力系统一个缓冲期——让你有时间在芯片问题解决之前先把电网扩容做好。等国产芯片成熟了,电网也准备好了。这是制裁的意外正面效应。

中国 AI 的下一个瓶颈

如果芯片瓶颈在未来 3-5 年缓解(华为昇腾 + 其他国产芯片产能爬坡),中国的瓶颈会切换到哪儿?

我的判断不是电力——是高端互联带宽和先进封装。

- NVLink 5 的带宽是 1.8TB/s,华为 HCCS 最新一代大概是 600GB/s——三倍差距
- 更关键的是先进封装(CoWoS、3D 堆叠)——让 HBM 显存和 GPU 芯片离得足够近。台积电垄断了这项技术。没有先进封装,国产芯片的显存带宽上不去,KV Cache 放不下,长上下文推理就贵
- 而先进封装不只是技术问题——它需要极紫外光刻(EUV),ASML 垄断,也被制裁

所以下一层瓶颈是:即使芯片设计追上了,制造追不上;即使制造追上了,封装追不上;即使封装追上了,互联追不上。

这不是中国 AI 的末日——是意味着创新的方向会继续往"在给定约束下最大化效率"走。而历史经验是:被逼到墙角的人,往往比资源充裕的人做出更聪明的选择。
11
君泽
19天前
前些天听了个分享,一个观点是,在AI领域稀缺要素可能每18个月就会换一次——跟摩尔定律差不多。
简单算了一下:
2016-2018
时间: 2016-2018
瓶颈: 人才
谁是印钞机: Geoffrey Hinton
瓶颈什么时候破裂: 工具民主化了(PyTorch、Colab)
2018-2021
时间: 2018-2021
瓶颈: 算力
谁是印钞机: 英伟达
瓶颈什么时候破裂: AMD/Huawei/Cerebras 在追
2021-2023
时间: 2021-2023
瓶颈: 数据
谁是印钞机: Reddit、纽约时报(这个我存疑)
瓶颈什么时候破裂: 合成数据 + 自监督
2023-2024
时间: 2023-2024
瓶颈: 互联带宽
谁是印钞机: InfiniBand(英伟达又赚一轮)
瓶颈什么时候破裂: 以太网联盟在 push
2024-现在
时间: 2024-现在
瓶颈: 电力
谁是印钞机: Constellation、Vistra
瓶颈什么时候破裂:
下一个?
时间: 下一个?
瓶颈: 冷却水
谁是印钞机: 谁拥有五大湖?
瓶颈什么时候破裂:
英伟达聪明的地方不是"垄断了 GPU"——是他们每次都能押中下一个瓶颈是什么。Mellanox(InfiniBand)是 2019 $7B 买的,当时大家觉得贵疯了——现在看那是过去十年 AI 行业最划算的一笔收购。
冷却水这事以前没想过,一个万卡数据中心每天蒸发的水量相当于一个小型湖泊。微软的数据中心水消耗量过去两年涨了 34%。亚利桑那和爱荷华已经在限制新建数据中心了——不是因为缺电,是缺水。
如果 AI 行业最终卡在了自然资源上(电、水、土地)——那它的权力结构就完全不像互联网了。互联网的权力集中在数据层(Google 控制搜索、Meta 控制社交图谱)。AI 的权力可能最终集中在物理世界的稀缺资源控制者手里——那跟互联网的赢家是完全不同的一群人。
这可能是我见过的最奇怪的产业演化——一个纯数字技术,最终被纯物理约束锁死了上限。
21