即刻App年轻人的同好社区
下载
App内打开
潘乱
11月前
插眼👀

Neo张宁: Deepseek 一夜之间抹掉了数千亿美元的市值。显然,其中有不少恐慌情绪在,盘后,标普和 QQQ 都有反弹,但不确定性仍然存在。 我们不能当做一切没有发生。 Deepseek 在中美竞争的叙事下打开了低成本效率竞争的盖子,这个盖子一旦成为共识,就意味着一个技术周期开始走入下个阶段,原有的价值分布将被重新安排。 我的观点在附带链接中:Deepseek 并非巧合。 下面整理一些我看到的有价值的观点,这几天会滚动更新在这个 thread 里。 1/ Eric Xu 杰文斯悖论确实存在,但其影响并不均衡分布。 让我们回顾历史。 当蒸汽机的效率提升时,其应用范围迅速扩大。 需要注意的是,真正的技术创新在于蒸汽机本身,而非煤炭。然而,杰文斯悖论讨论的是煤炭,而非蒸汽机。 早期的静态蒸汽机制造商,如博尔顿与瓦特,并未成为铁路和船舶领域的主导者;相反,专门化的机车和船用发动机取而代之。 类似的情况也发生在计算领域:IBM曾主导大型机市场,但随着计算需求的爆发式增长,英特尔、微软以及后来的云服务巨头和如今的英伟达成为了赢家。是的,真正的技术创新围绕的是摩尔定律,而非某一家制造商。 人工智能将变得更便宜、更小巧、更普及。但它会集中在核能驱动的数据中心吗?杰文斯悖论无法给出明确答案。但有一点是明确的,更多的人工智能不仅仅意味着数据中心需要更多的GPU;它意味着人工智能将无处不在,运行在优化的芯片上。 但与蒸汽机不同的是,计算更具通用性。如果英伟达能够适应这一变化——通过从数据中心扩展到边缘人工智能、消费硬件和去中心化计算(这是他们的根基)——它可能继续保持主导地位。 如果英伟达未能成功转型,人工智能的扩散可能会重演历史:需求激增,但红利将流向更适应新范式的新玩家。 再次强调,杰文斯是对的——增长是不可避免的。但更深层次的智力问题是:谁将抓住这一增长的机会。 via https://x.com/xleaps/status/1884011738200231936?s=46&t=aomtGSgjAW0sID_OV1dG_Q 2/ Trung Phan via Ben Thompson 本·汤普森(Ben Thompson)关于DeepSeek将如何影响科技巨头的分析: 从长期来看,“模型商品化和更低成本的推理……对科技公司来说是好事”,但影响程度有所不同: ◽ **微软**:受益,因为可以减少在数据中心和GPU上的支出(尽管客户需求仍在增长)。 ◽ **亚马逊**:大赢家,因为它尚未开发出自己的AI模型,但现在可以以极低成本获得高质量模型,并通过AWS提供服务。 ◽ **苹果**:“推理内存需求的大幅降低使得边缘推理更加可行,而苹果拥有最适合的硬件。” ◽ **Meta**:最大赢家,因为它拥有最多的消费者接触点,可以以更低的成本服务所有用户。 ◽ **谷歌**:“可能处境更糟”,因为其专用TPU硬件的价值下降,且更便宜的推理增加了搜索领域出现更多AI替代品的可能性。 ◽ **英伟达**:其两大护城河(CUDA和多GPU网络)受到挑战。公司“不会消失……但突然面临更多不确定性”。 然而,英伟达仍有三个有利因素: 1)DeepSeek的方法可能会提升H100及未来芯片的性能; 2)整体AI使用量的增加对英伟达有利; 3)r1/o1类型的推理模型对计算资源需求极高。 via https://x.com/trungtphan/status/1884018574106218792?s=12&t=aomtGSgjAW0sID_OV1dG_Q 3/ Scott Belsky 以下是一些快速记录但仍具有韧性的相关观点: (1)下一代将改变我们工作和生活的产品,将通过多种模型的协同和符合我们需求与知识的优质界面来实现(参见“Cognico”的《IMPLICATIONS》文章,其中提出了未来协同工程师和设计师的角色等)。仅仅围绕少数几个大型模型的兴奋时代是短视的,可能会被视为AI领域的“Prodigy/CompuServe时代”。最重要的是,AI的价值将最大程度地流向那些最有效利用这项新技术的行业和人群(正如@GavinSBaker所说,降低成本“将提高AI的投资回报率”)。 (2)底层模型将日益商品化、客户端化,并且为了竞争,它们将变得更加专业化,并“向堆栈上游”移动,为开发者和终端用户提供更精细化和个性化的能力。我仍然看好市场领导者,但预计他们将越来越多地采取这一路线以脱颖而出,并在此过程中获取利润。 (3)我长期以来认为技术**使用**是一场界面层的游戏,顶层的界面层将获胜。现有的应用程序/ incumbent(尤其是操作系统)如果能够利用AI(模型无关,给用户选择权)、超个性化体验(“个性化效应”是新的网络效应),并 relentlessly 专注于用户体验(“包装”也很重要!),将迎来黄金机会。那些持续优化和重构的现有工作流程很少被取代,我们只有在收益超过成本时才会忍受切换的摩擦。 (4)在上述背景下,高性能开源LLM在本地运行令人兴奋,但这只是图像/视频/多模态模型、基于云的实时数据、跨平台偏好配置等更广阔图景中的一小部分。随着我们进入AR世界并实时处理(或生成)视觉信息,随着新的沉浸式娱乐和游戏体验的出现,随着我们在工作和生活的每个部分都需要AI伙伴来处理我们所看到的内容并利用分布在许多离散位置的各种数据,这一切都需要高性能的混合(云和本地)模型以非凡的方式协同工作。简而言之,我们终究需要更多的计算能力、基础设施和能源。;-) (5)别忘了,当任何事物变得无处不在时,人们会渴望稀缺性和意义。我预计我们将看到更多利用工艺和高触感客户服务的行业竞争,更多世界级的品牌、艺术家和故事讲述者通过情感共鸣与我们互动,以进一步区别于被用来“充斥领域”的AI内容,同时我们将看到中小型企业(SMB)的复兴,它们将打造出令人惊讶的优秀业务。虽然所有这些新工具和可能性令人兴奋,但在利用我们独特的人类能力以深刻的方式服务人类方面,存在着巨大的机会,这是计算机无法做到的。虽然商业的科学在于规模化,但许多商业的艺术在于那些无法规模化的事物。 via https://x.com/scottbelsky/status/1883930366194639001?s=12&t=aomtGSgjAW0sID_OV1dG_Q 4/ Daniel Newman 对于Broadcom和Marvell因DeepSeek消息而遭遇抛售的情况,可能比英伟达的抛售更令人费解。 Broadcom和Marvell正在与谷歌、微软、亚马逊等公司合作,设计更高效的专业AI芯片,用于训练和推理。如果DeepSeek的假设成立,这对专业AI芯片尤其是推理芯片来说将是一个极好的信号。除了Marvell和Broadcom,这对Groq等提供极低“每瓦每Token成本”的专业推理芯片公司也非常有利。 我仍然对市场的反应感到惊讶。 via https://x.com/danielnewmanuv/status/1883930419529236623?s=46&t=aomtGSgjAW0sID_OV1dG_Q 5/ Andrej Karpathy 我想说的是,深度学习对计算的需求是传奇般的贪婪,这是AI历史上任何其他算法都无法比拟的。你可能并不总是充分利用它,但我永远不会赌计算能力在长期内成为可实现智能的上限。这不仅适用于单个最终训练运行,也适用于所有算法创新背后默默支撑的整个创新/实验引擎。 历史上,数据被视为与计算分开的类别,但即使在很大程度上,数据也是计算的下游——你可以通过计算来生成数据。大量的数据。你可能听说过这被称为“合成数据生成”,但不太明显的是,“合成数据生成”和“强化学习”之间有着非常深刻的联系(甚至是等价性)。在强化学习的试错过程中,“试”是模型生成(合成)数据,然后根据“错”(/奖励)从中学习。相反,当你生成合成数据并以任何方式对其进行排名或过滤时,你的过滤器直接等同于一个0-1的优势函数——恭喜你,你在做粗糙的强化学习。 via https://x.com/karpathy/status/1883941452738355376?s=46&t=aomtGSgjAW0sID_OV1dG_Q 6/ Andrew Ng 今天股市中的“DeepSeek抛售”——归因于DeepSeek V3/R1对科技生态系统的颠覆——再次表明应用层是一个极具潜力的领域。基础模型层的激烈竞争对于构建应用程序的人来说是件好事。 via https://x.com/andrewyng/status/1883972263177072730?s=12&t=aomtGSgjAW0sID_OV1dG_Q 7/ Gavin Baker 1. 降低训练成本将提升 AI 的投资回报率 (ROI)。 2. 在短期内,这对于训练资本支出(capex)或“算力”主题来说,不可能是积极的影响。 3. 当前“AI 基础设施”领域的赢家(科技、工业、公用事业和能源等领域)面临的最大风险在于,简化版的 r1 模型可以在高端工作站(有人提到 Mac Studio Pro)上本地运行。这意味着类似的模型可能会在大约两年内运行在超级手机上。如果推理(inference)转向本地化,且效果“足够好”,我们将处于一个完全不同的世界,并迎来完全不同的赢家——即有史以来最大规模的 PC 和智能手机升级周期。计算能力长期以来在集中化和去中心化之间摇摆。 4. ASI(人工超智能)已经非常接近了,但没有人真正知道超智能的经济回报会是什么样的。如果一个耗资千亿的推理模型(比如训练于超过 10 万本《布莱克维尔百科全书》的 o5、Gemini 3、Grok 4 等)能治愈癌症或发明曲速引擎,那么 ASI 的回报将会非常高,而训练资本支出和能耗将会稳步增长;戴森球理论可能重新成为费米悖论的最佳解释。我希望 ASI 的回报很高——那将无比震撼。 5. 对于那些使用AI 的公司(软件、互联网等)来说,这一切都是利好消息。 6. 从经济角度看,这大大增加了分发渠道和独特数据的价值——比如 YouTube、Facebook、Instagram 和 X。 7. 美国的实验室可能会停止发布其最前沿的模型,以防止像 r1 那样的模型简化过程(distillation),不过在这方面,局势可能已经完全失控——换句话说,r1 可能已经足够用来训练 r2,以此类推。 via https://x.com/gavinsbaker/status/1883891313453470153?s=12&t=aomtGSgjAW0sID_OV1dG_Q 8/ 赤兔一哥 昨天慢屏飞的各种测评和研究,把这件事梳理得淋漓尽致,特别是把对硅谷的震动实时传导到了简中网。昨天美股盘前,缺芯概念股aka. gpu, asic, server不管fab,还是fabless一通暴跌,同时缺电概念股也是踩踏一片,从电机股到发电股到液冷股,开盘以后,跌幅更是搂不住。最后数据中心里打了八五折,数据中心外打了七折,不可谓不惨烈。这个跌法再一次让我们认识到基本面背后有因子,这些股票都是ai,都是三个月动能,都是crowding。管理组合光看行业不看因子是不行的,行业和个股基本面只是表面,内核里有多少是beta,有多少是idio(独立事件风险)不能不看。 其实美国基金对于nvda peaking还是早有准备的,去年下半年起把nv还放在前三的已经很少,除了个别长期投资者,AI时间的朋友,他们跨越周期来看问题。而0-2bn以内的基金,极少有敢拿着semi不当周期股的。 去年底到昨天暴跌前美国pm的一个consensus其实不是缺芯,而是缺电,一些人认为这是-长达十几年的long only主题。这里面有数据中心拉动的缺口,也有美国电力供给的结构性问题比如可再生间断性电力到了临界点,也有tmt新大哥coatue的ppt指路的影响。导致今年初什么GEV, 西门子,VST, TLN又是一阵发疯。但是由于缺电概念股里的买家非常多样,有非常熟悉基本面的能源基金在里面,和缺芯概念股里只有tmt不同,我估计有人兜底。 via https://mp.weixin.qq.com/s/IJSDYQ5lzJmOykK4amcyXg 9/ 摩根士丹利关于 DeepSeek 冲击的观点 1. 半导体:DeepSeek 技术虽先进,但不会显著改变 GPU 部署计划。主要 CSP 早已投资相关技术,DeepSeek 提出的训练成本降低 10 倍可能加速推理需求,但对长期增长率影响有限。出口管制仍是风险,尤其是对中国 AI 发展的限制。同时,开源模型性能的提升可能加剧 AI 行业竞争压力。 2. 互联网:DeepSeek 通过降低成本促进了产品创新。谷歌、Meta 和亚马逊等大型公司因资源优势受益最大,而 AWS 等平台通过推动模型商品化也将获益。小型公司也因此能更低成本提供 AI 产品。 3. 软件:更高效的算法降低了 AI 部署成本,推动更广泛的软件应用。微软、Snowflake 等公司已通过创新模型降低成本,同时提升性能。 4. 能源:AI 基础设施投资将持续。尽管 AI 计算成本未来六年可能下降 90%,但随着 AI 需求增加,杰文斯悖论可能导致整体算力需求快速增长。 5. IT 硬件:苹果可能成为 DeepSeek 浪潮的赢家,其 AI 策略聚焦设备端小型模型,资本风险较低。此外,边缘 AI 技术的发展契合苹果的核心目标。 6. 具身 AI:随着数字 AI 增长放缓,具身 AI(如机器人和自动驾驶汽车)将受更多关注。中国在这一领域的成就可能促使美国加强政策支持,推动相关技术竞争力。 via https://x.com/jukanlosreve/status/1884139534000234793?s=46&t=aomtGSgjAW0sID_OV1dG_Q 10/ Ben Thompson Google 在基础设施方面的创新确实令人惊叹,且依然被低估。同时需要指出的是,Google 在 AI 基础设施领域仍遥遥领先。 Yishan 提到的“Google 时刻”确实标志着专用服务器厂商(如 Sun)的终结,也显著限制了其他专用硬件厂商的增长空间,因为它们不得不与基于软件定义的通用硬件竞争。更广泛地看,廉价硬件的普及使利润的核心吸引力从底层硬件转移到更高的技术堆栈——Google 案例中是应用层,而 AWS 则通过扩展的云服务实现了这一点。 via https://stratechery.com/2025/the-openai-critique-comparative-advantage-and-infrastructure-aggregation-theory-and-cheap-ai/ 11/ OpenAI 研究负责人 Mark Chen 随着蒸馏技术的研究逐渐成熟,我们也发现降低成本和提升能力这两者正日益脱钩。降低推理成本(尤其是在更高延迟的情况下)并不意味着能够提升模型的能力。 via https://x.com/markchen90/status/1884303240692736081?s=46&t=aomtGSgjAW0sID_OV1dG_Q 12/ Pat Gelsinger, Intel CEO DeepSeek 的回应非常吸引人,我认为这种回应忽略了我们在过去五十年的计算中学到的三个重要教训。 首先,计算遵循气体定律。这意味着,它填充了可用资源(资本、电力、热预算等)定义的可用空间。正如我们在 CMOS、PC、多核、虚拟化、移动和许多其他领域所看到的那样;以极低的价格广泛提供计算资源将推动市场爆炸式扩张,而不是收缩。人工智能将在未来无处不在,而今天,实现这一潜力的成本太高了。我记得我第一次使用互联网浏览器的经历——哇。而现在——如果你是一个青少年,那就是每天的每一分钟或每一秒。市场反应是错误的,降低人工智能的成本将扩大市场。今天我是 nVidia 和人工智能股票的买家,很高兴从更低的价格中获益。 第二,工程是关于约束的。显然,DeepSeek 团队面临诸多限制,但他们找到了创造性的方法,以 10-50 倍更低的成本提供世界一流的解决方案。出口法限制了可用资源,因此中国工程师需要发挥创造力,他们也确实做到了。他们不需要 100 亿美元的硬件和最新的芯片以及数十亿美元的培训预算。几年前,我采访了我们这个时代著名的(也许是最伟大的)计算机科学家 Donald Knuth。他详细描述了在资源最有限、时间安排最紧张的情况下,他是如何做到最好的。我认为这种洞察力是我工程管理生涯中最重要的见解之一。 第三,开放获胜。过去几年,基础模型研究变得越来越封闭,这令人失望。在这一点上,我更认同 Elon 而不是 Sam - 我们真的希望,不,需要人工智能研究来提高其开放性。我们需要知道训练数据集是什么,研究算法,并反思正确性、道德和含义。了解了 Linux、Gcc、USB、Wifi 和许多其他示例的强大功能后,所有学习计算机历史的学生都清楚地认识到了这一点。在法律、频谱、工程和采用方面展开斗争——开放从来都不是件容易的事,而且市场力量不断对其进行挑战。开放每次得到适当的机会都会获胜。人工智能对我们的未来太重要了,不能让一个封闭的生态系统成为这个领域的唯一。 DeepSeek 是一项令人难以置信的工程,它将引领人工智能的更广泛采用。它将有助于重塑行业对开放式创新的看法。这需要一支来自中国的团队来提醒我们所有这些计算历史的基本教训。 via https://www.linkedin.com/posts/patgelsinger_wisdom-learning-the-lessons-i-thought-i-activity-7289659541477113856-o1Qr 13/ Steve Hsu 关于“杰文斯悖论”和 NVDA 估值 这是一个没有考虑到时间尺度不匹配的轻率回应。今天购买 NVDA 芯片的人只有几年的时间,之后芯片的价值将贬值 50% 或更多。他们必须在短期内从芯片上获得投资回报。但目前流向 genAI 的实际收入并不多,如果其中大部分被免费的开源模型捕获,这些模型不一定需要 NVDA 芯片来运行(请参阅 Groq 或甚至是精简模型的传统硬件),并且效率高出约 30 倍,那么今天对 NVDA 芯片的投资可能会产生较低的投资回报率。同样,如果每个人在模型训练方面都像 DS 一样高效,那么今天购买的 NVDA 芯片可能足以进行这种训练。 我可以想象,在未来几年,DS V3 和 R1 类模型(包括其他高度优化的中国模型,如 Qwen 或字节跳动)将广泛应用于人工智能应用。但是这些模型需要约 1/30 的计算量来进行推理,因此,即使学校、工作场所、网络搜索等领域对 genAI 的采用呈现健康增长,未来几年对目前销售的 NVDA 芯片的需求也可能远低于人们的预期(30 倍很难弥补!)。除此之外,如果模型训练也更加高效(就像 DS 一样),并且预训练的数据可能有限,那么对 NVDA 芯片的需求中模型训练部分也可能比预期的要小得多。 如果几年后 NVDA 在 genAI 中的优势还没有基本消失,我会感到震惊。设计用于 LLM-transformer 计算的竞争性芯片并不难。从 GOOG 到 AMD 再到华为等许多实体都在这样做。NVDA 拥有 CUDA 软件库锁定(除中国外,人们可能会被迫转向 HW Mindspore 生态系统),但这也会随着时间的推移而消失。 我现在正在参加一个人工智能 CX(客户服务、呼叫中心等)会议。虽然 CX 是人工智能替代人类劳动力的最佳目标之一,但人类决策者在部署方面仍存在大量阻力和犹豫。人工智能取代约 50% 的人类全职工作岗位还需要数年时间,尽管这显然是可能的。 via https://x.com/hsu_steve/status/1884362604195266764?s=46&t=aomtGSgjAW0sID_OV1dG_Q

10