即刻App年轻人的同好社区
下载
App内打开
李惠子Huizi
1k关注3k被关注1夸夸
AI/科技投资人
前AI大模型投资人高管|AI硬件联创|CVC科技领域负责人
思考技术伦理的哲学家|知行合一 创造未来
一朵活力满满的奇葩
置顶
李惠子Huizi
2月前
从中美局面来看,中国的AGI进程,需要更aggressive ,更专注核心。中国版Anthropic+agent方向+出海🔥是真正的创业公司的机会。
03
李惠子Huizi
01:07
YC对 Physical Intelligence (PI) 联合创始人 Quan Vuong 的深度访谈。访谈围绕如何为机器人领域带来“GPT-1 时刻”展开,详细探讨了通用机器人基础模型的突破、面临的挑战、实际应用案例以及未来机器人创业的新范式。
1. Physical Intelligence 的愿景:机器人的“GPT-1 时刻”
核心目标:PI 的使命是构建一个能够控制任何机器人执行任何物理任务的基础模型。
实现路径(“剥洋葱”策略):从一个具备常识的强大基础模型开始,将其部署在“混合自治系统”(允许人类在出错时接管并纠正)中。系统通过在真实世界中处理边缘情况来不断自我迭代,最终实现完全自主化。
2. 机器人技术的演进与“跨具身”突破 (Cross-Embodiment)
机器人技术的三大支柱:语义理解(已被大型语言模型很好地解决)、任务规划以及实时控制(与不断变化的物理环境互动,这是目前最难的部分)。
通用模型的崛起:早期的系统(如 RT-2 Palm-E)证明了视觉语言模型可以转化为机器人的低级动作控制,甚至能完成训练数据中从未出现过的零样本(Zero-shot)任务。
跨具身(Cross-Embodiment)的威力:过去的模型只能用于单一特定硬件。研究发现,如果将多种不同形态的机器人的数据放在一起训练,模型学习到的将是“如何控制机器人”的抽象概念。测试表明,这种跨设备的通用模型比专门针对单一硬件优化的专家模型性能高出 50%,这证明了“Scaling Laws”同样适用于机器人领域。
3. 数据挑战与巨大的经济潜力
数据收集困境:与语言模型可以直接使用互联网上的海量文本不同,机器人领域不存在现成的“互联网数据”。必须建立高效的基础设施来从各种来源收集和消化数据。
巨大的经济回报:尽管收集数据成本高昂,但如果能成功研发出通用机器人模型,保守估计它可能会为美国 GDP 贡献约 10%(按目前算高达 2.4 万亿美元),这为前期的巨大投资提供了充分理由。
4. 突破性技术:将“大脑”放在云端
降低硬件成本:传统观点认为机器人需要搭载昂贵且笨重的本地计算单元来保证实时性。PI 提出了极其创新的解决方案——将推理模型托管在云端服务器上。
流水线控制(Action Chunking):为了克服网络延迟,PI 通过算法优化,让机器人在执行当前动作块(如未来 100 毫秒的动作)时,提前向云端 API 请求下一个动作块。这种方式无缝衔接了动作,使得极其复杂的 AI 也可以通过极低的本地硬件成本(甚至只是简单的摄像头)来实现实时控制。
5. 现实世界的高级部署案例
PI 不仅做学术研究,还与 YC 的初创公司紧密合作,将模型投入实际应用:
Weave(家庭场景):控制机器人在真实的洗衣房里折叠各种形态各异、不可预测的衣物。对于机器人来说,处理柔软且易变形的物体一直是被视为“图灵测试”级别的难题,而他们仅用几周时间就实现了目标。
Ultra(物流场景):在真实的电商仓库中,机器人需要将各种形状不同的商品精准放入狭窄的软包装袋中。这不仅需要精准的视觉理解,还需要机器人学会“轻推”等复杂动作,且该系统已实现全天候规模化自主运行。
6. 给创业者的指南:机器人领域的“寒武纪大爆发”
Quan Vang 认为,机器人创业的门槛正在急剧降低,我们即将迎来各类垂直机器人公司的“寒武纪大爆发”:
过去:需要全栈自研(自己造昂贵的硬件、写自动驾驶协议栈、做安全认证),成本极高、周期极长。
现在的创业剧本:
1. 深入理解传统工作流的痛点,找到机器人能产生最大价值的切入点。
2. 使用廉价的现成硬件,因为强大的 AI 模型可以补偿硬件的机械误差。
3. 引入“人机混合自治系统”,以最快速度在经济上实现盈亏平衡,然后迅速扩大机器人车队的规模。
4. 接入像 PI 提供的基础通用模型(PI 甚至开源了他们的 Pi 0 预训练模型,与内部研究团队使用的权重完全一致),让创业公司只需专注自身垂直领域的数据收集即可。
总结:视频传递了一个非常乐观且激动人心的信号——在 AI 大模型的加持下,机器人技术终于从科幻和昂贵的工业重镇,走向了低成本、高通用性的现实。现在正是创业者从“数字世界”向“物理世界”进军的最佳时机。
00
李惠子Huizi
00:29
知名播客主 Dwarkesh Patel 对黄仁勋(Jensen Huang)的最新深度硬核访谈,探讨了英伟达的护城河、芯片供应链瓶颈、市场竞争格局(GPU vs TPU)、云计算布局以及对华芯片出口管制等极其关键的战略话题。
1. 英伟达的护城河与不可替代性
电子到 Token 的转换:黄仁勋提出他看待英伟达的思维模型:“输入的是电子,输出的是 Token”。从电力转化为高价值的AI生成内容,其中蕴含了海量的工程、科学和发明,这一过程极难被商品化。
AI 不会终结软件,反而会引爆软件使用:面对“AI会让软件变得不值钱”的观点,黄仁勋认为恰恰相反。随着 AI Agent(智能体)的崛起,工具(如微软Excel、芯片设计EDA软件Synopsys等)的使用量将呈指数级增长。过去工具使用受限于人类工程师的数量,未来会有无数的 Agent 在后台高频使用这些软件,这将带来庞大的算力需求。
2. 供应链产能瓶颈在哪?
不是芯片,而是“水管工”:被问及台积电的逻辑芯片和CoWoS封装等上游产能能否跟上英伟达每年2倍的增长时,黄仁勋表示,芯片制造的扩产周期通常只需两三年。真正制约AI数据中心扩张和美国再工业化的瓶颈是物理基础设施建设和能源——比如极度缺乏水管工和电工等技术工人。
主动塑造供应链:英伟达不仅是客户,还在提前几年“塑造”供应链。比如在硅光子技术(Silicon Photonics)上,他们早已和台积电及生态伙伴联合研发并开放专利,以确保未来供应链能承载AI的庞大需求。
3. GPU vs 竞争对手 (TPU与定制ASIC)
极佳的泛用性与算法创新:谷歌、Anthropic等都在大量使用TPU或自研芯片。黄仁勋反驳了“AI只需做矩阵乘法”的误区。AI模型架构正在极速演进(如混合SSM架构、融合扩散模型与自回归等)。CUDA和GPU的极度灵活性允许AI研究员轻松发明和运行全新算法,这是ASIC(专用芯片)做不到的。
性能提升不能只靠摩尔定律:摩尔定律每年只能带来约25%的提升,但从Hopper到Blackwell架构,英伟达实现了50倍的能效飞跃。这得益于跨芯片、系统、网络(NVLink)、库和算法的“全栈协同设计”。
世界上最低的 TCO(总拥有成本):黄仁勋自信地表示,目前世界上没有任何一个平台的“每TCO性能比”能打败英伟达。买英伟达芯片虽然单价高,但计算速度快、能效高,最终算出的“每个 Token 的成本”依然是全世界最低的。
4. 云计算战略与“不摘取所有果实”的哲学
为何不自己做云服务?:手握巨量现金,英伟达为何不自己下场做最大的云服务商赚差价?黄仁勋提出了公司的哲学:“做不可或缺的事,但尽量少做(do as much as needed as little as possible)”。他们支持并投资像 CoreWeave 这样的新兴 AI 云计算公司(Neo-clouds),以及投资 OpenAI Anthropic,目的是让繁荣的生态长出来,而不是独占整条产业链。
绝不“价高者得”:在GPU极度短缺的情况下,英伟达拒绝通过竞价来分配算力。黄仁勋强调英伟达是行业基石,必须拥有可预测性和高信誉。配货主要根据客户下订单的时间(先入先出)以及客户的数据中心是否已经建好准备就绪来决定。
5. 焦点辩论:关于中国市场与出口限制
访谈中最激烈、耗时最长的一段对话。主持人从国家安全角度质问为何要向中国出售芯片,黄仁勋予以了强力反驳。
算力的缺失可以用能源弥补:黄仁勋提出“AI是个五层蛋糕,最底层是能源”。他指出,中国拥有巨量的能源储备和过剩的芯片制造产能。即使只能获取老旧的7nm芯片,在庞大能源的支持下,通过堆叠芯片规模,中国依然可以获得惊人的总算力。
中国有顶级的AI人才库:芯片和摩尔定律的差距,可以通过卓越的算法和计算机科学来弥补。中国拥有世界上极高比例的顶尖AI研究人员,近期 DeepSeek 等模型的突破就是证明。
放弃中国市场对美国是巨大伤害:黄仁勋认为,迫使中国脱离美国的技术生态是极其短视的。这不仅会让美国科技圈丧失全球第二大市场,更危险的是,这会倒逼中国开发出完全独立于英伟达和美国技术栈(Tech Stack)的硬软件生态。如果未来这些优秀的开源模型在全球(如中东、全球南方)扩散,而它们是在非美国技术栈上运行最好的,这将导致美国彻底失去在未来科技领域的全球标准制定权和领导地位。
6. 为什么不尝试其他架构?如果没有AI会怎样?
专注现有架构:为何不分拨团队去开发晶圆级芯片等其他路线?黄仁勋表示,英伟达在内部模拟器中测试过所有可能的架构,结果证明目前的路线是最好的,其他路线在数学和物理上被证明更差。
哪怕没有深度学习,英伟达依然会很伟大:如果AI没有爆发,英伟达今天在做什么?黄仁勋回答,依旧是“加速计算(Accelerated Computing)”。CPU通用计算的扩展已经走到尽头,即使没有大语言模型,在分子动力学、量子化学、流体力学、地震波处理和数据科学等领域,加速计算依然是人类科技突破的刚需。
01
李惠子Huizi
1天前
Anthropic:我们最新的模型,Claude Opus 4.7,现已全面可用。
在高级软件工程方面,Opus 4.7 相较于 Opus 4.6 有了显著的改进,在最困难的任务上取得了特别的提升。用户报告称,他们能够充满信心地将最困难的编码工作——那种以前需要密切监督的工作——移交给 Opus 4.7。Opus 4.7 以严谨和一致的方式处理复杂、长时间运行的任务,对指令给予精确的关注,并在报告回传之前设计方法来验证其自身的输出。
该模型还具有显著提升的视觉能力:它能以更高的分辨率查看图像。在完成专业任务时,它更具品味和创造力,能生成更高质量的界面、幻灯片和文档。并且——尽管它在广泛能力上不如我们最强大的模型 Claude Mythos Preview——但在一系列基准测试中,它展现出了比 Opus 4.6 更好的结果:
上周我们宣布了 Project Glasswing,强调了 AI 模型在网络安全方面的风险——以及益处。我们声明,我们将保持 Claude Mythos Preview 的有限发布,并首先在能力较弱的模型上测试新的网络安全防护措施。Opus 4.7 就是第一个这样的模型:它的网络安全能力不如 Mythos Preview 先进(事实上,在其训练期间,我们尝试了差异化降低这些能力的努力)。我们在发布 Opus 4.7 时配备了安全防护措施,这些措施会自动检测并阻止表明是违禁或高风险网络安全用途的请求。我们从这些安全措施在现实世界部署中学到的经验,将帮助我们朝着广泛发布 Mythos 级别模型的最终目标迈进。
希望出于合法的网络安全目的(例如漏洞研究、渗透测试和红队测试)使用 Opus 4.7 的安全专业人员,受邀加入我们新的网络验证计划(Cyber Verification Program)。
今天,Opus 4.7 已在所有 Claude 产品以及我们的 API、Amazon Bedrock、Google Cloud Vertex AI Microsoft Foundry 中提供。定价与 Opus 4.6 保持不变:每百万输入 token 5 美元,每百万输出 token 25 美元。开发者可以通过 Claude API 使用 claude-opus-4-7。
以下是我们对 Opus 4.7 进行早期测试的一些亮点和注意事项:
指令遵循。 Opus 4.7 在遵循指令方面有显著的提升。有趣的是,这意味着为早期模型编写的提示词现在有时可能会产生意想不到的结果:以前的模型可能会松散地解释指令或完全跳过某些部分,而 Opus 4.7 则会字面地理解这些指令。用户应相应地重新调整他们的提示词和测试框架。
改进的多模态支持。 Opus 4.7 对高分辨率图像具有更好的视觉能力:它可以接受长边达 2,576 像素(约 375 万像素)的图像,是之前 Claude 模型的三倍多。这开启了大量依赖精细视觉细节的多模态用例:阅读密集屏幕截图的计算机使用智能体,从复杂图表中提取数据,以及需要像素级完美参考的工作。
现实世界工作。 除了在 Finance Agent(金融智能体)评估中取得最先进的分数外(见上表),我们的内部测试显示,Opus 4.7 是比 Opus 4.6 更高效的金融分析师,能生成严谨的分析和模型,制作更专业的演示文稿,并在各项任务之间实现更紧密的整合。Opus 4.7 GDPval-AA 上也处于最先进的水平,这是一个对金融、法律和其他领域中有经济价值的知识工作进行第三方评估的基准。
记忆。 Opus 4.7 更擅长使用基于文件系统的记忆。它能够在漫长的、跨多会话的工作中记住重要的笔记,并利用它们推进到新的任务中,因此,新任务需要的前置上下文更少。
下面的图表展示了我们在多个不同领域进行发布前测试的更多评估结果:
00
李惠子Huizi
2天前
Mark @新智元: 就在刚刚,中国AI团队EvoMap公开了一份详尽的技术对比报告:Nous Research旗下明星项目Hermes Agent的「自进化」功能,与EvoMap在36天前开源的Evolver引擎,存在10步主循环一一对应、12组术语系统性替换、7份公开材料零归属的高度同构。

更炸裂的是,被锤之后Nous Research的回应竟然是:「Delete your account」。随后删帖、拉黑、全线沉默。

8.5万Star vs 4600万次调用,先认识一下这两个项目。

Nous Research,硅谷知名AI实验室,融资过亿美元,推出过Hermes系列开源大模型,在LLM圈影响力不小。旗下最新的Hermes Agent,号称能让AI智能体自主完成任务、自我进化、越用越强,GitHub星标一路飙到8.5万。

EvoMap,一个十几人的中国年轻团队。他们从零搭建了一整套AI Agent自进化引擎Evolver,给AI智能体装上「基因系统」,让能力可以像生物基因一样遗传、变异、进化。说人话就是:让AI自己写代码升级自己。

有多猛?Evolver在ClawHub上线10分钟登顶热门榜首,前三天下载量突破36000+。截至目前,EvoMap已有13万个AI Agent节点接入,累计资产超138万个,总调用超4600万次。每一个接入EvoMap的Agent,都会安装Evolver。

然而就是这样一个实打实的硬核项目,在开源36天后,遭遇了最令人窒息的打击。

他们的整套自进化架构,被一个融资过亿的硅谷团队「重新发明」了。
10
李惠子Huizi
2天前
Coding是新的”AI加速器",正在加速AGI实现,领先的Coding模型就像领先的GPU。

张小珺: 广密君,出没!@广密

00
李惠子Huizi
3天前
Andrej Karpathy: 从我的时间线(Timeline)来看,人们对AI能力的理解正出现越来越大的代沟。
认知差距的来源:时效性与使用层级
我认为首要问题在于使用的时效性和付费层级。很多人可能在去年某个时候试用了免费版的ChatGPT,并让这种体验过度影响了他们对AI的整体看法。
这类群体的反应往往是嘲笑模型的各种怪异表现、幻觉等。是的,我也看过那些疯传的视频,OpenAI的“高级语音模式”(Advanced Voice Mode)在面对诸如“我应该开车还是走路去洗车店”这样简单的问题时也会搞砸。但问题在于,这些免费的、老旧或被弃用的模型,根本不能代表今年最新一轮最先进的智能体模型(Agentic Models)的能力,尤其是OpenAI Codex和Claude Code。
能力的“尖峰化”与商业驱动
这就引出了第二个问题。即使人们每个月花200美元使用最先进的模型,AI的许多能力在高度技术化的领域也呈现出一种“尖峰”(peaky)状态。
围绕搜索、写作、建议等方面的日常查询,并不是AI能力取得最显著、最戏剧性进步的领域。
技术原因: 强化学习的技术细节决定了它更依赖“可验证的奖励”。
商业原因: 这些日常用例在各大公司的技术攻坚中并没有得到足够的优先重视,因为它们不能带来同等丰厚的商业价值($$$)。金矿在别处,焦点自然也就转移了。
患上“AI狂躁症”的专业群体
这就让我联想到第二群人,他们同时满足两点:
1. 付费并使用最前沿的智能体模型(OpenAI Codex / Claude Code)。
2. 在编程、数学和研究等技术领域专业地使用它们。
这一群体最容易患上“AI狂躁症”(AI Psychosis),因为今年AI在这些技术领域的近期进步简直令人咋舌。当你把计算机终端交给其中一个模型时,你现在可以眼看着它们轻松化解那些通常需要几天甚至几周人工才能完成的编程难题。正是这第二群人,对AI的能力、进步的速度(斜率)以及各种与网络安全相关的连锁反应赋予了极高的重视。
总结 (TL;DR)
这两群人完全是在跨服聊天(各说各话)。
现实情况确实是同时并存的:OpenAI免费且我认为有点被边缘化(?)的“高级语音模式”会在Instagram的短视频里搞砸最弱智的问题;而与此同时,OpenAI最高层级的付费Codex模型可以连续运行一个小时,连贯地重构整个代码库,或者发现并利用计算机系统中的漏洞。
这部分高阶能力是真的行得通,且取得了突飞猛进的进展,主要归功于以下两大属性:
1. 可验证的明确奖励: 这些技术领域提供了明确的奖励函数(例如:单元测试是否通过),这意味着它们极易进行强化学习训练(相比之下,写作就很难进行明确的量化评判)。
2. 更高的B2B价值: 它们在B2B(企业对企业)环境中价值巨大,这意味着研发团队的绝对主力都集中在改进这些领域上。
所以,这就造就了我们眼下的现状。
03
李惠子Huizi
3天前
@indigo: AI 正在消灭中间层,头部通吃一切!在 SF 与硅谷呆了一周多,拜访了很多朋友、创业者还有 AI Researcher,这是整趟行程中最强的共识信号。只有最顶尖的人(用 AI 武装自己)和纯自动化的公司能存活,中间层全部被淘汰。半导体会把软件的 Margin 全吃掉了,中等体量的软件公司正在被全面抛售。初级程序员已经没了,高级程序员一年内,研究员三年内,这个行业最终的终局一定是全自动化 。。。AI 实验室正在疯狂加速中⏩

机器人/ Physical AI 方向确定,但还太早!这里有一些分歧,有研究员认为还需 5-10 年,但乐观的同学给出的时间窗口是 3-5 年,硬件和数据都不成熟。对比生物演化,因为小脑进化了三亿年,神经元数量是大脑的七倍,具身智能会比大语言模型还要挑战,但毫无疑问这是语言大模型之后最确定的下一个赛道。

VC 本质上已变成大厂 AI Lab 的"项目收集器"。AI 时代没有免费流量红利了,每次平台迁移的红利都消失了。最终的落脚点是做社群和人的连接——"请十个朋友到家里,哪个朋友有项目大家给你打点钱"比正式融资更实在。AI 时代投资的信任基础是"人机信任"——信任你这个人加上你的 AI Agent。

中国 AI 公司的最优策略是"快速跟进",特别是 AI Labs 应该紧跟 OpenAI / Anthropic 的技术路线,快速复现,而非追求原创突破。

无论是投资、创业还是个人职业,中间地带正在快速消失。要么做到最好,要么做纯自动化,没有中间路线!湾区同学都太焦虑了😆
00
李惠子Huizi
4天前
Agent潮流,个人助手智能体之年太精彩了
01