即刻App年轻人的同好社区
下载
App内打开
向度之桥
32关注242被关注0夸夸
讲点技术,讲点产品
产品总监&AI创新产品负责人
在 AI 和现实两个向度间搭建认知到落地的桥梁,让人与世界的连接更便捷。
置顶
向度之桥
2月前
AI编程+自动化交流群,欢迎一起交流~
00
向度之桥
11:28
最近看了前Meta首席技术官Mike Schroepfer的一个访谈。

这个人在Facebook待了14年,把工程团队从100人带到了35000人,建过数据中心,搞过VR硬件,还主导了好几次数十亿美元的收购。
他现在自己出来做投资了,专门投气候科技领域的公司。

他说:人类有一种本能,就是倾向于去解决那些容易解决的问题。

Schroepfer说这是他在Facebook早期学到的最重要的教训之一。当时他们遇到了一个特别棘手的问题,就是数据中心不够用了。
2008年金融危机,房地产市场崩了,没人盖新的数据中心。他们租不到空间,用户又在疯狂增长。

他们没有选择,只能自己建。

这里面有个很关键的思维方式,他没有说我们先把能解决的小问题都处理了,然后再来对付这个大问题。

他说的是:先识别出最关键的风险是什么,技术上最不确定的部分是什么,然后直接冲着那个最难的地方去。

困难的事不会因为你拖着就变简单,你回避它的每一天,它都在那儿等着你。

这是第一个点。;直面困难,不要用忙碌来逃避。

第二个让我觉得很有启发的是他判断一项技术值不值得投入的方法。

2013年的时候,Facebook要决定要不要建一个AI研究实验室。
当时其实有很多技术方向可以选,比如微软那种什么都研究的综合性实验室。

但Schroepfer和扎克伯格讨论之后,决定只做AI。

他说他们看到了ImageNet挑战赛的结果。那年有个用神经网络的方案,比其他所有方案都好出一大截,这本身就是个信号。
但更重要的是他们问了一个问题:这个技术是已经到顶了,还是才刚刚开始?

他们分析了一下,发现神经网络的性能取决于三个东西:模型规模、数据量、算力。
而这三个东西,当时都还有几千倍的提升空间。

他用了一个词叫runway,就是跑道的意思。
一项技术有没有runway,决定了它值不值得重注投入。

如果一个领域已经被优化了150年,你再怎么努力可能也就挤出百分之几的改进。但
如果它还在起点,那就完全不一样了。

这个思维方式其实可以迁移到很多场景。
比如你在选择学什么技能、进入什么行业、甚至是评估一个项目值不值得做的时候,都可以问自己:这件事的runway有多长?它是在起点还是终点?

第三个点是关于人的。
Schroepfer现在做投资,每年要见上千个创始人,最后只投大概10个。他说技术和市场固然重要,但最终赌的还是人。
他看人主要看两点。

第一是有没有一种死磕的劲头。
创业就是一连串的濒死体验加上无数人跟你说不行。30个投资人拒绝你不重要,重要的是第31个说了yes。

他自己25年前第一次创业的时候,有个投资人直接在他们的路演会上睡着了。
但后来红杉投了他们,公司做成了。

第二是学习能力。
他用了一个很有意思的说法,叫「新信息的消费者」。
这种人有两个特质:一是谦逊,承认自己不懂;二是好奇,愿意去搞懂。
这两个加在一起,让他们能快速掌握任何新领域。

有个做核聚变的公司叫Commonwealth Fusion Systems,创始人是个等离子物理学家,从来没在公司工作过。
如果你让HR去筛选一个能带千人团队的CEO,等离子物理学家肯定不在搜索条件里。
但这个人学得飞快,很短时间内就掌握了怎么建团队、怎么讲故事、怎么融资。

这三个点其实是串在一起的,直面困难而不是逃避,选择有runway的方向,然后用成长型思维去持续学习。

最后,访谈里有个细节。
Schroepfer说,事后看所有成功的技术都是显而易见的。但在当时,大多数人都在怀疑。
然后三年之后,同样这批人会说我早就知道这东西会火。

他说得很直接:不,你当时不知道。

真正的判断力,不是事后觉得一切都合理,而是在一切都不确定的时候,你敢不敢往前走那一步。
00
向度之桥
3天前
很多产品经理用AI,用着用着就飘了。
你问它一个想法好不好,它夸你。你问它一个方案行不行,它还夸你。

这个问题,Amplitude的增长产品经理Tommy Keeley专门聊过。
他说:AI默认会告诉你想听的话,而不是你应该听的话。

Tommy做了个小实验,他问ChatGPT:我想做一款闹钟,每五分钟响一次,而且永远关不掉,你觉得怎么样?
正常人一听就知道这想法不靠谱对吧。
但AI非但没泼冷水,反而兴奋地给这玩意儿取了个名字叫惩罚时钟,还开始分析这个概念有多么新颖独特。

很有趣,但完全没用。
换句话说,当你在做产品决策的时候,如果AI只会顺着你说话,那它其实在帮倒忙。

因为产品经理这个角色,最需要的恰恰是摩擦,是被挑战,是有人能戳破你的盲点。

那怎么办?
第一步:给AI装上一群杠精
Tommy提出了一个框架,叫个人董事会。
说白了,就是在提示词里给AI分配角色,让它扮演不同立场的思考者来挑战你的想法。

他常用的角色有五种。
怀疑论者,专门挑毛病。
用户拥护者,永远站在用户角度说话。
执行者,关心这事儿能不能落地。
远见者,看长远价值。
系统思考者,分析对整体的影响。

你可以这样写提示词:请你扮演Don Norman,我正在做一个功能改版项目,请从用户体验的角度来挑战我的方案。

更进阶的玩法是,让两个顾问在同一个对话里互相辩论。
Tommy试过让Andy Grove和Elon Musk就一个资源分配问题吵架。

他不是要听谁赢,而是要看矛盾点在哪里,看自己不自觉地被哪边吸引了。

第二步:自己动手做原型
聊完了想法阶段,再说执行。

Tommy有个观点我特别认同:增长产品经理应该学会自己写代码做原型。

这不是要你变成工程师,而是要消除想法和验证之间的摩擦。
你脑子里有个功能设想,以前得找设计师出图,找工程师评估,整个流程走下来可能一两周。

现在,你可以用Lovable或者Bolt这类工具,可能一个下午就能弄出一个可用的原型。

这带来两个好处。
第一是理解。
当你自己动手的时候,你会发现哪些事情比想象中简单,哪些比想象中难。真正的瓶颈在哪里,你心里有数了。

第二是同理心。
你感受过工程师的痛苦,你就不会再轻飘飘地说一句这个功能很简单吧应该很快能做完。这种同理心会让你成为更好的合作伙伴。

Tommy画了一张图,记录自己学写代码时的心理曲线。
刚开始用这些AI工具,做了几个小玩具应用,信心爆棚。
然后他心想,我应该能在公司正式代码库里搞点事情了吧。

结果一进去,环境配置就出问题,改一个小地方连带着动了十年没人碰过的历史文件,信心直接跌到谷底。

当你自己动手做东西的时候,很容易陷入一种幻觉,觉得自己造了一座城堡,实际上可能只是个沙雕。
投入了时间精力,就会产生禀赋效应,高估自己作品的价值。

所以Tommy提醒说,速度不等于成功。能快速做出来是一回事,用户会不会用是另一回事。
结果重于产出,这个老道理在AI时代依然成立。
第三步:让AI帮你挖出隐藏的增长杠杆
前面两步讲的是想法和执行,最后一步是学习和分析。

很多人觉得AI的价值就是快。Tommy说不对,AI更重要的价值是帮你提升判断力。

具体来说,有几个场景特别适合用AI来辅助分析。
实验结果解读。跑完一个AB测试,你可能会不自觉地去挑那些让结果看起来成功的指标。这是人性。AI可以帮你做一个全面的初筛,把所有指标摆出来,避免你自己选择性关注。

用户聚类。
传统的用户分群往往基于人口统计,比如年龄、地区、职业。

但AI可以根据行为数据做聚类,发现那些你没想到的模式。
比如你以为自己的产品在A行业做得好,结果发现有一群B行业的重度用户,这可能就是新的增长机会。

客户反馈分析。
如果你的产品有成千上万条评论、工单、调查问卷,人工根本看不过来。
AI可以快速提炼主题,识别情绪,给痛点排优先级。

这些应用背后有一个共同的逻辑,就是让不可见的东西变得可见。

聊了这么多具体的方法,最后回到一个更根本的问题。

这些AI工具到底改变了什么?
软件开发的基本循环没变,还是从想法到执行再到学习,然后迭代。

变的是每个环节的速度,以及我们手里的工具。

Tommy的建议是,作为增长PM,你要对这些变化保持敏感。知道现在能做什么,知道工具在往哪个方向演进,然后把自己摆在那个可能性的边界上。

不是被动等着别人告诉你该怎么用AI,而是主动去探索,去试错,去积累自己的判断。

同理,不是让AI来夸你,而是让它来挑战你。
这可能才是AI时代产品经理最重要的能力。
00
向度之桥
3天前
AI时代,产品经理必须重建的底层认知。

最近,我身边有不少做了七八年甚至十几年产品的朋友转去做AI产品以后,都经历了一段极其痛苦的适应期。

他们不是能力不行,恰恰相反,做AI产品,越是传统产品经验丰富的人,越容易踩坑。

前Zalando产品负责人Rupesh Agarwal最近分享了他转型做AI产品的方法论。

Rupesh Agarwal有着18年的产品经验,做过物流、电商、供应链,带过大大小小的团队。
按理说,这种履历做什么产品都能上手。

结果他第一次带团队做AI产品,首发版本超过一半的推荐结果是错的。

他原话是:我以为我们发射的是一枚登月火箭,结果发射出去的是一堆不确定性。

为什么会这样?

第一点:传统软件是确定性的,AI产品是概率性的。
传统软件是非常确定的,你做一个登录按钮,要么能用,要么不能用,同样的输入永远得到同样的输出。

但AI产品是存在概率性的,同样的输入可能产生不同的结果。
这意味着你必须从管理确定性变成了管理概率。

Rupesh说:你不能再承诺确定性,你只能管理概率区间。

2、从发布功能到训练系统。
传统产品经理的核心工作是排期、发版、迭代。

但AI产品的核心不是功能列表,而是一个持续学习的系统。

比如Gmail的垃圾邮件过滤,这不是一个功能,而是一个学习系统。
每次用户点击举报垃圾邮件,模型就会重新训练,真正的产品是这套学习机制本身。

所以你的路线图里必须包含数据质量、模型重训练周期、模型监控这些东西,而不仅仅是界面改版。

换句话说,发布功能没那么重要,让系统变得更聪明才重要。

3、用户反馈的局限性。
传统产品方法论特别强调用户调研。

但在AI产品里,用户往往说不清楚问题出在哪。

以Netflix的推荐为例,你去问用户,用户可能会说推荐有点奇怪,但他不会告诉你模型过度学习了他孩子的观看记录,也不会告诉你训练数据把他的口味归错了类别。

你从点击模式、观看完成率、停留时长里学到的东西,远比用户访谈多得多。

4、KPI体系需要重建。
做过产品的人都知道北极星指标很重要,留存率、转化率、收入增长,这些都是经典的业务KPI。

但AI产品需要额外的指标:模型准确率、假阳性率、推理延迟、公平性、可解释性。

比如Uber,他们要追踪订单量、收入、取消率,但同样要追踪预计到达时间的准确性、模型漂移。
如果ETA准确性偏差哪怕15秒,取消率就会上升,这时候界面可能根本没变。

5、团队协作模式的变化。
传统产品经理的协作模式是产品、设计、工程铁三角。

但做AI产品,你还要协调数据科学家、机器学习工程师、法务合规团队。

如果你在做一个内容推荐系统,改一个推送策略可能就需要协调七八个团队。发布一个功能需要的是跨职能编排,而不仅仅是三方协作。

Rupesh用了一个比喻:AI产品经理不是在管理功能,而是在指挥一个系统,你的角色从操作者变成了指挥家。

6、路线图变成了假设集合。
传统产品,你可以相对准确地估算交付时间,路线图就是承诺。

但AI产品引入了根本性的不确定性,模型性能只有通过实验和真实数据才能验证。

比如特斯拉自动驾驶,客户和高管总想要时间表:什么时候能在所有条件下工作?
但你作为产品负责人,你无法承诺模型在新城市的泛化能力,无法承诺会出现什么边缘情况。

你能做的是每周跑成千上万的微型实验,然后根据结果调整判断。
路线图从合同变成了假设。

7、用户体验不再为王。
传统产品里,用户体验驱动采用率。但在AI产品里,再好的界面也救不了一个糟糕的模型。

Google Photos的搜索功能界面很简洁,但如果AI无法准确识别人脸或物体,再漂亮的界面也没用。

TikTok和Instagram的竞争也说明了这个问题。
Instagram很快复制了TikTok的功能:短视频、无限下滑、创作者工具。
但TikTok的秘密武器不是功能,而是更好的推荐算法。

能平齐没用,模型差距才是关键。

Rupesh说:功能老化得很慢,模型老化得很快。你的竞争对手可能不是用更好的界面打败你,而是用更好的模型。

8、信任成为核心产品能力。
传统产品把隐私当合规清单,但AI产品依赖数据,隐私、安全、偏差消除对于建立信任至关重要。

苹果Siri和Google助手的竞争就是例子。
苹果选择了设备端处理,把隐私变成了竞争优势。
Google可能模型更好,但苹果把隐私定位为核心价值:你的数据留在你的设备上。
这让隐私从合规负担变成了产品差异化因素。

回到开头的问题:为什么经验丰富的产品经理反而更容易在AI产品上踩坑?

因为经典规则假设的是确定性输出、客户驱动反馈、可预测时间线、功能优先思维。
而AI用概率性结果、数据驱动反馈、实验优先、动态模型行为取代了这一切。

Rupesh说,如果你能内化这些转变,你就能在AI时代自信地领导,而不是被动地反应。
适应最快的领导者将定义产品的下一个十年。
00
向度之桥
4天前
过去几周,有几家大型云服务商接连出现了宕机事故。
巧的是,这几家公司都在对外宣传自己大量使用AI生成代码。

有的说10%,有的说30%,最激进的甚至说到了50%,他们同时也强调自己非常重视代码质量。

那问题来了,这两件事之间有没有关联?

这个我不敢下定论,但Qodo公司的CEO Itamar Friedman在最近一场技术会议上分享了一组数据,看完之后我觉得这个问题值得好好聊聊。

你可能用过Claude Code,它有一个安全审查的prompt模板,两个月前在开发者圈子里挺火的。
表面上看,这个prompt写得很专业,开头就说你是一位资深安全工程师。

但如果你仔细往下读,会发现一行小字,大意是请忽略拒绝服务类的安全问题。

这就有意思了,你让AI帮你做安全审查,结果它根本不检查最常见的攻击类型之一。

这个例子说明,我们现在用AI写代码、用AI审代码,但整个过程可能比我们想象的要粗糙得多。

根据多份行业报告的综合数据,60%的开发者表示他们至少四分之一的代码是AI生成或AI辅助完成的。
更夸张的是,有15%的人说自己80%以上的代码都来自AI。

与此同时,82%到92%的开发者每周都在使用代码生成工具。
有人统计过,平均每个开发者手头有三个以上的AI编程工具,20%的人甚至用超过五个。

听起来效率非常高,确实在写代码这个环节,生产力提升了大约3倍。
5分钟调一次AI,就能产出过去几小时才能写完的代码量。

但问题也在这里浮出水面。

调研显示,用AI之后,开发者完成的任务数量增加了20%左右,打开的PR数量增加了接近100%,但代码审查的时间也相应增加了90%。

因为代码量暴增了,而每行代码里的bug数量并没有减少。
换句话说,总bug数跟着代码量一起涨了上去。

具体来说,42%的开发者报告他们花在修bug上的时间反而增加了,35%的项目出现了延期。
另一份报告甚至发现安全事件数量增加了3倍。

这个逻辑是通的。
代码量涨3倍,安全事件也涨3倍,说明单位代码的问题密度并没有改善。

调研中有一个问题问得很直接,你对AI生成的代码有多担心?
67%的开发者表示有严重的质量顾虑。

他们的核心困惑是,到底该怎么衡量AI代码的质量?没有框架,没有标准,全凭感觉。

传统软件开发有成熟的CI/CD流程、测试覆盖率指标、代码审查规范。
但AI代码的质量衡量体系还在空白阶段,大家用着新工具,却沿用旧的质量检测方式,自然会心里没底。

很多人用Cursor或者Copilot的时候会设置规则,比如不要写嵌套的if语句,要遵循某种代码风格,这些规则被遵守的情况怎么样?
答案是部分遵守。

调研数据显示,大多数人的反馈集中在基本遵守和大部分遵守这两个选项上,很少有人说完全遵守。
这意味着你以为AI按你的标准在干活,实际上它只是差不多在干活。

问题讲了这么多,有没有解法?
Friedman分享了几个有意思的发现。

第一个是测试。
调研发现,当开发者大量使用AI来做测试的时候,他们对AI生成代码的信任度会翻倍。
测试本质上是一种验证机制,它让质量变得可见了。

第二个是代码审查。
使用AI代码审查工具的开发者报告质量提升了一倍,同时写代码的效率还额外提高了47%。

好的审查工具会在你提交PR的时候就拦住问题,比如自动检查测试覆盖率是否达标,这相当于把质量门槛前置了。

第三个是上下文。
80%的开发者说他们不信任AI代码的原因是觉得AI拿到的上下文不够。
当被问到最希望改进什么的时候,33%的人把上下文排在第一位。

这一点很关键,AI的输出质量很大程度上取决于它拿到了什么信息。
如果它只看到当前文件的代码,不知道项目的整体架构、历史PR记录、团队的编码规范,那它生成的代码自然容易出问题。

Friedman用了一个很形象的模型来描述AI编程的演进。
第一阶段是普通的代码生成,比如自动补全。
这里有一个生产力天花板,你投入再多也很难突破。

第二阶段是智能体代码生成,比如让AI帮你完成一整个功能模块。
天花板更高了,但还是存在。

第三阶段是把AI用在整个软件开发生命周期里,不只是写代码,还包括质量检测、规范落地、持续学习。
这时候才有可能真正突破天花板。

他的核心观点是,AI是工具不是方案。
你不能指望买了一把更好的锤子就能盖出更好的房子,你需要的是一整套建造体系。

最后说一个可能让很多人不太舒服的结论:那些宣传10倍效率提升的说法,大概率是营销话术。

根据多份报告的实际数据,在整个软件开发周期里,真实的效率提升可能就是2倍左右,而且这还得是你认真投入了质量管理的情况下。
关键是你得知道这2倍从哪里来,以及代价是什么。

代价就是,你需要花同样的精力去投资质量体系,否则AI帮你写得越快,你后面填的坑就越多。
质量不是AI能帮你省掉的东西,它恰恰是你在AI时代的竞争优势。
01
向度之桥
4天前
最近有个词叫Vibe Engineering火了,但这个词其实是从Vibe Coding演变来的。

Vibe Coding你知道,就是那种跟着感觉走、让AI帮你写代码的方式。

但Vibe Engineering不太一样,它更像是一种工程思维的升级。

我解释一下这两者的区别。

Vibe Coding的定义是Andrej Karpathy大神提出来的,大概是说:你完全沉浸在一种氛围里,忘掉代码的存在,让AI帮你搞定一切。不用管代码对不对,能跑就行。

换句话说,就是把代码当成一个黑盒子,你只管提需求,AI负责实现。

这种方式对于做个人小项目、快速验证想法,确实很爽。
但问题来了:如果你是个专业程序员,要做的是真正上线的产品,这套方法就不够用了。

而Vibe Engineering就是为了解决这个问题。
它的核心不是放弃专业技能,而是换一种方式使用专业技能。

具体来说有这么几步👇
第一步,建立上下文。
这是整个流程里最关键的环节,在你让AI写任何代码之前,先把项目的背景、约束条件、技术栈、代码规范全部准备好。
有的人会专门写一个详细的文档,放在项目根目录下,让AI每次都能读取到这些信息。

AI再聪明,它也不知道你的项目有什么特殊要求。
你不告诉它,它就会按自己的理解来,写出来的代码可能跟你现有的风格完全不搭。

第二步,边审边改。
这跟Vibe Coding最大的区别就在这里。Vibe Coding是看都不看就接受,Vibe Engineering是每一段代码都要过一遍眼。

不是说要逐行检查,而是要判断这段代码有没有明显的问题,架构合不合理,有没有安全漏洞。
如果发现不对,马上让AI重写或者自己动手改。

第三步,知道什么时候该停。
这一点特别重要,很多程序员有一种本能,就是看到代码就想优化。明明功能已经实现了,非要把它改得更优雅。

LLM根本不在乎重复代码,它不会因为你写了三遍类似的逻辑就觉得难受。

在AI时代,判断代码够不够用比判断代码够不够优雅更重要。
能跑、没bug、性能达标,就可以往下走了。

追求完美是工程师的美德,但在实际项目里,够用就是最好的。

说完方法论,再说说大家最关心的问题:AI会不会抢程序员的饭碗?
会,但可能跟你想的不一样。

一个趋势是,初级岗位正在被压缩。
以前公司会招一些实习生或者初级工程师做基础工作,现在这些工作可以让AI来做,所以进入这个行业的门槛反而变高了。

但高级岗位依然稳固。
举个例子,历史上薪资最高的工程师,往往是那些维护古老系统的人。

有一家叫Cobalt Cowboys的公司,专门做Cobol语言的维护,他们的工程师都是七八十岁的老爷子,因为只有他们懂这些上世纪的系统是怎么运作的。

未来也会是这样,当大家都在用AI写新代码的时候,能维护老代码、能解决AI搞不定的问题的人,反而会变得更值钱。

这就引出了一个更本质的问题:在AI时代,什么才是程序员的核心竞争力?
我觉得可以从两个维度来看。

第一个维度是判断力。
AI可以写出代码,但它不知道这段代码该不该写。

什么功能应该做,什么功能不应该做,什么时候该优化,什么时候该放过。
这些判断需要经验,需要对业务的理解,需要对用户的洞察。

第二个维度是系统思维。
AI擅长解决局部问题,但它很难把握整个系统的架构。当你的项目规模变大,模块之间的依赖变复杂,AI就很容易写出看起来能用但实际上埋了坑的代码。

如果你让AI实现一个功能,它可能会选择最简单的方案,但这个方案会不会影响系统的可扩展性?会不会在某个边界条件下出问题?
这些AI想不到,需要人来把关。

所以,与其担心被AI取代,不如想想怎么跟AI配合。

对于已经入行的程序员来说,心态的转变可能比技能的提升更重要。
接受AI是工具,而不是威胁,学会用它来放大自己的能力,而不是抗拒它。

真正不可替代的,是那些AI读不懂的东西。
你的经验、你的判断、你对问题的理解方式,这些才是护城河。

从Vibe Coding到Vibe Engineering,本质上是从被动使用工具变成主动驾驭工具。
工具会越来越强,但驾驭工具的能力永远稀缺。
00
向度之桥
4天前
你有没有注意,尽管这两年AI产品层出不穷,但真正留在你手机里、每天都在用的,好像还是ChatGPT这些通用大模型?

那些曾经让你眼前一亮的AI修图、AI配音、AI视频工具,下载之后用了几次,现在是不是已经找不到了?

这不是你的问题,是整个行业的问题。
顶级风投Goodwater Capital的联合创始人Chi-Hua Chien前几天在TechCrunch的活动上说了一句话:现在的AI消费品,就像2008年iPhone刚出来时的手电筒App。

2008年iPhone问世的时候,手电筒是最热门的第三方应用之一,当时很多人下载,觉得特别方便。
但后来苹果直接把这个功能内置到系统里了,那些做手电筒App的创业公司,瞬间就没了存在价值。

同样的事情正在AI领域重演。
你做出一个很酷的功能,比如AI生成视频、AI修复老照片、AI变声。

然后大厂看到了,觉得不错。 OpenAI发布Sora,中国公司开源视频模型,谷歌把各种能力塞进Gemini。

然后,你的护城河消失了。
用户为什么要用你的App,而不是直接用ChatGPT或者Gemini呢?

这就是为什么三年过去了,大多数AI创业公司还是在做To B的生意。
不是他们不想做消费品,是消费品太难守住了。

Chien说现在的AI,大概相当于2009到2010年的移动互联网。那个时候智能手机刚开始普及,大家都在摸索,不知道手机到底能干什么。
结果两三年之后,Uber和Airbnb横空出世,彻底改变了出行和住宿行业。

换句话说,平台需要一段稳定期,才能长出真正有生命力的产品。

Scribble Ventures的创始人Elizabeth Weil有个说法我很喜欢,她说现在的消费级AI处于一个尴尬的青春期。不上不下,还没长开。

那问题来了,什么时候能长开?
两位投资人不约而同地指向了同一个方向:可能需要一个新设备。

Chien说,你每天拿起手机大概500次,但手机能看到的东西,只占你生活的3%到5%。这么一个东西,怎么可能充分发挥AI的能力呢?

AI最大的潜力在于理解你的全部生活场景,然后给出个性化的建议。
但手机做不到这一点,你不可能24小时举着手机让它看你在干什么。

Weil她举着自己的iPhone对观众说:我不认为五年后我们还会围绕这个东西来设计产品。

现在各家公司都在探索新的形态。
OpenAI和苹果前设计总监Jony Ive据说在做一个无屏幕的口袋设备,Meta的雷朋智能眼镜配了一个能识别手势的腕带,还有各种AI胸针、AI吊坠、AI戒指,虽然目前效果都不太理想。

不过也不是所有AI消费品都必须等新设备。
Chien提了一个他看好的方向:个人AI财务顾问。
这种产品不需要环境感知,只需要深度理解你的财务状况和目标,然后给出定制化建议,手机完全能做。

Weil则看好AI家教,一个全天候在线、完全根据你的学习进度调整的私人导师。这个同样可以在手机上实现,而且需求非常刚性。

我觉得这两个方向有一个共同点:它们都是在解决一个足够具体、足够痛的问题。

最后说一个有意思的事。
现在有一批AI创业公司在做AI社交网络,他们的思路是让大量AI机器人和用户互动,这样用户永远不会缺人聊天、永远有人给你的内容点赞。

Chien对此很怀疑。他说这等于把社交变成了单人游戏。人们喜欢社交网络,本质上是因为知道屏幕那头是真人。
如果都是AI,那还有什么意义?

这个观点其实触及了一个更深的问题:AI到底是应该取代人,还是增强人?
我倾向于后者,那些真正能活下来的AI消费品,大概率不是要帮你逃避真实世界,而是要帮你更好地生活在真实世界里。

我们可能还要再等两三年,才能看到AI时代的Uber和Airbnb。
00
向度之桥
4天前
最近,有个叫Manthan Gupta的开发者,他干了一件事:逆向工程拆解了Claude的记忆系统。

他之前已经拆过ChatGPT了,这次轮到Claude,结果他发现,这两个AI处理记忆的方式完全不一样。

这事儿挺值得聊聊的,因为它不光是个技术问题,背后还藏着两种截然不同的产品设计思路。

先说说什么叫AI的记忆,就像你跟一个朋友聊天,你告诉他你最近在学Python,下次见面他可能会问你学得怎么样了,这就是记忆。

但AI不一样,AI每次对话理论上都是从零开始的,它没有真正意义上的大脑来存储信息。
那它怎么记住你是谁、你喜欢什么呢?

这就涉及到一个核心问题:AI的记忆系统是怎么设计的。
Manthan用了一个很简单的方法来研究这件事,他直接问AI自己是怎么工作的,然后通过多轮对话、交叉验证、实际测试来确认答案的可靠性。

先说ChatGPT的方案。

ChatGPT用的是一种叫预计算摘要的方式。
简单说就是,每次你跟它对话结束后,系统会在后台把这次对话的要点总结成一段话,然后存起来。
下次你再来聊天的时候,这些摘要会被塞进提示词里,AI就能知道你之前聊过什么了。

这个方案的好处很明显:每次对话都会自动带上之前的记忆,不需要AI主动去找。

但缺点也很明显:摘要毕竟是压缩过的信息,很多细节都丢了。
而且不管这次对话需不需要之前的信息,系统都会把摘要塞进去,多少有点浪费。

Claude走的是完全不同的路子。

根据Manthan的研究,Claude的上下文结构是这样的:
第一层是系统提示词,这个是固定的,定义了AI的基本行为规则。
第二层是用户记忆。这里存的是关于你的一些稳定信息,比如你的名字、你的职业、你的偏好。这些信息会用一种类似XML的格式注入到提示词里。
第三层是对话历史,就是当前这次对话的完整记录。
第四层是你当前发送的消息。

到这里为止,其实跟ChatGPT差不多,但关键的区别在于Claude怎么处理历史对话。
Claude有两个专门的工具:一个叫conversation_search,可以按关键词搜索历史对话;另一个叫recent_chats,可以按时间查看最近的对话。

重点是,这两个工具不是每次都会被调用的,只有当Claude判断当前对话需要历史信息的时候,它才会主动去查。

换句话说,ChatGPT是把小抄提前塞给你,Claude是让你需要的时候自己去翻笔记本。

说到这里,可能有人会问:哪种方式更好?
答案是,没有绝对的好坏,只有取舍。

就像人的工作记忆是有限的,同一时间能处理的信息块大概就那么几个。
AI也是一样,它的上下文窗口就那么大,塞太多东西进去反而会影响效果。

ChatGPT的方案选择了连续性,每次对话都会自动带上之前的记忆,用户体验更顺滑,不会出现AI突然忘了你是谁的情况。
Claude的方案选择了深度。因为不是每次都把历史信息塞进去,所以当真正需要的时候,可以调取更详细的原始对话,而不是被压缩过的摘要。

这让我想起产品设计里的一个经典权衡:推送还是拉取。
推送模式是系统主动把信息推给你,优点是及时,缺点是可能推了一堆你不需要的东西。
拉取模式是你需要的时候自己去找,优点是精准,缺点是可能错过一些本来有用的信息。
ChatGPT选了推送,Claude选了拉取。

具体到使用场景,这个差异会产生一些实际影响。
如果你经常需要AI记住你之前说过的话,而且这些信息比较稳定,比如你的职业、你的项目、你的偏好,那两个系统表现差不多,因为这些都会被存进长期记忆。

但如果你需要AI回忆某次具体对话的细节,比如上周讨论的那个技术方案具体是怎么说的,Claude理论上能做得更好。
因为它可以去搜索原始对话,而不是看摘要。

当然,这里有个前提:Claude得意识到它需要去搜索。
如果它没意识到,那这个能力就浪费了。

这也是Manthan在文章里提到的一个潜在问题。
Claude的方案更灵活,但也更依赖AI自己的判断。判断准了,效果会更好;判断失误,可能反而不如ChatGPT的自动注入。

但工具本身没有好坏,关键是理解它的工作方式,然后用对地方。
这大概也是为什么Manthan要花时间做这个逆向工程研究。当我们越来越依赖AI工具的时候,理解它们的底层逻辑,就变成了一种必要的能力。
01
向度之桥
8天前
什么样的工作,才不会被AI取代?

我身边好几个程序员朋友,都在焦虑同一件事:我的工作还能干几年?

光是今年,全球科技行业就裁掉了超过10万人。
亚马逊砍了1.4万个岗位,Duolingo直接用AI替换了一批人工翻译,英国有六分之一的雇主明确表示明年会因为AI减少招聘。

最先被砍的都是初级岗位。职场这个梯子,第一级台阶正在塌陷。

那么,如果入门级的工作都消失了,那刚毕业的年轻人怎么办?
我们这些已经工作几年的人,又该往哪走?

带着这些疑问,我最近翻了一些资料和访谈,想了解一下,那些真正在建造AI工具的人是怎么看这件事的。

英国企业家Daniel Priestley曾经说过:现在既是最好的时代,也是最难的时代。钱比以前多,机会比以前多,触达全球市场的速度比以前快。

而我们的教育体系却还停留在工业时代,花了十几年时间把人培养成工厂和办公室需要的样子。
问题是,那些工厂和办公室已经不太存在了。

我们花了十几年学习如何做功能性工作,而这些工作现在可以被自动化、被外包,而且速度更快、成本更低。

所以现在真正的问题已经不是你有没有学历了。
真正的问题是:你到底能不能端到端地解决一个复杂问题?
或者是,你能不能用AI工具把产出放大十倍?
如果答案是不能,那确实需要担心。

很多人经常问,AI会取代什么职业,期待听到的答案可能是程序员、设计师、文案策划等等。
但现实比这复杂得多,也吓人得多。

Perplexity的CEO讲了一个真实的故事,他让AI分析自己的投资组合,然后问它:我应该解雇我的理财顾问吗?
AI给了一个非常肯定的回答:是的,你应该立刻这么做。
AI不仅给出了建议,还直接帮他做了一套重新配置资产的完整方案。

当然,如果你的理财顾问只是帮你挑几只公募基金,那AI确实可以取代他。
但如果你的顾问能帮你拿到一般人接触不到的私募股权、对冲基金、早期投资机会呢?那他依然非常有价值。

同样的逻辑适用于其他领域。
一个只会套模板的律师,很容易被取代。
但一个能谈判、能做策略、能和客户建立深度信任的律师,价值反而在上升。

AI不是在消灭整个行业,而是在消灭那些太基础的岗位。

说完大趋势,来聊聊如果你已经有工作该怎么办。

一位CEO说:AI会拿走那些重复性的、功能性的、让人烦躁的工作。人类要往上走,去做更高价值的事情。如果你不愿意往上走,我没有太多办法帮你。
公司在快速前进,你要么跟上,要么找别的路。

不是AI取代你,是你不进化的话会被取代。

大厂现在的做法很有意思,很多公司开始要求员工在申请增加人手之前,先想清楚能不能用AI解决问题。

如果你的公司里有人说我不想用AI,那基本上等于在说我不想让公司成功,因为竞争对手全都在用。

那么,到底什么能力是AI时代的硬通货?
和很多人的直觉不同,答案不是某个具体技能,而是三个方向。

1、AI使用的流畅度。
不是说你要会写代码或者训练模型,而是你要比90%的同行更会用这些工具,能用AI把原来30分钟的事情压缩到5分钟,这就是竞争力。

2、跨领域能力。
Replit的创始人讲了一个观点,工业革命之前,最被记住的人往往是什么都懂一点的通才,比如达芬奇,又是工程师又是艺术家。
但工业革命把人变成了机器的零件,每个人只负责流水线上的一个环节。

AI时代,很有可能会让我们回到那个通才更吃香的状态,组合能力才是真正的稀缺资源。

3、个人品牌。

AI时代内容会爆炸式增长,新品牌想要被看见会越来越难。
但如果你已经有了两千到两万个真正认识你、信任你的人,这就是一笔巨大的资产。

接下来,这个月你就可以开始做三件事。

第一,学会和AI一起工作。
把你每周重复的任务列出来,用ChatGPT、Perplexity、Claude去建立工作流。目标是在30天内把三到五件事的耗时砍掉一半。
然后把这件事写进简历:用AI工作流将某某任务效率提升50%。

第二,在一个领域深耕一年,然后扩展。
选一个方向,用一整年去啃最难的部分,上课、做项目、产出可展示的成果。
之后再加一个相邻技能,从做事的人变成推动业务的人的关键路径。

第三,建立一个小而真实的个人品牌。
不需要追求百万粉丝,找到两千到两万个知道你在干什么的人就够了,每周分享你的学习、实验、数据。
记录旅程,而不是等到准备好。

未来的工作不是人类对抗AI,而是人类加上AI。
你只需要开始用这些工具,开始往更高价值的方向移动,开始让别人知道你是谁。
00
向度之桥
9天前
今天看到智能涌现发的一篇报道,在DeepSeek冲击之后,百川智能的ToB业务解散,全面收拢至C端AI医疗。

之前负责百川ToB业务的前高管选择出走创业。
这个人叫邓江,百川智能商业合伙人、商业化业务副总裁。
他曾在中国农业银行总行任职,后来辗转长安新生、中关村科金,2024年初被王小川挖到百川,一手搭建起金融事业群。

离开百川后,邓江成立了一家叫"缘启智慧"的公司。
但他没有回到熟悉的金融领域,而是继续做AI医疗。

这看起来像是一次复刻,但实际上,却是一次分道扬镳。

在技术路线上,百川押注纯文本大模型,邓江选择多模态;在商业模式上,百川聚焦ToC,邓江拥抱ToB。
同一个赛道,两个方向,谁能跑出来?

其实很多人其实不理解邓江的选择,一个金融背景的人,既不是医学专家,也没有临床经验,凭什么做AI医疗?
邓江的回答是:大家对医疗的理解有偏差。

医疗不等于医院,也不等于医生,它本质上是一套知识体系,这套知识体系的应用场景远比大家想象的要广泛。
买保险需要健康咨询,理赔需要核保审核,银行养老金融需要健康管理,医美机构需要专业建议,体检中心需要报告解读。

这些场景有一个共同特点:都需要医疗知识,但都不在医院里发生。

邓江在百川的一年多,做的就是这件事。
他带着团队给保险公司推健康咨询和理赔核保方案,给银行落地养老金融场景。
这些业务听起来是金融,骨子里却是医疗。

用他的话说,做金融是为了做医疗。

成果也很明显,在整个大模型行业商业化举步维艰的2024年,百川的ToB业务反而成了公司的营收核心。
不管是合同金额还是客户合作意愿,都证明了AI医疗在泛健康场景的商业化潜力,这给了邓江巨大的信心。

他亲眼看到市场对新技术的接受程度,亲手跑通了商业闭环。
所以当他决定离开百川时,选择继续做AI医疗几乎是顺理成章的事。

但邓江不想简单复制百川的路径。
他离开的核心原因是:想按照自己的想法选择技术路径。

在他看来,医疗问题一定是"望闻问切"的,是多模态的,无法只通过文字描述清楚。

打个比方,你用语言描述一幅世界名画给别人听,听众脑海中还原出的画面一定和原作相去甚远。语言是描述世界的好载体,但信息衰减是不可避免的。

线上问诊和面诊的区别也是一样。
面诊时医生能看到你的面色、精神状态、走路姿势,这些都是语言无法传递的信息。
所以邓江坚信,真正要解决医疗问题,必须走多模态路线。

公司成立半年,他们基于四五款国产大尺寸多模态模型做强化训练,搞出了自己的底层医疗循证模型。
11月发布的商业化产品MentX,在国际权威的医学多模态推理评测集MedXpertQA上拿下了全球第二、中国第一的成绩。

邓江说,MentX回答真实常见医疗问题的准确率达到了95%,处于国内第一梯队。

更重要的是,这个模型能处理跨科室、跨模态的复杂医疗决策。
一份体检报告里同时包含CT、X光片、心电图和各种检测数据,MentX可以一并解读,而不需要拆成好几个专业小模型分别处理。

在商业模式上,邓江也走了一条和百川相反的路。
百川选择ToC,邓江押注ToB。

原因很现实,他认为现阶段更高质量的医疗多模态数据,还是在B端而不是C端。

一个普通患者在家拍照上传,能拍出什么质量的医学影像?但如果是医美机构的专业销售,可以指导用户从特定角度拍摄眼角、法令纹,数据质量完全不一样。
B端的专业人员相当于帮创业公司做了一道输入端的筛选。

这种"2B2C"的模式,让缘启智慧可以借助产业链公司的力量,积累高质量数据,同时帮助这些公司实现更智能的ToC服务。

更深层的原因是技术独立性。
邓江举了个例子:某大厂投资了爱康和美年,如果你是一家体检机构,你愿意跟这家大厂合作吗?

大厂的生态做得很深是优势,但也是劣势。它们无法保障技术独立性,因为它们和客户在某些场景上存在深度竞争。

这就像华为宣布不造车,它的技术才能被更广泛的车厂使用。
独立的技术公司,在任何行业、任何时代都有自己的生存空间。

公司成立仅三个月,邓江已经签下了三份商业化合同。

当然,质疑声从未停止。
有投资人问:你拿什么和大厂竞争?
邓江的回答是:聚焦复杂场景。

简单的症状咨询和轻问诊,门槛确实不高,大厂随便做做就行。但复杂的医疗决策完全是另一回事。
一份体检报告,十几种指标,再加上CT、X光片、心电图等医学影像,要把诊断做准了,本身就是非常难的事。

"真实医疗场景中,复杂决策才有真正的价值。"邓江说,"我们不做医疗问答ChatBot,不做简单的症状咨询,我们聚焦的是需要结合不同模态医学影像、跨科室的复杂医疗决策场景。"

马斯克的无人驾驶技术路径是公开的,他告诉全世界纯视觉就能实现自动驾驶,但又有多少人真正做出来了?
技术路径的选择,说起来容易,做到是另一回事。

邓江预测,AI医疗的规模化落地时间点是2026年。
中国和美国在商业化落地上大概有半年到一年的差距,而美国已经开始跑通了。

OpenAI据说要在医疗健康领域投入250亿美金,国内豆包、蚂蚁也纷纷推出健康类产品。
大厂的布局,某种程度上反而验证了这个赛道的价值。

但邓江不觉得这是威胁。
"哪怕只做某一种病,都意味着巨大的市场空间。比如皮肤病,中国有上亿患者,把皮肤病做好,都足够立足了。"

他引用了一句话:真正有价值的东西,在早期一定是非共识的。当大家都形成共识,机会也就没了。
这句话,恰好也是王小川说过的。

师出同门,殊途同归,还是分道扬镳?
00
向度之桥
10天前
潘欣,这位前谷歌大脑(Google Deepmind)研究员,曾经推动过TensorFlow动态图模式开发,回国后辗转百度、腾讯、字节跳动,一路做到字节视觉大模型AI平台负责人。

2024年11月,他刚刚加入闪极科技做AI合伙人,负责智能眼镜项目。
没过多久,他又换了东家。

新东家就是美团。
入职之后,潘欣负责多模态AI创新工作,主导了LongCat App等多个应用的开发。

LongCat,也就是龙猫,是美团自研大模型的名字。

据了解,2025年美团在AI人才招聘上火力全开,重点方向是模型训练,招聘标准也相当高。

一家以外卖起家的公司,为什么突然对AI如此上头?

时间拨回到2025年初。
在那一年的一季度财报电话会上,王兴第一次公开聊起了美团的AI战略。
他的原话是,美团在AI技术上的战略定位是积极进攻,而非消极防御。

王兴给出了三个具体的层面:
第一层叫AI at work,简单说就是让AI成为全公司的生产力工具,从员工到运营,全部用上。
第二层叫AI in products,意思是用AI改造现有的2B和2C产品,同时孵化全新的AI原生应用。
第三层叫Building LLM,就是美团要自己训大模型,而且愿意砸真金白银的资本支出。

但计划总是赶不上变化,2025年第二季度,国内外卖市场突然打响了一场大战。
抖音、京东、小红书等平台纷纷入局,美团的基本盘受到了前所未有的挑战。

压力之下,美团不得不重新分配资源。
但美团并没有因为外卖大战而收缩AI投入,相反,它选择了另一条路:把有限的子弹集中在最核心的地方,也就是基座模型的训练。

基座模型你可以把它理解为AI能力的地基,只有地基打好了,上面才能盖各种各样的应用。
美团的逻辑很清晰:与其四处撒网做各种花里胡哨的AI应用,不如先把底层能力搞扎实。

对于一家正在打仗的公司来说,务实往往比酷炫更重要。

从2025年下半年开始,美团的AI发布节奏快得像在赶工期。
6月,发布首款AI编程产品Nocode。
9月,正式发布并开源首款大语言模型LongCat-Flash-Chat,同时推出推理模型LongCat-Flash-Thinking。
10月,发布视频生成模型LongCat-Video,同步开源。
11月,发布开源全模态模型LongCat-Flash-Omni。
12月,一口气发布三款图像模型,LongCat-Image、LongCat-Image-Dev、LongCat-Image-Edit。

半年时间,从语言模型到视觉、音频、视频,美团基本上把全模态基座能力搭建完毕。
这个速度,放在整个国内大模型赛道里也算得上激进。

有人可能会问,美团搞这些模型有什么用?又不是专门做AI的公司。
这个问题的答案,藏在美团的主营业务里。

10月,美团向餐饮商家推出了两款AI工具,一个叫袋鼠参谋,一个叫智能掌柜。
这两个工具面向行业所有商家免费开放。简单说,就是帮商家做经营决策、处理日常事务的AI助手。

类似的动作还在继续,目前美团金融线、客服线、电商线都在大力招聘AI应用人才,重点方向是后训练和商业化落地。

你看,逻辑闭环了。
先把基座能力建好,再把AI能力嵌入到每一个业务场景里。
外卖、酒旅、到店、金融,美团的每一块业务都是AI落地的天然试验田。

美团做AI,核心目的是让现有的业务变得更高效、更赚钱。
说白了,美团的AI不是为了上天,而是为了种地。

不过,美团的AI布局也不是没有调整。
在主线业务全面AI化的同时,美团对独立的AI To C应用探索明显收缩了。

此前美团做过一些独立的AI消费级应用,比如Wow、妙刷之类。这些应用独立于主线业务,属于纯粹的创新探索。
现在,这类尝试正在逐渐降温。

还有一个信号值得关注。
2023年,王兴的老朋友、美团联合创始人王慧文曾经创立了一家大模型公司叫光年之外。后来这家公司被美团收购,团队以GN06的名称继续运营。
据报道,今年11月,原光年之外负责人刘炯已经调任至美团,直接向美团平台负责人李树斌汇报。
与此同时,这个团队的招聘力度也在减少。

这意味着什么?
美团正在做减法,与其让AI团队四处开花,不如集中力量办大事。

所谓大事,就是让AI真正服务于美团的核心商业逻辑。

这种策略转变背后,有着清晰的商业考量。独立的AI应用赛道竞争激烈,美团并不具备先发优势。而在本地生活服务领域,美团有海量的商家资源、用户数据和应用场景。
把AI能力嫁接到这些场景上,性价比显然更高。

换句话说,美团不想成为下一个AI独角兽,它只想成为一个会用AI的超级平台。

回过头看美团这两年的AI战略,有一条主线贯穿始终:实用主义。

有人说,美团是一家没有边界的公司。从外卖到酒店,从打车到买菜,美团的触角伸向了本地生活的每一个角落。

但在AI这件事上,美团似乎非常清楚自己的边界在哪里。
它不追求技术上的遥遥领先,只追求业务上的贴地飞行。

某种程度上,这也是当下中国科技公司做AI的一个缩影。
在大模型赛道卷到极致的今天,越来越多的公司开始思考一个问题:AI能力到底是用来展示的,还是用来赚钱的?

王兴曾经说过一句话,大意是科技公司最大的壁垒不是技术本身,而是对业务的深刻理解。
现在看来,这句话同样适用于AI时代。

当外卖大战还在如火如荼的时候,美团已经在悄悄打另一场仗。这场仗没有补贴大战那么轰轰烈烈,但可能会决定美团未来十年的走向。

毕竟,能打赢今天的仗是本事,能看到明天的仗在哪里,才是真正的格局。
00