即刻App年轻人的同好社区
下载
App内打开
向度之桥
32关注524被关注0夸夸
讲点技术,讲点产品
产品总监&AI创新产品负责人
在 AI 和现实两个向度间搭建认知到落地的桥梁,让人与世界的连接更便捷。
置顶
向度之桥
4月前
AI编程+自动化交流群,欢迎一起交流~
00
向度之桥
4天前
最近刷到一个视频,作者是 Alex Finn,一个靠 AI 应用年入 30 万美金的独立开发者,同时也在运营自己的 Vibe Coding Academy。

他在 YouTube 上分享了一期关于 OpenClaw 的内容:如果你在用 OpenClaw,你现在就得把这件事做了。

这期视频讲的核心话题是 Mission Control,翻译过来就是任务控制台。

简单来说,就是在 OpenClaw 里面搭一个完全定制化的仪表盘,让你的 AI 代理不再只是一个聊天窗口,而是变成一个有组织、有记忆、有分工的数字工作系统。

我把整期视频看完,越看越觉得这个思路挺有意思。

Alex Finn 自己也说了,他没写一行代码,所有工具都是让 OpenClaw 自己造出来的,这一点确实让我有点意外。

1️⃣ 任务板:让你的 AI 代理不再是个黑箱

Alex Finn 在视频里提到的第一个工具就是任务板(Task Board)。这是一个看板式的界面,长得有点像项目管理工具 Linear 或者 Trello,每个任务卡片上标注了由谁负责,做到哪一步了。

他说很多人对 OpenClaw 最大的抱怨就是不知道它到底在干嘛,有没有把事情做完,还是做到一半就丢下了。

任务板就是解决这个透明度问题的。

左边有一个实时活动流,能看到代理每一步在做什么。

任务完成后会自动往右移动,需要人工审核的就停在审核栏等你确认。

他把任务板和 OpenClaw 的心跳机制挂钩了。

每次心跳的时候,代理会自动检查任务板上有没有分配给自己的新任务,然后自动去执行。

你只需要在任务板上建一个任务,剩下的事代理自己就搞定了。这个思路其实就是把传统项目管理的流程搬到了人机协作上。

2️⃣ 日历屏幕:你的代理说它会做,但它真的做了吗?

第二个工具是日历。

不过这个日历不是给人看日程的,而是用来监控 OpenClaw 的定时任务(也就是 cron jobs)。

Alex Finn 分享了一个很现实的问题:有些时候你跟 OpenClaw 说每天早上帮我做一件事,它回复说好的没问题,但实际上它根本没有真的去安排这个定时任务。

日历屏幕就是用来抓这种情况的,你可以一目了然地看到所有已经安排好的定时任务,如果发现少了某个任务,就可以立刻让代理去补上。

这个工具背后有一个很重要的理念,就是信任但要验证。

AI 代理现在还没到百分百可靠的地步,给它一个可视化的校验机制其实非常有必要。

用过 AI 代理的人应该都有这种感受:它有时候会很认真地告诉你它已经做了,但你仔细一查,啥也没发生。

3️⃣ 记忆屏幕和文档屏幕:给 AI 代理装上外脑

记忆屏幕和文档屏幕我放在一起聊,因为它们解决的是同一类问题,就是信息散落在各处找不到。

OpenClaw 本身有一个很强的记忆系统,它会记住你们所有对话内容。

但问题是这些记忆通常存在一个乱糟糟的 markdown 文件里,想找什么东西基本靠翻。

记忆屏幕把这些内容按天整理好,就像一本数字日记,你可以很方便地回顾某一天聊了什么、做了什么决定。

Alex Finn 甚至说他期待十年后回头翻看这些记忆,简直就是一部个人数字生活的编年史。

文档屏幕也是类似的逻辑。

OpenClaw 会帮你写各种文档,产品需求文档、架构设计、周报、甚至 newsletter 初稿。

但这些东西通常就丢在聊天记录里,想找回来得翻好久。文档屏幕把所有生成过的文档集中管理,支持搜索和自动分类。

Alex Finn 每周四让 OpenClaw 帮他写 newsletter 草稿,然后直接去文档屏幕找出来复制到 Substack 里编辑发布,整个流程特别顺滑。

4️⃣ 团队屏幕与使命宣言:把 AI 代理当公司来管

这是我个人觉得最有想象力的一个工具。

团队屏幕展示了所有代理的组织架构,谁是主代理、谁是子代理、各自负责什么、跑在哪台设备上。

Alex Finn 给他的代理团队设定了一个使命宣言,大意是建立一个 7×24 小时自主运作、持续产出价值的 AI 代理组织。

所有代理在空闲的时候,都可以围绕这个使命去思考接下来该做什么。

他会用反向提示问代理:根据我们的使命宣言,现在做什么任务最能推进目标?

这个思路其实已经超越了把 AI 当工具用的阶段,更像是在经营一个由 AI 组成的小团队。

每个代理有明确角色,有共同目标,有协作机制。虽然听起来有点科幻,但 Alex Finn 确实在视频里演示了这套系统在运作。

Alex Finn 特别强调了一件事,他说你不要照抄我的设置。

他给出的建议是用反向提示。

在搭好基础的 Mission Control 之后,直接问你的 OpenClaw:根据你对我的了解,我们的工作习惯和目标,你觉得还应该造哪些工具?让代理来帮你想,而不是你自己硬憋。这个方法可能比任何教程都管用,因为它真正做到了个性化。

从这个视频能看到一个越来越清晰的趋势:AI 代理正在从单次对话工具演变成长期运行的数字协作者。

它们需要被管理、被监督、被赋予目标,就像管理一个远程团队一样。

Mission Control 这种思路,本质上就是在搭建人和 AI 之间的协作基础设施。
05
向度之桥
4天前
最近在 Latent Space 上读到一篇挺有意思的文章,作者叫 Ankit Jain,是开发者工具公司 Aviator 的创始人兼 CEO。

他在文章里抛出了一个相当大胆的观点:代码审查(Code Review)这个东西,可能该被淘汰了。

听起来是不是有点离谱?我第一反应也是这样,毕竟 Code Review 几乎是每个工程团队的标配流程,你要跟人说咱们别审代码了,估计会被当场拍桌子。

但我花了大概半小时仔细读完全文之后,发现他说的很多点确实戳到了痛处,是有数据、有逻辑、有替代方案的系统性思考。

当然,我并不是完全同意作者的观点,但这个话题值得讨论。

1️⃣ 人类根本读不过来了

Ankit 引用了一份来自 Faros 的数据,覆盖了超过一万名开发者和一千多个团队。

结果显示:AI采用率高的团队,任务完成量多了21%,合并的PR多了98%。

但与此同时,PR审查时间暴涨了91%。

代码产量翻倍了,审查时间也翻倍了。

开发者们自己也反馈,审查AI生成的代码比审查同事写的代码更费劲。

这其实很好理解,同事写的代码你多少能猜到思路,AI写的东西有时候逻辑跳跃挺大,读起来就是累。

Ankit 指出,很多团队其实早就在偷偷摸摸地橡皮图章了。PR挂在那里好几天没人看,最后随便扫一眼就批了,这在行业里根本不是秘密。

代码审查在很多时候已经名存实亡了。

2️⃣ AI审查AI的代码,这事儿有点荒谬

那用AI来做代码审查呢?

市面上确实冒出了不少这类工具。, Ankit 的看法是,这只是在拖延时间。

你想啊,如果代码是AI写的,审查也是AI做的,那中间摆一个审查界面给人看,意义在哪里?

他说得很直白:当代码是 agent 写的时候,所谓的新鲜视角不过是另一个有着相同盲区的 agent。

这些AI审查工具最终会被整合到开发流程的更早期,而不是留在PR这个环节。

3️⃣ 审查规格说明,而不是审查代码

这是整篇文章最核心的主张。

Ankit 认为人类的检查点应该从下游挪到上游。

别去读500行的代码 diff 了,去审查 Spec、计划、约束条件和验收标准。

换句话说,代码变成了 Spec 的产物。就像你不需要亲自去检查工厂流水线上的每一个零件,但你需要确保设计图纸是对的。

人类最有价值的判断应该发生在第一行代码生成之前,而不是之后。

他还提到了行为驱动开发(BDD)这个概念。

BDD 的思路是用自然语言写需求规格,然后把这些规格自动化成测试。

以前大家觉得这是额外工作量,但在AI时代,Spec 本身就是最重要的产出物。

你写清楚了验收条件,agent 去实现,BDD 框架去验证,你根本不用看实现代码。

4️⃣ 用瑞士奶酪模型构建多层信任

不审查代码的话,怎么保证质量?

Ankit 借用了风险管理中的瑞士奶酪模型来回答这个问题。每一层防护都可能有漏洞,但你把多层叠在一起,漏洞就很难同时对齐。

他提出了五个层次。

第一层是让多个 agent 独立完成同一个任务,然后挑最好的方案,用竞争制造信号。

第二层是确定性护栏,也就是测试、类型检查、合约验证这些不带主观判断的硬指标。

第三层是人类定义验收标准,这就是前面说的BDD。

第四层是权限系统,严格限制 agent 能碰哪些文件、哪些模块,碰到敏感区域自动升级到人工审批。

第五层是对抗性验证,一个 agent 写代码,另一个 agent 专门来找茬,红蓝对抗但全程自动化。

这套思路本质上是把原来放在 Code Review 这一个环节的信任,分散到了整个开发流程的多个节点上。

代码审查之所以被奉为圭臬,很大程度上是因为我们没有更好的替代方案。但现在情况变了。当代码的生产速度远远超过人类的阅读速度,硬撑着逐行审查其实是一种自我安慰。

Ankit 在文末总结得很到位:未来应该是快速发布、全面观测、更快回滚,而不是慢慢审查、照样漏掉bug、然后在生产环境里痛苦地调试。

当然了,完全放弃人工审查这件事短期内不太可能发生。

但把人类的注意力从读代码转移到定义规格和验收标准上,这个方向我觉得是对的。

毕竟我们最该做的事情不是和机器比谁读代码更快,而是确保机器在解决正确的问题。
00
向度之桥
4天前
今天刷到一条消息,直接把我看清醒了。

晚点 LatePost 报道了阿里 Qwen 团队的大变动。

林俊旸,那个带领 Qwen 开源模型杀出一条血路的技术负责人,在X上发了一句 me stepping down. bye my beloved qwen。

整个 AI 圈都炸了。

我觉得,这件事没有表面上那么简单。

它不只是一个人的去留问题,背后折射出的是大厂 AI 团队在高速发展期面临的一个根本矛盾:

技术理想和组织管理之间,到底怎么平衡?

1

很多人只注意到了林俊旸,但其实这波离职潮涉及的范围更广。

Qwen 的后训练负责人郁博文同一天也正式离职了,而 Qwen Code 负责人惠彬原早在今年 1 月就已经离开阿里去了 Meta。

这三个人有一个共同点:他们的第一份工作都在阿里,都是从校招进来的应届生,全程参与了 Qwen 模型从零到一的早期训练。

他们不是空降兵,是阿里自己一手带大的。

现在三个核心人物先后离开,对团队士气的冲击可想而知。据报道,有 Qwen 的同事得知消息后直接哭了。

接替郁博文的是从 DeepMind 加入的周浩,他在 Gemini 3.0 DeepResearch 等项目上有很深的积累。

从外部引入重量级人才当然不是坏事,但老兵离开、新人接棒这个过程中间的磨合期,往往是最脆弱的。

2

林俊旸为什么走?表面上看是因为通义实验室要把 Qwen 团队拆开。

原来 Qwen 是一个垂直整合的体系,预训练、后训练、多模态这些环节都在一个团队里闭环运转。

但现在阿里要把它拆成一个个独立的水平分工小团队,林俊旸的管理范围因此被缩小了。

不过更深层的矛盾在于:这种拆法跟林俊旸对技术趋势的判断是冲突的。

他一直认为预训练和后训练甚至 Infra 团队应该越绑越紧、越走越近,而不是各管各的。

从去年开始,Qwen 团队甚至已经在自建 Infra 能力了,就是不想在关键环节上受制于人。

那阿里为什么要拆呢?

因为 Qwen 越长越大,已经从一个模型团队变成了一个五脏俱全的小型 AI 实验室,做 VLA 具身模型、做文生图、做语音,跟通义实验室旗下其他团队的地盘开始重叠。

从管理者的视角来看,资源重复配置肯定是要优化的。但从技术执行者的角度看,你把一个打了胜仗的队伍拆散重编,代价可能比你以为的大得多。

3

Qwen 在全球开源社区的地位毋庸置疑。

Cursor 在用它做微调,一大票中国的具身智能公司拿它当基模,Hugging Face 上的下载量更是遥遥领先。

但问题是,开源越成功,阿里通过 API 直接卖模型赚钱的空间就越小。

这个张力一直都在。

而且据晚点的报道,阿里内部有高管对除夕夜发布的 Qwen-3.5 并不满意,觉得是个半成品。

与此同时,阿里云在 AI 云服务上被火山引擎追着打,千问 App 在春节补贴大战里也没能拉近和豆包的差距。

站在阿里集团的角度想想:技术影响力是好东西,但它不是目的,它得服务于卖云、做 App 这些实实在在的商业目标。

当技术团队的探索方向和公司的商业优先级没有完全对齐的时候,组织调整几乎是必然的。

只是这次调整的时机有点微妙,发生在 Qwen 外部口碑和内部士气都还不错的时候,而不是出了什么大问题之后。

4

拉开视野来看,不只是阿里在折腾。

字节的 Seed 团队内部搞赛马,同一方向多个团队同时跑;

豆包的主模型团队按预训练和后训练的流程来切分;

腾讯去年调整完之后反而走向了更加整合的路线,让姚顺雨一个人同时管模型训练和 Infra。

有人在拆,有人在合,根本没有所谓的最优解。

每家公司的选择取决于它当下面临的核心瓶颈是什么。

但有一点是共通的:频繁的组织变动对核心技术人才的消耗是巨大的。

林俊旸 1993 年出生,32 岁就做到了阿里最年轻的 P10,不是海归博士,完全是本土培养出来的技术领袖。

他走了之后在社交媒体上收到的那些反馈,来自 MiniMax、Unsloth、ollama 这些公司和社区,足以说明他在行业里的分量。

这样的人,走了就是走了,不是换一个组织架构图就能补回来的。

我最大的感受是:AI 行业进入了一个新阶段。

早期那种一小群人躲在角落里安安静静做模型的时代,在大厂里基本结束了。

AI 变成每家科技公司输不起的战略级战场,模型团队就不可避免地要面对更多来自组织层面的拉扯。

几个趋势可能会越来越明显:顶尖 AI 人才从大厂向创业公司和海外流动的速度会加快;大厂的 AI 团队架构还会继续调整,合了拆、拆了合;开源和商业化之间的平衡会变得更难把握。

林俊旸接下来会去哪?是创业还是加入另一家公司?Qwen 团队重组之后还能不能保持战斗力?2026 年的中国 AI 格局会因为这些变动发生什么变化?

这些问题现在都没有答案,但值得我们持续关注。
01
向度之桥
5天前
最近看了Artem Zhutov的一期视频,这位老兄是个技术博主,专门研究AI工具和知识管理。

他花了一周时间,用Claude Code处理了711个会话,然后把整个工作流程可视化成了一张知识图谱。

每个节点都是一次对话,每条连线都是AI触碰过的文件。看起来就像是把大脑的神经网络搬到了屏幕上。

这期视频的核心话题是AI助手的记忆问题。

你可能也遇到过,今天和Claude聊得挺好,第二天打开新对话,它就像个陌生人一样,完全不记得昨天讨论过什么。

更麻烦的是,它也搜不到你上周在另一个项目里做的决策。

这种断层式的工作体验,说实话挺让人抓狂的。

我看完这个视频最大的感受是,原来这个问题早就有解决方案了,只是很多人不知道而已。

Artem用一个叫QMD的本地搜索引擎,把所有AI对话变成了可检索的记忆库。而且检索速度快到夸张,0.3秒就能找到上周的决策记录。

相比之下,传统的文件搜索方法可能要花3分钟,还不一定找得准。

今天我把视频里最重要的几个技术点整理出来,和大家聊聊AI记忆系统到底是怎么回事。

1️⃣ 传统搜索为什么不管用:暴力检索的代价

Artem在视频里做了个实验,让Claude用传统方法搜索关于NotebookLM的所有文件。

结果AI花了整整3分钟,读取了300个文件,最后给出的结果还不如QMD的即时搜索精准。

这里的问题在于,传统的grep搜索就像是拿着放大镜一个字一个字地扫描每个文件。它必须打开所有可能相关的文档,逐行比对关键词。

当你的知识库有成百上千个文件时,这种暴力方法不仅慢得要命,还会产生大量无关信息。

更要命的是成本问题。

每次这样搜索,都要消耗大量token,相当于让AI重新读一遍整个图书馆。而QMD的做法完全不同,它会提前把文档建立索引,搜索时直接从索引里匹配,速度快了几十倍,成本也省了一大截。

对普通用户来说,这意味着你不用再盯着进度条发呆,也不用担心每次搜索都在烧钱。更重要的是,你可以保持专注,不会因为等待而跑去刷推特。

2️⃣ BM25和语义搜索:关键词之外的智能

QMD的核心技术是两种搜索方式的结合:BM25和语义搜索。听起来有点技术,但其实原理挺好理解的。

BM25是一种关键词匹配算法,比简单的grep聪明得多。

它会考虑词频、文档长度这些因素,给搜索结果打分排序。

比如你搜索睡眠相关的内容,它能快速找到所有提到睡眠质量、睡眠实验、睡眠中断的笔记。速度快,而且准确率不错。

但BM25的局限在于,它只认识字面意思。如果你的笔记里写的是今晚又失眠了,用睡眠这个关键词可能搜不到。这时候就需要语义搜索出马了。

语义搜索更像是一个理解人话的AI。

你问它找找我睡不着的时候,它能明白你在说失眠,然后去匹配那些表达类似意思的笔记。

3️⃣ 三种召回路径:时间、主题和可视化

Artem设计的记忆系统有三种召回方式,分别适合不同的使用场景。

第一种是时间路径。

比如你想知道昨天都干了啥,直接运行recall yesterday命令,AI就会把昨天所有的对话按时间线排列出来,包括每个会话讨论了什么、创建了哪些文件。这个功能特别适合项目交接或者定期回顾。

第二种是主题路径,这个我觉得是最实用的。

假设你今天要继续做知识图谱相关的项目,就运行recall topic graph,AI会自动搜索所有相关的对话和文件,然后加载到当前上下文里。

不到一分钟,你就能接上之前的工作进度,不用再重新解释项目背景。

第三种是图视图。

它把所有会话和文件用可视化的方式展现出来,每个节点代表一次对话或一个文件,连线表示它们之间的关系。

时间越近的会话,颜色越亮。你可以直观地看到哪些工作是相互关联的,哪些想法还没有落地。

这三种方式结合起来,基本上能覆盖你所有的记忆需求。

不管是想快速回顾过去,还是要深挖某个主题,或者想找到被遗忘的想法,都有对应的方法。

4️⃣ 从工具到系统:打造私人AI大脑

最让我觉得有价值的,是Artem把这整套东西变成了一个完整的记忆系统。他不只是用QMD搜索文件那么简单,而是设计了一整套工作流。

每次和Claude对话结束,系统会自动把会话内容导出成Markdown文件,存到Obsidian知识库里。

然后用钩子脚本自动把新对话嵌入到QMD索引中。

这样一来,所有的对话记录都会实时更新,随时可以被检索到。

而且这个系统是开源的,你可以根据自己的需求定制。

比如可以给不同类型的笔记建立独立的索引集合,每日笔记一个集合,工作会话一个集合,学习材料又是一个集合。

需要的时候,可以针对特定集合进行精准搜索。

Artem甚至还做了个OpenClaw工具,让你可以从手机或其他设备访问这个记忆系统。

不管你在哪儿,都能调用AI的完整记忆,而不是每次都从零开始。

AI工具的进化方向可能不只是模型本身变得更聪明,而是如何让AI更好地记住我们的上下文。

QMD这类工具的出现,让AI不再是一个健忘的助手,而是真正能够积累知识、理解历史的工作伙伴。

从技术层面看,这个趋势很明确了:关键词搜索会被语义理解逐步取代,本地化的记忆系统会变得越来越重要,可视化的知识管理会成为标配。

而对于普通用户来说,这意味着我们终于有机会把散落在各处的笔记、对话、想法统一管理起来,让它们真正发挥价值。
02
向度之桥
5天前
最近刷到 Nick Saraev 的一个视频,讲 Claude Skills 怎么帮他打理年利润400万美元的生意。

这哥们自己平时就是用这些技能管理公司的,看完这期视频我最大的感触是,大家对 AI 技能的理解可能有点跑偏了。

现在网上关于 Claude Skills 的演示确实挺多,但大部分都在炫技,什么智能助理啊、自动回邮件啊,看起来很酷,实际上离真正的商业价值还差得远。

Nick 在视频里直接点破了这个问题:很多人把 AI 技能当玩具,而不是当生产工具用。

他不光演示了自己在用的各种技能,还手把手教你怎么搭建这些系统。

今天我也想和大家聊聊,真正能赚钱的 AI 技能到底长什么样?

1️⃣ 技能不是个人助理,而是商业流程的自动化引擎

Nick 在视频开头就强调了一个核心观点:现在大多数 Claude Skills 的演示都聚焦在个人助理功能上,但这完全低估了它的潜力。

他的原话是,如果你只是用它来管理日程、回复邮件,那你正在把几百万的商业机会留在桌子上。

换句话说,技能的本质其实是把传统的 SOP(标准操作程序)翻译成 AI 能理解的语言。

以前你可能会给新员工一份清单,告诉他怎么跟进客户、怎么筛选邮件,现在你只需要把这套流程写成技能规范,AI 就能24小时不停地帮你干活。

Nick 展示了一个跟进销售线索的技能。

它会自动检查 CRM 系统里所有处于不同阶段的潜在客户,根据之前的邮件往来生成个性化的跟进消息。

关键是这些消息读起来就像真人写的,不会让人一眼看出是 AI 生成的。这套系统每天早上自动运行,销售团队只需要专注于开发新客户就行了。

对于普通创业者或者小团队来说,这个启发太大了。

你不需要雇一个全职的销售助理来做重复性工作,一个设计良好的技能就能搞定。

2️⃣ 技能会自我进化,不需要你操心维护

Nick 提到,Claude Skills 不是一次性写好就完事的脚本,它们会在运行过程中自我修复和优化。

比如说遇到 API 限制了,或者某个网站的结构变了,技能会自动识别问题,然后修改自己的代码来适应新情况。

这背后的逻辑其实很简单:技能本质上是用 Markdown 格式写的指令集,AI 在执行的时候如果发现哪里不对,它会根据错误信息去调整步骤。

就像一个聪明的员工,发现流程有漏洞会主动想办法补上,而不是傻乎乎地一直重复错误。

Nick 还特别强调了这种自我修复能力的价值。

传统的自动化工具,比如 Zapier 或者 Make,一旦某个环节出问题,整个流程就卡住了,你得手动去修。

但技能不一样,它们有容错能力,能在出错的时候自己找解决方案。

从技术角度看,这得益于大语言模型的推理能力。

模型不只是执行命令,它理解命令背后的意图,所以当环境变化时,它能灵活调整。

这对于需要长期运行的业务流程来说太重要了,你不可能24小时盯着系统看它有没有挂。

3️⃣ 真正值钱的技能都在前端业务上

Nick 在视频的后半段讲了一个非常重要的观点:别把精力浪费在后端系统的过度优化上,真正能带来收入的是前端业务流程的自动化,也就是销售、营销、客户获取这些环节。

他举了自己用的几个技能作为例子。

一个是 LinkedIn Sales Navigator 的潜在客户抓取工具,能根据你的需求自动找到符合条件的目标客户,连邮箱地址都给你挖出来。

另一个是冷邮件活动生成器,输入客户信息和产品卖点,它就能写出好几个版本的邮件模板,还会自动设置到发送平台里。

还有一个我觉得特别聪明的是快速建站技能。

Nick 说他在做外展的时候,会给潜在客户免费做个网站,然后附在邮件里发过去。

听起来工作量很大,但有了这个技能,他只需要输入公司名称和基本信息,几分钟就能生成一个看起来很专业的网站,还自动部署到 Netlify 上。

这些技能的共同点是它们都直接作用于能带来收入的环节。

你不需要先花几个月搭建复杂的内部系统,而是从最能立竿见影产生效果的地方入手。对于资源有限的小团队来说,这个思路非常重要。

4️⃣ 技能规范让非技术人员也能上手

可能有人会觉得,这些技能听起来很牛,但我不懂编程怎么办?

Nick 专门花了一大段时间讲技能规范(Skill Spec)这个概念。

简单说,就是用一种标准化的格式来描述你想让 AI 做什么,AI 会自动把它转化成可执行的代码。

他演示了一个邮箱清理技能的创建过程,整个过程就是用语音输入告诉 Claude:我想让你帮我清理收件箱,把自动生成的邮件、营销邮件都标记为已读,只留下真正需要我回复的那些。

然后 Claude 就自动生成了完整的技能文件,包括步骤说明、需要用到的工具、错误处理逻辑等等。

而且 Claude 在生成技能之后会立刻测试一遍,如果发现问题会自己调整代码,确保能正常运行。

这大大降低了使用门槛。

以前你想自动化一个业务流程,可能得找开发者写脚本,现在你只需要把需求讲清楚就行了。

5️⃣ 个性化技能解决那些琐碎但重要的小事

除了商业应用,Nick 还展示了几个解决个人痛点的技能。

比如他每天要去 WeWork 办公,但得提前预订座位,有一次忘了预订结果卡都刷不开。

于是他就写了个技能,每天自动帮他预订未来30天的位置。

还有一个是亚马逊购物助手。

现在亚马逊上搜东西,结果页全是各种乱七八糟的产品,标题写得跟 SEO 文章似的。

他的技能会自动打开浏览器,搜索你要的东西,然后对比所有产品的评价、价格、功能,最后给你一个排序好的推荐列表。

对于普通用户来说,这是一个很好的切入点。

你不一定要从复杂的商业流程开始,可以先从自己的日常痛点入手,比如整理邮件、管理待办事项、筛选信息等等。

等熟悉了之后,再往业务场景扩展就容易多了。

几个关键的趋势变化值得注意:

首先,AI 工具正在从通用助理向专业化工具转变。真正有价值的不是一个什么都能做的超级助理,而是针对具体场景深度优化的专用技能。

其次,自动化的门槛正在快速降低,你不需要成为程序员也能搭建复杂的工作流。

最后,这些工具的自我进化能力意味着,一次投入可以带来持续的回报。

那些能熟练运用这些工具的人,会比其他人拥有更大的杠杆效应。

至于这个杠杆能撬动多大的价值,就看你怎么用了。
01
向度之桥
6天前
未来三年内,写代码这件事本身会变得和手抄书籍一样荒谬。

这话听起来有点吓人,但确实是 Cursor 创始人真金白银押注的方向。

前两天,Cursor 创始人 Michael Truell 发表了一篇短文:《人工智能软件开发的第三纪元》。

文章里提到,Cursor 已经悄悄换了赛道。他们不再做帮你写代码的工具,而是在造生产软件的工厂的工厂。

1

软件工程师这个职业,正在被向上驱逐。

不是被淘汰,是被赶到了一个你可能根本不想去的地方。

以前你是写代码的人,现在要变成定义问题的人。

失业了你可以怪大环境不好,但这种向上驱逐的意思是:你的本事还在,只是没地方用了。

所以,代码从来就不是目的,软件才是。

整个行业其实一直有个错觉,觉得写代码就等于在创造价值。

但实际上,代码只是帮人类把想法翻译成机器能懂的语言而已。以前得人来写,纯粹是因为机器太笨,听不懂人话。

现在机器开始听懂了。

Cursor 的第三时代愿景说白了很简单:AI Agent可以独立工作好几个小时,从拿到需求到交出能跑的软件,中间不需要人类一行行去审。

人类的角色变成了两头跑,一头定义要做啥,一头检查做得对不对。

中间那段实现的过程,以前无数程序员引以为傲的那部分,现在交给机器了。

2

传统软件公司卖的是代码堆出来的产品。

Cursor 想做的,是把需求变成软件这个过程本身变成产品。

这意味着以前你得招 10 个工程师,干 3 个月,才能做出一个中等复杂度的 SaaS 产品。

以后可能只需要 1 个懂业务的人,加上 Cursor AI 代理集群,3 天就够了。

这不是效率提升 10 倍那么简单,是整个生产关系的重构。当造软件的边际成本接近零,软件行业的竞争壁垒就从谁能写出来,变成了谁先想到要做。

执行力不再稀缺了,想象力和判断力才是新的稀缺资源。

所以 Cursor 把自己定位成工厂的工厂。他们不是在造更好的锤子,而是在造自动化生产线,让造锤子这件事本身变得没啥大不了的。

3、

如果你是那种只会照着 JIRA ticket CRUD 的代码搬运工,那确实有点危险。

但如果你能做到这些:能精准定义一个模糊的问题,能在 AI 交的代码里一眼看出架构隐患,能判断某个功能其实根本不该做。

那恭喜你,你的杠杆率刚刚被放大了 100 倍。

以前你一天能产出 200 行高质量代码,现在你一天能审查、调度、验收 AI 产出的 20000 行代码,并且保证它们走在正确的方向上。

Cursor 创始人真正想表达的不是程序员会消失,而是程序员这个词的定义正在被改写。

未来的程序员更像是软件项目的导演,你不需要亲自上场演每个角色,但你得知道这场戏该怎么拍。

所以,软件工程师没有死。死掉的是软件工程师等于写代码的人这个等式。

新的等式应该是:软件工程师 = 定义问题 × 调度 AI × 审查结果

能接受这个新等式的人,会进入一个前所未有的高产时代。

拒绝接受的人,可能就会被困在越来越小的手工作坊里,跟 AI 比谁写 for 循环写得快。

这不是在威胁谁。这是 Cursor 创始人花了几亿美金、押上整个公司得出的判断。

你可以不认同,但最好有个 Plan B。
16
向度之桥
6天前
强烈推荐大家去听这期YC对谈Claude Code 核心工程师 Boris Cherny

听完以后,我觉得市面上 80% AI 产品都得重做。

这场对话,表面上聊的是 Claude Code 怎么做出来的,实际上句句都在打脸现在的 AI 产品同行。

Boris是真正把 Claude Code 从实验室原型做成了开发者每天离不开的生产力工具的人。

这期对谈,YC 合伙人 Garry Tan 也在,两个人是真的一点都不给同行留面子。

他们聊的核心话题就一件事:AI 产品到底该怎么做才能不踩坑?

听完之后,回头看市面上的AI产品,发现大部分团队都在做 Boris 说的那种“无用功”。

复杂的提示词工程、层层叠叠的后处理、各种各样的容错机制,看起来专业,实际上都是在给今天的模型打补丁。

问题是模型六个月就迭代一次,你打补丁的速度永远追不上模型进化的速度。

今天我就把这期对谈里最关键的洞察整理出来,看看 Claude Code 团队是怎么想的,以及为什么他们能做到别人做不到的事。

1

先说个暴论:现在做 AI 产品的团队,有一半都在做无用功。

你看现在市面上那些 AI 产品,动不动就是复杂的提示词工程、层层叠叠的后处理逻辑、各种各样的容错机制。

团队忙得要死,觉得自己在解决关键问题,实际上六个月之后全都要推倒重来。

这个判断不是我说的,是 Boris 的原话。

他说自己见过太多团队陷入一个死循环:为了让模型今天表现好一点,疯狂加规则加流程,结果下一代模型一出来,这些东西直接变成技术债。

你花三个月搭的脚手架,模型三个月自己就学会了,你说你亏不亏?

但如果你不为今天的模型优化,产品现在根本没法用,哪来的六个月之后?

所以,Boris 不是说完全不要做优化,而是要区分哪些是值得做的。

如果你在做的是教模型怎么理解上下文、怎么处理基础逻辑,这些事模型半年后肯定自己就会了,你现在做就是白费力气。

但如果你在定义任务边界、设计协作流程、建立用户信任机制,这些能力模型短期内替代不了,值得投入。

Garry 补充了一个很重要的点。

他说很多创业团队的问题是只顾着解决眼前的 bug,结果产品架构越做越复杂,越复杂越难改。

但如果你从一开始就假设模型会持续变强,你的设计就会往简洁的方向走。不是说不解决今天的问题,而是解决的时候要想着这个方案六个月之后还有没有价值。

2

Boris 第一次被 Claude 震撼到,不是因为它能写一段漂亮的代码,而是因为它能自己写脚本、控制电脑、查他正在听什么歌。

很多人对 AI 的认知还停留在聊天机器人阶段,觉得它就是个高级客服。

Boris 说,模型最想做的事情就是用工具,聊天只是入口。

这个观点其实解释了为什么 Claude Code 要做成一个能直接操作终端的工具,而不是一个纯粹的对话界面。

因为如果你只是把模型当成一个回答问题的东西,那它的价值就被限制住了。但如果你让它能真正动手去执行任务,它的价值就完全不一样了。

Garry 补充说,这也是为什么未来的 AI 产品形态可能和今天的聊天界面很不一样。

我们现在看到的大部分 AI 产品,本质上还是在模仿人和人的对话方式,但模型真正擅长的不是对话,而是执行。

所以下一代 AI 产品可能更像是一个能自主行动的助手,而不是一个等你发指令的对话框。

对开发者来说,我觉得是要重新思考产品的交互逻辑。不要把所有精力都放在优化对话体验上,而是要想清楚模型能帮用户做哪些实际的事情,然后围绕这些事情来设计产品。

3

很多人好奇 Claude Code 为什么选择从终端起步,而不是做一个有漂亮 UI 的桌面应用。Boris 的解释很实在:因为快,做终端不用做 UI,一个人也能把东西先跑起来。

但有意思的是,这个最初因为资源限制做出的选择,后来反而成了产品的一个核心优势。

终端成了一种设计约束,逼着产品变得更克制、更顺手。

Boris 说,如果一开始就做 GUI,可能会陷入各种 UI 细节的纠结,反而把核心功能做复杂了。

Garry 对这个观点很有共鸣,他说很多早期产品的成功,其实是因为资源不够而被迫做减法。当你只能做一件事的时候,你就会把这一件事做到极致。

反而是那些资源充足的团队,容易在产品早期就把东西做复杂。

这个观点对创业者的启发挺大的,不要因为资源有限就觉得做不出好产品。有时候恰恰是资源的限制,帮你砍掉了那些不必要的功能,让产品更聚焦。

关键是要识别出哪些是真正的核心价值,然后围绕这个核心把产品打磨好。

4

AI 产品的设计逻辑和传统软件产品真的很不一样。

传统软件产品是在做加法,功能越多越好;

AI 产品要学会做减法,给模型足够的自由度,只在必要的时候介入。

最关键的一点是,所有这些变化都在加速,模型六个月就会有质的提升,这个速度比任何一次技术革命都快。

所以我们不能用传统的产品思维来做 AI 产品,必须要有一种面向未来设计的意识。

今天做的每个决策,都要想清楚六个月后模型变强了,这个决策还有没有价值。

期待未来能看到更多像 Claude Code 这样的产品,不是把 AI 当成一个噱头,而是真正把它变成提升生产力的工具。

也期待有更多像 Boris 这样的从业者,能把实践中的经验分享出来,帮助整个行业更好地理解 AI 产品该怎么做。

01
向度之桥
8天前
最近听了一期 Lenny's Podcast,嘉宾是思科的首席产品官兼总裁 Jeetu Patel(大家叫他 G2)。

一开始看到思科这个名字,我第一反应是:这不是卖路由器的那家公司吗?跟AI有什么关系?

但听完之后我发现自己想得太简单了。

思科不仅是全球AI基础设施建设的核心参与者,G2 本人在公司内部推动的AI转型更是让人刮目相看。

9万人的企业,4.3万人同时在线看内部直播,这个动员能力本身就很说明问题。而且他在访谈里分享的一些管理理念,坦白讲,颠覆了我不少固有认知。

1️⃣ AI不是来抢饭碗的,它可能是来救命的

G2 在访谈里提了一个很少有人讨论的角度:全球出生率在持续下降,老龄化正在加速。

未来可能出现一种局面,就是需要被照顾的老年人口占到60%以上,但根本没有足够的年轻人来承担这些工作。

这个观点其实 a16z Marc Andreessen 之前也提过,Kevin Scott(微软CTO)也在不同场合表达过类似的担忧。

G2 把它说得更直接:人类的存续,某种程度上取决于AI能不能成功落地。

我们总在讨论AI会不会取代人类的工作,但很少有人反过来想:如果没有AI,谁来做那些必须有人做的事?护理、医疗、基础服务……这些领域的人力缺口只会越来越大。

与其说AI是威胁,不如说它来得刚刚好。

G2 甚至半开玩笑地说,这让他越来越觉得我们可能真的活在一个模拟世界里,因为时机也太巧了。

2️⃣ 大公司不是不会创新,而是不敢押注

这个观点让我停下来想了很久。

G2 说了一句话,大意是:大家都觉得大公司不做实验,其实大公司做的实验多得很。

真正的问题在于,当某个实验跑通了,大公司不敢 all in,总想着继续对冲风险。

思科的做法是反过来的,他们在AI这件事上明确表态:这不是一个可以讨论要不要做的议题,这是已经决定了的方向。

G2 用了一个很有意思的说法叫 pocket veto,就是在大公司里你只要问足够多的人,总有人会说不。

所以有些事情不能拿来投票,必须自上而下地把方向定死。

但光定方向还不够,他们同时做了一件很聪明的事:让每个员工理解,你的个人成功和公司的AI转型是绑定在一起的。

不是说AI会取代你,而是如果你不学会用AI,你的岗位长期来看会变得不那么重要。

3️⃣ 从251次收购的大杂烩变成平台公司

思科历史上做了251次收购,产品线多到数不清。

G2 接手后面临的核心问题是:这些东西怎么整合?他的思路是把思科从一个控股公司变成一个平台公司。

他提了一个原则叫松耦合、紧集成。

客户不需要一次买齐所有产品,但只要你买了两个思科的产品放在一起用,体验应该是丝滑的。这个理念听起来简单,执行起来意味着要打破内部无数个小王国。

之前每个业务线的负责人都想当自己的小CEO,有自己的销售团队、市场团队、工程团队。G2 要做的就是把这种山头文化拆掉,让大家在同一个平台上协作。

这种组织手术在任何一家大公司都是最难的部分,比技术转型难十倍。

4️⃣ 管理的反常识:公开批评,建立信任

每本管理学教材都会告诉你:表扬在公开场合,批评留到私下。

G2 说他根本不同意这个说法。

他的逻辑是这样的:如果一个团队只能在私下讨论问题,说明信任还没有建立起来。

真正健康的团队文化应该是大家可以在公开场合直接辩论和质疑,而不是会后再一个个去敲门。前提当然是你得先花时间建立足够的信任基础,让大家知道公开的批评不是人身攻击,而是对事情本身的讨论。

这个观点可能会让一些人不舒服,但我觉得他说到了一个很关键的点:很多组织的低效,恰恰是因为真话只在私下说,会议上永远一团和气,然后散会之后各干各的。

5️⃣ 毅力比聪明重要

当被问到担任这个角色之前最希望知道什么时,G2 的回答不是某个商业洞察或者战略框架,而是四个字:毅力为王。

他说聪明当然重要,但聪明是可以后天培养的,只要你有好奇心和持续学习的意愿。

真正没法教的是饥饿感,就是那种不达目的不罢休的劲头。

Stamina trumps intellect,这句话听起来像鸡汤,但从一个管理9万人的总裁嘴里说出来,分量不太一样。

G2 是那种少见的既能看到大图景又能把事情落地的人。他不回避AI的复杂性,承认在编程之外的很多业务场景里,AI的应用远没有那么顺畅。

但同时他又非常坚定地认为这是一个不可逆的大趋势,不是炒作周期,而是真正的时代转折。

他有一句话我觉得特别值得记住:你得学会区分大趋势和炒作周期。当你确认某件事是大趋势的时候,不要跟它对着干。

AI到底会把我们带向哪里,谁也说不准。

但至少从这期访谈来看,那些真正在一线推动变革的人,他们既不盲目乐观,也没有在恐惧中犹豫。也许这才是面对不确定性最好的姿态。
00
向度之桥
9天前
前两天刷到 Andrej Karpathy 的一条推文,看完我愣住了。

这位特斯拉前 AI 总监,OpenAI 的创始成员之一,突然发了一长串关于编程的感慨。

他说的不是什么技术细节,而是一个让人细思极恐的观察:编程这件事,在2025年12月已经彻底变了。

读完他的分享,我突然意识到自己可能正站在一个历史转折点上。

1️⃣ 30分钟完成的奇迹

Karpathy 举了个亲身例子。

他想做一个视频分析仪表板,这种项目放在以前怎么也得折腾个把星期吧?结果他只用了30分钟就搞定了。

以前需要反复调试、查文档、改 bug 的过程,现在就像和一个超级靠谱的同事聊天一样,说清楚需求,代码就出来了。

这不是效率提升10%或者20%的问题,而是整个工作方式的质变。

2️⃣ 从敲代码到说英语

更有意思的是他提到的一个转变:程序员的主要工作不再是敲代码了,而是用英语管理 AI 代理。

听起来是不是有点玄?其实想想也合理,当 AI 能够理解你的意图并生成代码时,你的角色就从执行者变成了指挥者。

这就像建筑师和工人的关系。

以前程序员既要设计又要搬砖,现在你只需要把设计图纸画清楚,AI 帮你把砖搬好。

当然,这个比喻不完全准确,因为你还得懂得怎么验收,怎么调整,但核心工作确实变了。

3️⃣ 代理工程学的诞生

Karpathy 提出了一个新词:agentic engineering,翻译过来大概是代理工程学。

现在的编程更像是在编排一群 AI 代理,让它们协同工作。每个代理负责一部分任务,你要做的是设计好这个协作流程。

以前写代码是手艺活,现在越来越像是管理工作。你得知道怎么分配任务,怎么让不同的 AI 工具配合,怎么把它们的输出整合起来。

这是不是意味着未来的程序员更需要的是系统思维和沟通能力?

4️⃣ 不可逆的变革

Karpathy 的一个判断:这个变化是不可逆的。

AI 编程助手不是什么锦上添花的小工具,而是彻底改变了游戏规则。就像智能手机出现后,你再也回不去按键手机时代一样。

我们正在经历的不只是工具的升级,而是整个职业定义的重塑。

编程从一门手艺活变成了一种更高层次的创造性工作。

但这也带来了新的挑战,如果写代码不再是核心技能,那什么才是?

就像现在没人会觉得用 IDE 而不是记事本写代码有什么奇怪的一样。变化总是这样,刚开始让人震惊,后来就成了新常态。
11
向度之桥
10天前
最近听了一期 Stripe 总裁 John Collison 的访谈。

你可能知道 Stripe 是那个处理全球无数在线支付的公司,但这次他们聊的不是传统支付,而是智能体之间的交易,整个访谈核心围绕 AI 智能体会如何改变商业世界。

1️⃣ Agentic Commerce 到底是个啥?

简单说,智能体驱动的商业(Agentic Commerce)是 AI 智能体不再只是帮你写邮件或者总结文档,而是能够代表你去完成真实的商业交易。

比如你的 AI 助手发现你快没咖啡了,它会自己去比价、下单、完成支付。

这听起来好像也没什么特别的,但关键在于规模,当数百万个智能体开始这样运作,整个商业逻辑就变了。

传统电商是人在浏览、比较、决策,但智能体可以在毫秒级完成这些动作,而且是 7×24 小时不间断。

比如现在你在亚马逊买东西,可能会花十几分钟看评价、比价格。

但如果是智能体,它可以同时查询上百个平台,综合考虑价格、配送时间、商家信誉,然后在几秒内做出最优决策。

这种效率差异是指数级的。

2️⃣ 机器对机器支付需要什么样的基础设施?

当前的支付系统是为人类设计的,有很多环节其实是为了防止人为错误或欺诈,但智能体交易完全是另一回事。

首先是速度问题。人类完成一笔交易可能需要几分钟,但智能体之间的交易可能只需要几毫秒,现有的支付网络延迟根本跟不上。

其次是成本,如果每笔交易都要收取传统的手续费,那微小额交易就完全不经济了。

所以 Stripe 现在在在重构底层架构。

John 提到他们正在测试一种新的支付协议,专门为 M2M(机器对机器)场景设计。这个协议的特点是超低延迟、极低成本,而且能够处理海量并发。

更关键的是信任机制,人与人之间的交易有很多隐性的信任判断,但机器怎么判断另一个机器是否可信?这需要全新的身份验证和信用评估体系。

John 说他们正在和一些区块链项目合作,探索用去中心化的方式解决这个问题。

3️⃣ 为什么 Stripe 要押注 USDC Tempo?

传统法币在跨境支付时效率太低,而且有很多监管限制。

但智能体交易很可能是全球化的,一个在美国的 AI 可能需要和一个在日本的 AI 完成交易。

USDC 是一种和美元挂钩的稳定币,它的优势是可以在区块链上快速转移,而且价值相对稳定。Stripe 选择支持 USDC,就是看中了它在跨境支付场景下的效率优势。

John 提到,用 USDC 完成跨境支付,成本可以降低 90% 以上,速度从几天缩短到几分钟。

至于 Tempo 区块链,这是 Stripe 投资的一个项目,专门为支付场景优化。传统区块链像以太坊,每秒只能处理几十笔交易,而且 Gas 费用很高。

Tempo 的设计目标是每秒处理数万笔交易,而且成本极低。这对于智能体经济来说是必需的。

4️⃣ SaaS 真的要凉了吗?

John 给出了一个很有意思的视角。

传统 SaaS 模式是按月订阅,但这个模式的前提是用户需要持续使用软件。可是如果 AI 智能体能够按需调用各种服务,那订阅制还有意义吗?

举个例子,现在你可能订阅了一个项目管理工具,每个月付费,但实际上可能只用到 20% 的功能。

未来如果有 AI 智能体,它可以根据你的实际需求,临时调用不同的服务,用完就走。这种按需付费的模式可能会取代订阅制。

John 提到,Stripe 已经看到一些客户在尝试这种新模式,他们不再卖年度订阅,而是按 API 调用次数收费。这对用户来说更灵活,对服务提供商来说也能更精准地匹配价值和收费。

但这也带来新的挑战,如果收入模式从稳定的订阅变成波动的按需付费,企业的财务规划会变得更复杂。而且这种模式需要更强大的计费和支付系统,这也是 Stripe 的机会所在。

当然,这不意味着传统商业模式会一夜之间消失。但趋势已经很明显,那些能够适应智能体经济的企业,会在下一轮竞争中占据优势。

而对于普通人来说,可能很快我们就会习惯让 AI 代理我们完成各种交易,就像现在我们习惯用手机支付一样。
01