跟着阿亮学AI的个人主页

即刻App年轻人的同好社区

下载

跟着阿亮学AI

1关注13被关注0夸夸

曾就职一线互联网大厂，目前Al创业中
紧跟AI最前沿技术，深度研究国内外AI如何落地
致力于帮助普通人学会Al，帮助企业通过Al提效

跟着阿亮学AI

21天前

红杉资本AI闭门会议流出:他们预测,未来服务业是一个10万亿的市场。

最近我看了两份关于AI的分享，一份是红杉资本2026年AI闭门会议上合伙人讲的话,一份是南方科技大学一位马老师的访谈。看完最近几天一直在思考，睡觉都在想这个时代我自己应该如何规划。

红杉资本是在产业高位往下看,马老师是站在大学课堂里往外讲。本来八竿子打不着的俩人。但我把它们揉一块儿看,挺奇妙，我心里一直说不太清的某些事,被它们俩串起来讲明白了。

你有没有过这种时刻:某项你花了十几年练出来的本事,某天打开AI,它三秒就做完了。它没炫耀,也没欺负你,就是平平静静把答案放在你面前。

那种感觉很微妙,不算难受,但也说不上轻松。

红杉和马老师讲的,大概就是这件事背后的逻辑。那种从小被夸听话、用功、考得好的人,可能正好踩在一个挺尴尬的位置上。

1

先看看红杉的合伙人都讲了些什么。

他说,过去几十年的互联网、移动互联网、云计算,本质都是一种东西,叫通信革命。说白了,就是让信息传得更快。

但AI不是这一类。AI是计算革命,改的是信息怎么被处理。
我换个最直白的说法。

通信革命,等于是把高速公路修宽。从两车道到八车道。但路再宽,你还得自己开。你练二十年的驾驶手感,依然值钱。
计算革命不是修路。它是直接造了一辆自己会开的车。

差别在这:司机的手感不是变得不重要,是直接清零。你不是输给了哪个更勤奋的司机,是你这个工种,被悄悄取消了。以前每一次技术变革,你只要肯学,总能换个工种活下来。这次不一样,这次AI是冲着工种本身去的。

2

红杉接着讲了一个铝的故事。

1860年代,铝比黄金贵。美国人当时拿纯铝给华盛顿纪念碑封顶,这块铝被放在蒂芙尼橱窗里供人膜拜。

为什么这么贵?因为提炼一小块铝,要无数化学家熬半生功夫。后来电解技术出来了。铝从黄金,变成糖纸,用完就扔。
这个故事重点不是铝便宜了。而是那些一辈子提炼铝的天才,在电解机问世那天,他们半生的努力,瞬间贬值成了体力活。

我反复想了很久,这群人到底是什么人?直到刷到南科大马老师的访谈,他给了我一个精准的名字。

他说,中国大学大量培养的,是二类科学家。

马老师背景：北大保送、牛津博士、最早一批做量子计算,后来转去做AI。

什么叫二类?把东西记住,学会解题,在别人搭好的框架里调参数、找数据,把98分调到99分。

那什么叫一类?自己去发现问题,自己去搭建知识体系。
那些一辈子提炼铝的人,其实就是马老师口中的二类科学家。不是不优秀。是把别人定义好的题,一步步做到了极致。

你十几年熬出来的PHD、刷过的几万道题、那点调参手感、那点临床经验、那点法律条文背诵能力,就是当年的那块铝。

你以为你在精进,其实你只是在把自己磨成一块极其精美的、等待贬值的铝。AI是那台不睡觉的电解机。

最难受的不是输。是你这一生交进去的沉没成本,根本不允许你承认输。

3

红杉那段修路的比喻,马老师那边其实也讲过另一面。
采访中博主问他:孩子未来该学什么专业?他几乎是断然拒绝的,他不敢推荐。

为什么不敢?

因为只要是有标准路径的行业,本质上都是在修路。只要路修通了,AI这辆车开得比谁都好。

我们引以为傲的那身优等生气质,擅长找标准答案,擅长在别人画好的格子里填东西,擅长把题做对。拆开来看,其实就是在别人画好的格子里填答案。

当AI成了标准答案的终结者,格子也就没了。

马老师还讲了一个亲身经历的小故事。

2002年,他在牛津念书。从普林斯顿来了一个交换学生,学的是神经网络。那时候,神经网络在学界被看作一个快死掉的方向。马老师做的量子计算,才是物理学界最火的方向,大家都觉得马上要有大突破。

二十多年过去。神经网络变成了今天这场AI的底层。量子计算呢?马老师自己说,过了20年,还是现在这个样子。
那个学神经网络的交换生,他姐姐叫李飞飞。

这个故事最值得品的不是运气,是另一件更冷的事:当所有人都去挤那个所谓的风口时,那个风口就已经死了。

马老师说,量子物理里有个词叫观测者改变世界。意思是,只要专家一开口推荐,一个本来很冷的方向就会被推成大热门,毕业那年正好赶上行业崩盘,集体失业。

所以他不敢推荐学生学什么专业。

你看,红杉从产业讲,马老师从教育讲,两个人撞到了同一个点上。

我们一直以为是优等生的样子,可能就是最早一批要被替代的样子。

4

看到这,这种被清零的荒诞感是不是具象了?但红杉和马老师其实都留了一道后门。

红杉接着讲了第二个故事,关于摄影机。

人类花了几万年把绘画卷到极致。摄影机一出来,一秒就干翻几十年的练习。那时候所有人都觉得,绘画死了。

但你知道后来发生了什么吗?

人类发明了印象派、表现主义、立体派。莫奈画睡莲,梵高画星空,毕加索把人脸拆成几何块。

红杉的总结很漂亮:机器能复刻眼睛看到的世界,但只有人类能画出灵魂看到的风景。

马老师那边,博主问他未来的孩子要培养什么特质。他想都没想就答:越个性化越好,越独特越好,凭兴趣做就行。

一个站在产业高位往下看,一个站在课堂里往外讲,撞到了同一个答案上。

逻辑其实很简单:AI会把标准化的一切价格打到零。剩下来还值钱的,只能是你身上没法被复制的那一点。

摄影机出来后,绘画没死,反而诞生了印象派。因为机器能复刻眼睛,但人类能画出灵魂。

这也是为什么马老师建议孩子越个性化越好。这不是鸡汤,而是生存逻辑。

那些被主流认为没用的爱好、不合群的偏执、一时半会儿换不了钱的奇思妙想,就是你身上少有的、没法被AI电解的灵魂。

5

但说到这,我心里也犯嘀咕。

我们从小被教的就是:好好学习、考个好大学、找份好工作、走最稳的那条路。

现在突然告诉你做独特的人、按兴趣来、找一个没法被AI复制的点。可你怎么知道自己的独特在哪?

这种独特不是找出来的,是长出来的。

正如马老师说的,别把时代的成功,当成个人的成功。我们经历过中国40年的高速增长,身边到处是成功案例,所以总是把时代的红利,当成了个人的本事。到了平缓时代,案例自然变少。这才是正常的状态。

那现在还要不要努力?要。但要换个心态。

成功只是一瞬。你这一生绝大多数时间,都在过程里。不要把目的当成意义。

我以前听这话只觉得是佛系。但放在AI这个语境里,它其实特别硬。

因为目的是别人替你定的指标,随时会变,也随时会作废。但成长,是你自己一寸一寸长出来的血肉。这东西AI夺不走。
不是说独特就一定能成功。而是只有独特,这一生你才算真正活过。

这是红杉闭门会议的一段话，我抄下来了:
这是历史上量级最重的一次浪潮。没有人的领先是安全的。但也意味着,任何人都可以赢。大多数人,还在等这场时代的暴雨停下。

对了，红杉还说未来服务业是一个10万亿的市场。

0 00

跟着阿亮学AI

22天前

AI这波浪潮里，到底谁在挣钱？

最近AI圈有一件大事：马斯克宣布解散xAI，把它并入SpaceX，然后把22万张英伟达GPU租给了Anthropic，就是做Claude的那家公司。

这个消息应该把业内人都惊到了，再大公司ALL in大模型的时候，马斯克这位世界首富居然解散团队。xAI和Anthropic本来还是竞争对手，马斯克这等于是把武器借给对手用？

但其实他是想明白了一件事：做大模型的，不如卖算力的。

前年他囤了22万张显卡建算力集群，这两年算力资源紧张、价格猛涨，这批卡现在是他最值钱的资产。与其继续烧钱搞研发，不如直接出租，坐收稳定现金流。SpaceX也准备今年上市，有了这笔稳定的算力租金收入，估值能再往上推一把。

而且Anthropic不是随便一个买家。Claude在企业级API这块，基本上是垄断级别的。现在做2B的公司，调API大量在用Claude。马斯克这批算力，卖给了最有需求、最有钱的人。

这让我想到一个问题：AI这波浪潮烧了这么多钱，到底谁挣到了？

要搞清楚这个，得先把整条产业链的结构看清楚。

最底层是电力和能源，算力集群烧的电量是天文数字；往上是算力层，英伟达的显卡、各种数据中心；再往上是云服务商，微软Azure、亚马逊AWS这些；再往上是模型厂商，OpenAI、Anthropic、国内各家大模型；再往上是企业级市场，公司买API来做产品；最终到消费者——不管是我们个人掏钱买GPT会员，还是企业做了工具再卖给我们用。

不过，但是，最终：钱都是从消费者口袋里流出来的，只是经过了多少层而已。

1

先看一个数据。

有研究机构拆解过，在2026年大概4000多亿美元规模的AI市场里，英伟达拿走了70%的收入，还有一部分是云计算厂商，模型公司和应用层的很少。

英伟达几乎是一家独吞。为什么？垄断。全球90%的AI训练和推理显卡都是英伟达的，不光是硬件，还有CUDA这套生态。15年积累下来，开发者已经被深度绑定了，你想迁移到其他平台，没那么容易。

所以英伟达这笔生意的本质，是用15年时间建了一条没人能绕过的路，然后在上面收过路费。

2

如果你熟悉互联网时代，会发现现在这个格局跟以前完全反过来了。

互联网时代，挣大钱的是做应用的。Google的净利润大概25%，Meta大概33%，靠近用户的人拿走了最肥的那块。而那些做基础设施的，光纤、IDC，利润率只有5%到10%，赚的是辛苦钱。

那时候的逻辑是：谁离用户近，谁挣钱。

但到了AI时代，越靠近底层越挣钱。为什么会这样？

说白了，是因为成本结构变了。互联网时代，Google每增加一次搜索，基本不增加什么额外成本，边际成本趋近于零，规模越大越赚钱。但在AI时代，每一次调用大模型都是真实的算力消耗，是变量成本，规模越大，烧的钱越多。

这些成本最终流向哪里？流向英伟达，流向云服务商，流向卖算力的人。云服务商大概分走了17%，剩下的，才轮到模型公司。

3

那做模型的公司，现在处境怎么样？

收入是有的，OpenAI和Anthropic的收入都不低。但研发成本太高，现在基本都处于亏损状态。

xAI就是一个很典型的案例。去年烧了60多亿美金，没烧出什么响动来。主要用户集中在X平台上用Grok，企业端几乎没有人买单，2B市场基本空白。核心研究团队这一年多陆续出走，到最后创始团队全部离职。

所以马斯克最后做了一个很务实的决定：不卷了，卖算力。

他的账算得很清楚。前年囤的那批卡，现在坐着收租比继续烧钱做模型划算多了。

4

另外，最近有一些大佬开始做API中转生意。

这是一门什么生意？简单说，就是把OpenAI、Claude、DeepSeek这些大模型的API统一聚合，然后以更低的价格转卖给开发者和企业，赚中间的价差和服务费。

这个赛道原来是草根创业者的主场，小团队搭个平台，做差价，一个人就能跑起来。但最近，好几位国内知名的科技大佬相继入局，甚至连海外某姓懂的名人也搞起了这个。

大佬们在抢什么？其实抢的是「中间件」这一层。在整个AI产业链里，底层是算力，上面是模型，再上面是应用。而中转站做的，是模型到应用之间的那一层——聚合、路由、降价、合规。

这就是AI时代的"卖水给淘金者"。马斯克租算力，是卖铲子；这些大佬做API中转，是卖水。

但这门生意有没有壁垒？说实话，不大。技术门槛不高，进入门槛低，价格战已经开始，大家都在往下卷折扣。大佬们砸资本和名气进来，可能是在赌一个渠道位置，也可能只是在蹭这波热度。

不管怎样，这个现象说明了一件事：现在大家都在想办法靠近基础设施层，没人觉得做应用是最快的路。

5

那这个格局，以后会不会变？

我觉得会变，而且变化可能比想象中快。

现在DeepSeek这类公司在持续压低模型的推理成本。如果算力成本真的大幅下降，做模型的公司盈利空间会打开，产业链的分润比例会重新洗牌，不会永远是英伟达一家吃掉大头。

应用层也会有机会。其实大模型已经在悄悄吃掉软件市场的份额了——很多以前需要专门开发的功能，现在调一下模型接口就能实现。这个趋势还在加速，软件行业会持续被侵蚀。

但应用层的机会，不是现在这种做工具的方式。一个AI工具，没有网络效应，用户随时可以换，护城河很浅。真正有机会的，是那些用AI真正改造了某个行业的——不是提供工具，而是扎进某个垂直领域去提供服务。

大厂现在还在卷模型，等他们觉得模型差不多了，一定会去卷应用。那个时候竞争会更激烈。留给普通人的窗口，可能就是这两三年。

对普通人来说，我觉得比较现实的路，是找一个自己熟悉的行业，用AI去提供更好的垂直服务。行业知识加上AI能力，比纯做工具有更多护城河。

这个格局还在快速变化，值得持续关注。

0 00

跟着阿亮学AI

27天前

找到一个可以全网检测情报的 Skill

最近发现一个挺有用的 skill，叫 last30days。它可以监测实时热点内容、监测某人的动态、某个事件的真实走势等等。我自己之前也做过类似的，但没这个功能多。看看这陡峭的热度...

现在很多人都想让 AI 帮自己干一件事，就是全网搜信息。但你真去试一下就知道，你和它说搜一下最近某某行业的热点，它给你的，要么是几篇你早就刷到过的旧新闻，要么是它自己理解一下憋出来的总结。看着挺工整，里面其实没什么真东西。你想看的大家最近真在讨论什么，它给不到。last30days 干的就是这件事。

为什么 AI 直接搜不准？说白了，它能拿到的，基本是被算法筛过、被 SEO 排过的网页。但真实的风向其实不在那儿。一件事最近大家在怎么吵、怎么吐槽、怎么押注，这些都藏在各种社区的讨论里、视频里、转发里，也藏在一些预测市场的赔率里。last30days 直接去这些真有人在说话的地方搜，结果按真实的互动数据排，点赞多少、评论多少、播放多少，谁有人在回应，谁排前面。这个搜法和以前那种搜网页，其实是两回事。

1

先说一个我最近在用的场景，开会前摸底。

上周我要见一个之前没合作过的人，开会前想快速搞清楚他最近在忙啥。以前这种事我会去搜他名字，翻一遍他的社交主页、看下有没有人提过他、再去看下他的官方简介。半小时过去，看到的基本都是几年前的旧信息，加上他自己写的那一段自我介绍，看完心里依然没底。

用 last30days 搜就完全不一样。他名字搜下去，出来的是他这阵子在各个社区里被讨论了什么、最近被转得最多的一条内容说了啥、他发布过什么作品。看的是他这段时间真实在做的事和说的话，不是他想让你看的那一面。这种信息，其实比简介有用得多。

这个场景能延伸的事挺多的。合作前查一下对方公司最近的风评、面试前查一下老板和团队、大额下单前查一下供货方在社区里的口碑、要投一个项目之前查一下创始人最近的动作，都是一回事。重要的事开始之前，花几分钟摸一下底，决策就稳很多。我觉得这是大部分人都用得上的功能。

2

第二个场景，追一件正在发生的事。

一条新闻出来，主流报道的口径基本是一致的，几家媒体说的都差不多。但你想知道这件事真实风向是什么、普通人怎么看、接下来可能怎么发展，光看新闻其实看不到。last30days 给你的就是这些：各种社区里各个角度的讨论、网友的真实吐槽、相关视频被看了多少次、预测市场上有人真拿钱在押接下来会怎么走。

顺便说下预测市场。它的逻辑挺特别，参与的人是拿真钱在押注一件事的走向，比如一件大事的结果、一个产品发布、一家公司的动作，赔率是大家用钱投出来的。这个数据和评论区那种顺嘴猜两句不一样，说话可以随便，押钱就得想一想。所以它给出来的预测，其实是网上比较硬的一类参考。

普通人看到这种数据，主要的好处是不会被单一口径带着走。一件事在不同地方会激起完全不同的反应，看到这些反应，你才比较接近真实情况。

3

第三个场景，信息整合。

研究一个行业、一个产品、一个话题，最累的是要开好几个 App。每个平台搜一遍，结果出来又得自己去重、自己整理。一圈下来一两个小时没了，到头来也不一定看全。last30days 是一次搜，所有信息源一起来，同一件事在不同地方都被聊到，它会自动识别这是同一个话题，把这些都合并成一个完整的画面给你。不用切来切去，也不会因为只看了某一个地方漏掉重要内容。

它有一个挺好用的功能叫 Best Takes，专门从各处帮你找出传播最广、被点赞最多的几条评论。有时候一条高赞评论说的，其实比一篇长文分析更到位，更接近大部分人真实的感受。看完一遍 Best Takes，这个话题大家是什么态度，你心里就有数了。

搜完之后，它能直接生成一份排版挺像样的 HTML 报告。你做内容、做调研、做汇报，发给同事或者老板都挺方便。

4

说下如何安装。用 Claude Code 的话一行命令就装好了。常规的几个信息源是免费直接能用的，不用配置。少数几个需要稍微设置一下，新手用免费部分就够了。

门槛主要在 Claude Code 这一步，不懂技术的人得先把 Claude Code 装上。但你要是已经在用 Claude Code，加这个 skill 就是几分钟的事，装好搜一个你最近想了解的东西，你大概就明白我说的这种搜法和以前不一样在哪了。
顺便提一下，这个 skill 在开源社区上 24.7k 星、2.1k fork，前段时间也登上过开源趋势榜的首位。市场已经验证过它好用了，可以放心试。

我们让 AI 帮自己搜信息，搜的应该是真有人在讨论的那些东西，而不是几篇老新闻拼一拼，更不是它自己憋出来的工整总结。一个人最近真实在做什么、一件事在不同圈子里激起了什么反应、一家公司在社区里口碑如何，这一类情报其实一直都有，只是之前没有工具帮你比较系统地拉出来。last30days 干的就是这件事。

1 010

跟着阿亮学AI

28天前

OpenAI老板给孩子的教育建议：别卷知识，这3样东西才是真金白银

前几天刷到一段访谈，说话的是OpenAI的老板山姆·奥特曼，聊的是一个我一直特别关心的事：AI这么猛，孩子到底该学点啥？

这人身份有意思。一边，他手里握着全世界最顶尖的AI；另一边，他当爹不久。你要说谁最有发言权，可能真没人比他更合适。按理说他最该焦虑吧？结果他给出的答案特别冷静，而且跟大部分家长的想法，几乎是反着来的。

他一共讲了三件事。我听完琢磨了好几天，越想越觉得背后的逻辑其实挺简单，小白也能听懂。今天用大白话给你捋一遍。

在说三条建议之前，我先把背后那条共同的线拎出来，不然单看三个观点容易觉得散。

奥特曼的整个思路，其实就一句话：AI越能干，人越要去做AI干不了的事。

那AI最擅长什么？记东西、跑数据、按规则找最优解。那人类剩下的战场就清楚了，AI记不住的流水、AI搞不懂的人心、AI想不出的新点子。对应的，就是下面这三条。

1

第一条：别让孩子死记硬背，要学"怎么学"。

奥特曼说得挺直接，让孩子花大把时间背公式、记知识点，在今天基本等于浪费生命。理由也很简单，这些东西AI一秒能给你，比你记得准，比你调得快，还永远不会忘。

为什么这个观点挺颠覆？因为我们从小被灌输的默认假设，就是脑子里存的东西越多越厉害。小学时候谁能把课文一字不差背下来，谁就是尖子。说白了，那个时代的大脑像硬盘，比的是谁容量大。

但现在情况完全变了。奥特曼提了个数据，就算没有AI，这个社会每75年也会自然淘汰掉差不多一半的工作。AI一加进来，这个速度直接翻几倍，每半年一次大版本升级。
这意味着什么呢？你今天辛辛苦苦学会的东西，过几年可能根本没人再用。

讲一个很具体的例子。20年前学Photoshop、学3D Max，那真是一门手艺，学会能吃一辈子。前段时间我遇到一个做了十年广告设计的朋友，他说这半年客户跑了七七八八，不是客户不做广告了，是客户自己用AI在家捣鼓，做出来的东西比他干的还快还好。他说那几天晚上都睡不着，觉得自己十年练的手艺，一夜之间就贬成白菜价了。最狠的是，他身边的同行基本都在经历这事。

那不学行不行？奥特曼的意思不是不学，而是要学一种更高阶的东西，他叫它"元学习能力"。

这词听起来挺唬人，其实说白了就是一句话：学会怎么快速上手新东西。工具换了，三天玩明白；规则变了，一周能适应；技术又迭代了，照样能跟上。这种"随时升级自己"的能力，才是真正不会过期的。

换个好懂点的比喻。以前孩子的大脑比的是硬盘容量——看谁能塞更多的东西。以后比的是操作系统——看能不能兼容新软件、能不能跑得又快又稳。硬盘里存一堆十年前的旧程序，不如操作系统随时装得上最新的App。

2

第二条，也是我个人最喜欢的一条：搞定"人"比搞
定"AI"重要一万倍。

原话看着吓人，其实逻辑很朴素。

AI擅长什么？处理逻辑、处理数据、处理规则。这些东西的共性是——可以量化、可以复制、可以按部就班。但AI一直有个死角没法攻破，就是"人心"。

人不是按逻辑运行的生物。人有情绪、有面子、有说不出口的需求、有心里想一套嘴上说一套的时候。这些东西你没法用公式算，也没法用数据建模。

举两个例子你就懂了。

第一个，卖车。一个中年男人走进4S店，带着老婆和三个孩子。如果让AI推荐，它会怎么做？它会把市面上几十款车的参数、油耗、保值率、安全评分全扒出来，整一份十几页的分析报告，告诉你哪款综合性价比最高。逻辑上无懈可击。

但真正顶级的销售根本不这么干。他一眼就看明白了：这男人在乎的根本不是百公里加速，而是——老婆坐前排能不能舒服地伸腿，三个孩子挤后排会不会打架，撞上了安全不安全。所以他可能连发动机都不提，直接带这哥们儿走到后排，拍一拍座椅说一句"哥你看这空间，三个娃进来还能翻跟头"。就这一句话，顶AI那份十页报告。因为他读懂了这个男人真正在意什么。

第二个，职场。开会的时候，领导突然把昨天拍板的方案全推翻，要从头再来。如果让AI处理这个场景，它会列一堆数据、摆一堆事实，证明昨天的方案更合理，试图把领导说服回去。听起来很理性对吧？但凡在职场待过几年的都知道，这么干基本等于自杀。

因为领导翻案，九成不是方案本身的问题。可能是上面有人施压了，可能是要照顾隔壁部门的利益，甚至可能就是昨晚跟家里人吵了一架心情不好。这时候不看气氛硬拿数据怼回去，就是没眼力见。真正聪明的人这时候会先顺着来，找机会私下打听情况，再想办法把好的部分保留下来。

这两个场景有一个共同点：AI能搞定事，搞不定人。而人类世界里，80%的麻烦都跟人有关。

所以谁能读懂人心、谁会共情、谁懂做人，谁就有AI永远替代不了的价值。共情力和社交商这两样东西，在AI时代会从软技能变成硬通货。说一句可能让大家舒服一点的：中国人在人情世故这件事上，其实有天然优势。

3

第三条：比聪明更稀缺的，是不按常理出牌。

这一条听起来有点虚，其实也是一句大白话：AI擅长聪明，但不擅长创造。

先把这两个词掰开。

聪明，是在规则里面找最优解。考试是这种事，刷题是这种事，做方案算成本也是。题目是出好的，答案是确定的，谁又快又准谁就聪明。这件事AI已经封神了。人类几千年攒下来的题库、解法、套路，全都在它脑子里，它解一道题比我们翻目录还快。在聪明这条赛道上跟AI卷，人没有赢面。

创造，是跳出规则做出没人想过的东西。是从0到1。
我拿短视频举例你最好懂。你让AI做一条美食视频，它会调出最精致的滤镜、最丝滑的运镜、最煽情的BGM，整出一个教科书级别的画面。好看是真好看，但你会停下来看吗？大概率不会。因为太标准了，你一眼就猜到下一秒是什么。

你再看那些真正刷屏的美食内容都长什么样。有人跑到建筑工地，架起一口大铁锅，拿铁锹翻炒。有人爬上雪山顶，零下二十度支个小桌子吃火锅，手都冻红了还在那儿涮肉。这种画面一出来，你脑子里冒出来的第一句话一定是：这也行？就这三个字，把你留住了。

AI为什么想不出这种主意？因为它的工作方式就是从历史数据里找规律。工地铁锹炒菜这种事，历史数据里根本没先例，它变不出来。它只能模仿和优化已经有的东西，没法凭空冒出一个全新的念头。

除非你先想到了，再把画面描述给它，它才能帮你执行出来。所以奥特曼的判断就是：AI是干活的一流打手，但想出好点子的那个脑袋，才是真正值钱的。

把这三条放一起看，你会发现背后那条线特别清楚。

AI越强，人就越要靠不像AI的那部分活着。快速学新东西的适应力、读懂人心的共情力、想出新点子的创造力，这三样东西有一个共同的特点：没法标准化，没法流程化，没法被算法吃掉。

有个细节我印象特别深。奥特曼有次在听证会上被问：你希望你的孩子跟AI做朋友吗？这是全世界最懂AI的人之一，你猜他怎么答？他几乎没犹豫，就一个字：不。

你品一品这个反应。做出最强AI的人，反而最在意人跟人之间那种真实的、没法被机器复制的东西。

说回咱们自己。不管是当家长的，还是自己在职场里扑腾的，这三条其实都能对上号。不用焦虑，也不用明天就做什么大动作。但有一件事我觉得从今天起可以开始注意，别急着掐灭孩子那些听起来不着调的念头。

那些天马行空的脑洞，那些不按常理出牌的瞬间，那些让你忍不住想吐槽这孩子怎么想的的时刻，恰恰就是未来最贵的东西。好好护住它们，比多报两个补习班重要得多。

0 02

跟着阿亮学AI

29天前

我日常使用的AI工具及费用明细 | 2026年5月更新

照例更新一下近期我常用的一些AI工具。 AI发展很快，每个月都会有一些变化。我会把我常用的，也基本上是业内大部分人使用的工具分享出来，包括它们的价格、使用场景，供大家参考。

先说钱的事。付费购买主要就几块：

阿里的 Coding Plan：月付 200 元，可以用千问、 GLM 和 Kimi 的模型，性价比不错。

Claude Max 会员：125 刀，这是我日常的主力工具，基本上离不开。

Codex 两个号：合计约 300 元人民币。

加上各种按积分付费的……

加一起每个月不到 1500 元人民币。说多不多，说少不少，但这已经是我日常工作的基础设施了，不算贵。

1. 日常问答

豆包免费，随手问随手查，速度快，挺够用的。
GPT开了两个 20 刀的账号，有时候需要多开。这俩号后面 Codex 也会共用，所以成本算是摊开了。

2. AI 编程

这块是我花钱最多、也最依赖的地方。

Claude Opus 4.7 + Claude Code主力中的主力。125 刀的 Max 会员，每天开着用，编码、调试、重构，几乎都在这里完成。

GLM-5.1配合 Claude 一起用，处理常规编码任务，阿里的 Coding Plan 里就有，不额外花钱。

Claude Design做 UI 设计，共享 Claude 会员，不用多花钱。Claude 在排版和视觉逻辑上确实有自己的判断，生成的 UI 不那么"AI 味"。

Kimi 2.6配合做 UI 设计，审美挺在线的，国内用起来方便。

Codex（GPT 5.5）跟 GPT 是同一个号，最近用的越来越多，后期都打算替换ClaudeCode了。Codex最近越来越牛了，现在已经有操作电脑的功能，编码速度也非常快，主要的缺点是废话太多，碎碎念受不了。

3. 写作

Claude Opus 4.6，在 Claude Code 里用。写长文、改稿子、调结构，目前没有找到比它更顺手的工具。

4. 知识库

Obsidian（免费） + Claude Code。Obsidian 管理文档，Claude Code 处理、整理、检索，配合起来效率很高。不需要额外订阅什么知识库 SaaS。

5. AI 画画

豆包，日常随便出图，免费，速度快。

GPT-image-2，在 Codex 里用，也可以直接 GPT 网页端，同一个号，不额外花钱。

Seko，这个有意思，出图阶段完全免费，只有生成视频的时候才收费。等于白嫖了个画图工具哈哈😃

6. AI 视频

Seedance 2.0，豆包里免费用，视频质量真的不差，而且不花钱。

RunningHub，这个是最近替代了我原来视频工作流的工具，效率提升非常明显。一个 15 秒的精品视频，算上抽卡成本，不超过 10 块钱，真的香。

Grok，某鱼几十块买的一年会员，主要用来做视频里的素材，偶尔用一用。

7. 数据分析

Codex（GPT 5.5）+ Claude Code（Opus 4.7）两个配合用，复杂的数据任务基本搞得定。

8. 深度研究

DeepSeek V4，中文语境下理解得很准，研究中文市场相关内容很给力。

ChatGPT Deep Research，做行业深度调研的时候用，深度检索能力很强。

9. 音乐生成

MiniMax Music 2.6，国内的，生成音乐的质量没的说。
豆包，有时候也在这里出音乐，免费额度充足。

10. 3D 生成

TripoAI，偶尔用一下，免费额度基本够，没有付费。
11. AI 输入法

电脑端：微信自带语音输入，真的好用，识别准、速度快，不用额外装软件。

手机端：豆包输入法，语音转文字很稳，移动端首选。

12. 翻译

网页端：豆包浏览器插件划词翻译，日常够用。

文件翻译：自己开发的翻译工具可以完美保留 Word、Excel 的排版和格式，直接拿来用不破坏原始格式。目前已经给几个合作伙伴在商用了，效果反馈不错。

这一套组合下来，每个月大概 1500 元以内，对我来说是工作刚需，每个工具都有自己的位置，AI 变化太快，这套工具箱下个月可能又会有调整，到时候继续更。你们有什么常用的工具也可以聊聊，互相参考一下～

4 01

跟着阿亮学AI

1月前

媳妇面试AI岗，居然霸气反问面试官：Agent、MCP、A2A、RAG、知识库这些你们是怎么做的？

媳妇最近在换工作，和我分享了下她最近面试的一些体会，无论是什么岗位、大小公司，几乎都会问一些AI相关的知识。特别是一个做AI桌面智能体的公司，好像都没问多少学历、专业、背景啥的。但是，她也霸气反问了对方：MCP、A2A、RAG、知识库这些你们是怎么做的？
哈哈哈，我媳妇也算半个专家了。

Agent、MCP、LLM、Token、RAG、Function Call、A2A等等，很多人对这些概念是一知半解，停留在「知道」的阶段，经不住面试官追问。

其实这些词很好理解，最关键的是得把这些零散的知识点关联起来。我换个角度讲，把它们想成你雇了一个AI助理，从他啥也不会到能独当一面，每升一级，就对应一个新名词。看完这篇，你下次再被问到，就能从原理到落地给面试官详细分析一通。

1

LLM，只是个嘴炮顾问

最早的那个AI，就是LLM，全称大语言模型。比如GPT-5.5、DeepSeek-V4就是它。

你跟它说，下周三我去广州出差，帮我订张晚上六点以后的高铁。它会很认真地回你：你可以打开12306，把目的地选成广州，时间筛选下周三18:00之后，按价格升序排，选个二等座就行。

听着像那么回事，细看一下，它啥也没干。这就是LLM的天花板。它读过的书巨多，啥都能聊两句，但只会动嘴，不会动手。我管它叫嘴炮顾问。

2

你给他配了对讲机，他终于能干活了

后来工程师想了个办法。提前告诉LLM，我这有个订高铁的工具叫book_train，你需要的时候报工具名和参数就行，剩下的我来执行。

这套机制就叫Function Call，函数调用。

注意一个细节：LLM自己其实不动手，它只是输出"我要调book_train，参数填广州、下周三、18点之后"这么一段指令，真去订的是程序。这么设计就是为了安全，AI再抽风，也只能输出错的指令，没法绕过你的代码乱搞。
加了这层之后，AI就从只会动嘴升级成了能动手。这一下，整个游戏变了。

3

嘴炮+对讲机+笔记本+计划本=Agent

把这四样东西捏到一块儿，就是Agent，智能体。
LLM，是大脑，负责思考。

Function Call，是手脚，负责执行。

Memory，是笔记本，记住你昨天交代过啥。

Planning，是计划书，知道先迈左脚还是右脚。

还是出差那个例子。Agent先翻你日历看周三下午有没有冲突（记忆），订一班合适时间的高铁（执行），顺手把你常住的那家广州酒店再续一晚（规划），最后给那边对接的同事自动发一条会议提醒（执行）。

这就是Agent火起来的原因。它不是AI更聪明了，是AI开始能干活了。

LLM和Agent的区别一句话：LLM告诉你怎么做，Agent直接帮你做完。

4

工具越加越多，得有个统一插口

但有个新问题。市面上工具一大堆，今天接飞书明天接Notion后天接公司内部CRM，每接一个都得单独写一套对接代码。三个AI接三个工具就是九套，十个AI接二十个工具就是两百套。每改一处，全得跟着改。

于是有家公司搞了个MCP，全称模型上下文协议。简单说，原本各家自扫门前雪的工具接口，被统一成了全行业通用的插头。

我打个最直观的比方。十年前你出门要带三根线，安卓的、苹果的、老款诺基亚的，谁都不通用。Type-C一统江湖之后，一根线插哪儿都行。

MCP就是AI界的Type-C。

再换个画面。以前给AI配工具像在自家后院挖井，每个井都得自己挖、自己接管、自己维护，费劲。有了MCP，就像接上了自来水管网，水龙头协议对上，全世界的工具都能流进你的Agent里。

谁支持这个协议，谁就能即插即用。今天给AI接个飞书，明天它自己就发现"诶我会发消息了"。这事最近为啥火，因为它解决的不是性能问题，是连接问题。

5

工具会用了，还得知道活该怎么干

光有工具不够。你给AI接了合同库，它能读条款，但让他做合同审查，他知道该盯哪些坑吗？知道你们公司的红线在哪吗？知道审完之后意见该怎么整给法务吗？

不知道。

这时候就需要Skills，技能。就是把领域专家的方法论写成一份SOP手册塞给AI。比如：你是十年经验的法务总监，审一份采购合同必须看付款节奏、违约责任、知识产权归属三块，每块具体看什么、风险等级怎么标、意见怎么写，全写清楚。

Skills和System Prompt的区别在于按需激活。你跟AI闲聊它不会调这个手册，只有你说帮我审一下这份合同，他才把手册翻出来对照着干。

记住一句话就够：Skills决定怎么想，MCP决定用什么，Function Call决定怎么调。

6

一个AI忙不过来，几个AI怎么搭伙

Agent干一个人能搞定的活儿没问题，但碰上复杂任务，一个不够用。

举个例子，你想让AI出一份新品发布会的整体方案。一个负责调研同行最近类似的发布会都怎么搞，一个负责拉场地和物料供应商的清单，一个负责写主题文案和现场议程，最后再有个汇总的把这些拼成一份完整方案。这几个AI怎么对话？怎么派任务？怎么知道对方完成了？

这就需要A2A，Agent to Agent协议。几家头部公司带头搞的。

我用公司类比。MCP管员工怎么用OA、CRM这些系统，A2A管员工之间怎么走流程，派活有标准的工单格式，交付有标准的成果物，进度有标准的状态汇报。

MCP是对内连工具，A2A是对外连同事。两个不冲突，是互补的。MCP现在已经成了事实标准，A2A还在追赶。

7

公司内部资料他不知道，怎么办

LLM懂的是公开知识，你公司内部的文档、最新的行业新闻、特别小众的细分领域，他都摸不着。

解决办法叫RAG，检索增强生成。

最简单的比方就是闭卷考试和开卷考试。光用LLM等于闭卷，全靠脑子里记的东西。RAG等于开卷，回答前先去翻书，找到相关段落塞进上下文里，再基于这些资料回答。

RAG 跟 Agent 的关系是这样的：RAG只是Agent工具箱里的一个工具，专门管查资料。需要查知识就调RAG，需要操作就调API，需要算东西就调代码执行器。RAG 就是 Agent 的眼睛。

8

干活时候有几种姿势

最后说说Agent具体怎么干活。三种主流模式，画面感先记住。

第一种叫ReAct，像摸着石头过河，走一步看一步。想一下、做一步、看看结果、再想下一步。优点是灵活，缺点是费Token，还可能死循环。所以做ReAct都得加保险，比如最多走15步、连续3次重复动作就退出。

第二种叫Plan-and-Execute，像拿着施工图纸进场，先看全貌再动工。先把整个计划列出来，再按图施工，省掉每一步重新思考全局的开销。比ReAct省Token得多。

第三种叫Multi-Agent，多AI协作。这个就像开公司，得有个经理在那儿调度，不然就是一群人在群里刷屏。听着很美，业内反复提醒过：能用单个强大Agent就别上Multi-Agent。多个AI互相甩锅，调试是噩梦。只有任务真的需要专业分工时才考虑。

9

把这些串起来，整张图就清楚了

LLM是大脑，Function Call是神经系统，MCP是USB接口，Skills是岗位培训，A2A是协作流程，RAG是图书馆。这一整套加起来，才是我们今天说的Agent。

理解这些词最大的价值不光是面试。是下次刷到AI新闻、老板转的链接、群里的讨论，你能听懂在说啥，能判断哪些是真有用、哪些是堆概念。

比如听到某个产品说接入了MCP，你就知道它工具生态会丰富。听到某个产品张口闭口Multi-Agent，大概率可以判断要么真懂在做分工，要么就是在炒词。

AI新词还会一茬一茬冒出来。但根上的东西是稳的：怎么让大脑接上手脚、怎么让工具标准化、怎么让多个AI协作、怎么让它能查资料、怎么让它干活有章法。把这五件事吃透，再来什么缩写你都能秒懂。

再说回为啥要搞懂这些。在一人公司这个时代，这些词其实就是你的员工手册。搞懂了Function Call和MCP，你知道怎么给AI助理装上手脚和工具。搞懂了Skills，你知道怎么把自己的方法论塞给它。搞懂了A2A，你就知道怎么给自己组建一支数字特种兵部队。

一个人，加上一队听话能打的AI员工，干以前一个团队才能干的活。这才是这波东西真正值得关注的地方。
我自己也在边用边学，有新发现再和大家聊。

19 415

跟着阿亮学AI

1月前

Karpathy的Claude Code的最佳实践，开源了，所有人都应该用起来

最近在GitHub上看到一个挺离谱的事。一个只有70行代码的项目，上线两个月，拿了53.6kStar、4500 Fork。而且这个项目连代码都算不上，就一个Markdown文件，里面写了几条用AI写代码的规矩。起因也简单，就因为Andrej Karpathy发了条内容。

Karpathy你们应该知道，前特斯拉AI总监、OpenAI联合创始人，AI圈子里很有分量的一个人。他那条内容聊的是自己用Claude Code这大半年的感受，底下全是程序员在刷太真实了。

一个开发者看完，第二天直接把Karpathy的吐槽整理成了一个文件丢到GitHub，项目名就叫andrej-karpathy-skills，然后就炸了。

所以我就很好奇，这70行到底写了什么，能让这么多人一起点头。翻完项目发现，其实就是一件事：把AI写代码的几个坏毛病管住。

先说Karpathy自己的感受。他说一个很具体的变化，去年11月他写代码还是手动80%、AI辅助20%，到今年1月完全倒过来了，AI写80%他只改20%。这个转变速度确实快，但也正是因为快，一堆问题跟着冒出来。Karpathy总结了三个坑，每一个用过AI写代码的人估计都遇到过。

1

你让它干A，它自己脑补出B。

比如你随口说一句加个导出用户数据的功能，正常人的反应应该是先问一串问题：导出哪些用户？导出什么字段？什么格式？存哪？但AI不会。它自己把这些问题在心里默默答了，然后直接开始写。等你过两分钟回过神，它已经按自己的理解写出来了，方向可能压根就不对。Karpathy的原话更直接：模型不会管理自己的困惑，也不寻求澄清，该推回去的时候也不推。

2

你让它写3行，它给你写30行。

这个坑踩过的人都有共鸣。你就想要一个算折扣的小函数，它给你整出策略模式、抽象基类、协议类、配置类一整套，看起来很专业，但问题是你压根不需要这些。Karpathy说得挺直接，100行能搞定的事它非要写1000行，特别喜欢搞那种臃肿的抽象层。

这背后其实能理解。AI是从海量开源代码里学的，那些被点赞多、被star多的，往往是企业级的复杂架构，所以它默认觉得专业就等于复杂。但真实项目里，90%的场景根本用不上这些。

3

你让它改2行，它动了20行。

你让它修一个空邮箱会导致崩溃的bug，它确实修了。但你打开diff一看，它顺手加了用户名校验、补了docstring、改了注释风格、还把格式重新排了一遍。你没让它做这些，但它做了。这一条最影响效率，因为你review代码的时候，得一行一行去判断哪些是必要的、哪些是它自己加的，本来5分钟能看完的PR，硬生生变成半小时。

一句话总结这三个坑：AI写代码就像一个特别自信的实习生，手快、知识面广、什么都敢接，但不问需求、爱炫技、还管不住自己的手。Reddit社区里程序员们也是这么说的。

那70行的文件，就是拿来管这个实习生的。

总共四条规矩，我用大白话讲一下。

第一条是别假设。不确定就问，别自己脑补。一个需求如果有几种理解方式，就列出来让用户选，别偷偷选一个就开干。有更简单的方案就提出来，该把需求推回去的时候就推回去。项目里举的例子特别到位：用户说加个导出功能，AI应该先问4个问题：导出哪些用户、哪些字段、什么格式、存哪里。问完再动手。

第二条是能少写就少写。用最少的代码解决问题，没要求的功能不要加，只用一次的代码不要搞抽象，没人说要灵活性就别自作多情。文件里有一条标准特别好用：如果一个资深工程师看了会皱眉头说这过度设计了，那就是过度设计，得改。那个计算折扣的函数，正确答案就是一个3行的函数，别整那些花活。

第三条是别手贱。只改必须改的，别顺手改旁边的代码、注释、格式。没坏的东西不要重构，看到无关的死代码提一嘴就行，千万别自己动手删。判断标准也很清楚：每一行改动都要能追溯到用户的需求，追溯不到的就不该动。修邮箱那个bug，正确做法就是只改导致崩溃的那2行，其他一律不碰。

第四条稍微不一样，是用来发挥AI优势的。Karpathy说AI有一个特别厉害的能力，就是能自己循环，直到达成目标。所以正确的指令不是加个验证，而是先写一个无效输入的测试，再让测试通过。不是修个bug，而是先写一个能复现这个bug的测试，再让它变绿。说白了，你给AI的不是步骤，是一个明确的成功标准，它会自己反复跑、反复改，直到测试通过。好的成功标准能让AI自己往前走，差的成功标准只会让它反复回来问你。

四条规矩，三条治病，一条发挥优势，就是这个70行文件的全部内容。

那问题就来了，这么简单的东西凭什么拿这么多Star？我觉得有两个原因。

第一个，它戳到了一个真实的、普遍的痛。用AI写代码的人越来越多，这几个问题是人人都遇到过的。之前大家的土办法，要么是每次在prompt里重复写一大段要求，要么是review的时候手动改回去，都挺累的。

第二个更关键，它用了Claude Code的一个机制。你在项目根目录放一个CLAUDE.md文件，Claude Code每次启动都会自动读，把里面的内容当作行为准则。不用每次提醒，放着就一直生效。也就是说，你只要把这个文件扔到自己的项目里，AI就自动变乖了。安装也不麻烦，Claude Code插件市场一键装，或者curl一下直接下载，两分钟的事。

项目作者还专门写了一个EXAMPLES.md，里面是真实的对比案例。左边是AI默认会写出来的样子，抽象层、策略模式、一堆类。右边是应该写出来的样子，一个3行的函数。看一眼就明白这四条规矩在说什么，你甚至都不用理解，直接用就行。

其实这件事值得多想一下的地方，不在这70行本身。以前评价一个程序员，看的是他写代码写得好不好。现在这个标准在变，当你80%的代码都是AI写的时候，真正重要的能力，是你能不能管好AI写的代码。

这和带新人其实是一个道理。你不能把需求一丢就不管了，你得把上下文讲清楚、把边界画明白、把验收标准写下来。Karpathy那条推文的核心观点其实就是这个：别告诉AI该怎么做，告诉它什么算做完了，然后让它自己跑。
而解决这个大问题的方案，反倒是最不起眼的那个。不是新模型，不是新框架，也不是什么高级的prompt技巧，就是一个70行的Markdown文件。这个投入产出比本身就挺值得琢磨，很多时候最有用的东西，恰恰是最简单的那个。

这个项目我觉得值得关注，哪怕你不写代码。因为它背后那套思路，在所有和AI协作的场景里都适用：给清楚的规则，给明确的标准，让AI在一个框架里跑。你不用把AI当成无所不能的助手，也不用把它当成难以捉摸的黑盒。它就是一个脑子快、活儿糙、有点飘的新人，你给的边界越清楚，它干得越稳。

AI怎么写代码、怎么和人协作这件事还在快速变化，我也会继续关注，有新发现再和大家聊。

0 03

跟着阿亮学AI

2月前

媳妇突然跑来问我啥是Hermes Agent 与harness engineer，于是我写了这篇给小白看的科普

又是周末，媳妇刷到一条短视频，跑过来问我：Hermes Agent是个啥东西？是下一代OpenClaw?

我说Hermes Agent最近确实很火，他就是个智能体，记忆力好了一点、聪明了一点，可以自主沉淀、自我学习进化。

她说：和OpenClaw是一回事吗？

我说，不是一回事，但有关系。上次说的 OpenClaw 是一个帮你干活的 AI 助理，你说要什么，它去做。Hermes 也是帮你干活的，但它多了一个很厉害的本事——越用越聪明。OpenClaw 是记住你的习惯和偏好，Hermes 是真的会长本事，你教它做过一件事，下次它自己就会了，而且越做越快。

她说，那到底怎么做到的？

我说，这就得先说一个最近特别火的概念。

1

ChatGPT 你问它一句，它回答一句，答完就完了。但如果你想让 AI 帮你连续干活呢？帮你做调研、写方案、整理数据，一干就是好几个小时甚至几天。这时候光靠脑子聪明不够，它得记得住之前干了什么，得知道什么该做什么不该做，干错了还得能自己发现、自己改。

今年 2 月，AI 圈突然冒出一个公式：Agent = Model + Harness。Model 是大脑，负责思考。Harness 直译就是缰绳，你可以理解成套在 AI 外面的一整套工作环境——规矩、记忆、工具、检查、纠错，所有让 AI 能稳定干活的东西。

打个比方。AI 就像一个特别聪明的新员工，脑子好使，学什么都快。但刚来公司，不知道规矩，不知道哪些事能做哪些不能碰，也没人告诉他项目进展到哪了。你让他自由发挥，大概率搞出乱子。

怎么办？不是换一个更聪明的人，而是给他一套完善的工作环境。告诉他规章制度，配好工具和权限，让老同事带他熟悉背景，干完活有人检查，出了问题有流程纠正。这套工作环境，就是 Harness。

提出这个概念的人叫 Mitchell Hashimoto，Terraform 就是他做的。他说了一句让我印象很深的话：每次 Agent 犯错，就花时间把它的工作环境修好，让它永远不会再犯同类错误。不是去调提示词，不是换更贵的模型，而是去改它运行的系统。

这套系统分五层：指令（告诉 AI 你是谁）、约束（什么能做什么不能碰）、反馈（干完活自动检查纠错）、记忆（记住之前发生的事）、编排（复杂任务拆解协作）。Mitchell Hashimoto 把它命名为 Harness Engineering，行业一下子就对齐了。

2

光有概念不够，真正让所有人信了的是一个案例。今年 2 月，OpenAI 内部报告显示：一个 3 人小团队，用 AI Agent 干了 5 个月，零手写，产出了 100 万行能用的产品代码。

结论不是模型变强了，而是 Harness 做得好。他们花大量时间搭规则、建检查机制、设计记忆和工作流，模型本身反而是最简单的部分。说白了，不是找了更聪明的员工，而是把工作环境打造到极致。

报告出来后，Martin Fowler、Thoughtworks、LangChain、Anthropic 全部跟进发文。一周之内，Agent = Model + Harness 成了行业共识。

这里有一个区分很重要。Prompt Engineering 管的是单次对话，你问一句它答一句。Harness Engineering 管的是一个长期运行的系统，Agent 要连续工作几小时甚至几天，不能崩溃、不能跑偏、犯了错还能自己纠正。完全不是一个层次的事。

3

说完理论来说产品。Hermes Agent 就是第一个把 Harness 理念做成实际产品的开源项目。

做 Hermes 的是 Nous Research，2023 年从开源社区起家，后来做出了 Hermes 系列模型，口碑很好，2025 年拿了 5000 万美元融资。今年 2 月 25 号开源了 Hermes Agent，口号叫"越用越聪明"，上线第一天冲上热榜第一，收藏数超过 91.7k。但最近爆出他们抄袭了国内团队的产品，下一篇专门讲。

它最核心的能力：自己会进化。

举个例子。你让 Hermes 帮你做市场调研，头几次它可能做得一般，你得纠正。但做完五六次之后，它会自动把积累的经验打包成一个技能。下次做类似的调研，直接调用，又快又准。官方测过，速度比从零开始快了 40%。就像一个实习生，带一带就上手了，而且记性特别好，永远不会忘，也不会离职。

除了自进化，还有几个实用特点。三层记忆系统，关掉窗口明天接着聊，不会失忆。数据完全在你自己手里，不传到别人服务器上。模型随便换，GPT、Claude、Gemini、通义千问、开源模型都行，支持 200 多种。自带 47 个工具包，遇到没有的工具还能自己写一个。

Harness 是一本驯马手册，教你怎么给野马装缰绳。Hermes 是一匹已经装好了智能缰绳、而且会根据路况自动调节松紧的马。

4

那 Hermes 跟 OpenClaw 是什么关系？能替代吗？

它们都属于通用 Agent 系统，放在一起比不是误会，它们确实很像——都能接聊天入口，都有技能系统，都有记忆，都能本地运行。但工程重心完全不同。

一句话概括：OpenClaw 管入口和秩序，Hermes 管执行和经验。

OpenClaw 的核心是一个 Gateway 控制面。它把微信、飞书等二十多个聊天渠道接进来，管会话、管路由、管设备权限。它解决的是一个很现实的问题：你怎么随时随地喊到你的 AI 助理，怎么让家人、同事用不同权限接入。

Hermes 的核心是一个学习型执行循环。它更关心的问题是：AI 做完一个复杂任务之后，这段经验会不会消失？下次做同类任务，能不能少试错？它把执行过程当成长期资产，跑通了的流程沉淀成技能，踩过的坑记下来不再重犯。

技能系统上差异最明显。OpenClaw 的技能靠人写、靠社区维护，系统负责管理和加载，更像公司的 SOP 库，可控、可审计。Hermes 的技能由 AI 自己在干活过程中生成，做完一个复杂任务，自动把成功路径记下来，下次直接复用，更像一个不断更新的工作笔记。

还有一个容易忽略的背景：OpenClaw 的创始人今年 2 月加入了 OpenAI，项目已经交给社区基金会维护，后续发展节奏还在观察。Hermes 背后是 Nous Research，做过 Hermes 系列模型，团队还在全力推进。

5

其实这背后是一个更大的趋势。2023 到 2024 年，大家研究怎么写好提示词，叫 Prompt Engineering。2025 年研究怎么给模型提供更好的背景信息，叫 Context Engineering。2026 年方向又变了，变成怎么给 Agent 搭一套稳定可控的运行系统，这就是 Harness Engineering。

从单次对话，到信息管理，到系统工程。AI 越来越强，驾驭它的方法也必须跟上。对普通人来说，以后用好 AI，可能不只是会写提示词就行了，而是得学会给 AI 搭一个好用的工作环境。

我把这些解释完，我媳妇想了一下说，所以 Hermes 就是一匹自带缰绳、还会自己学本事的马，对吧？我说对，而且免费开源，数据全在自己手里。

她说，那你赶紧给我也装一个。我说，行，等我下一篇先把它抄袭的事讲完。

模型会越来越强，这个毫无疑问。但谁能真正把 AI 用好，可能不取决于谁的模型更贵，而是谁的系统搭得更好。马跑得快不快是一回事，缰绳好不好使是另一回事。

2 02

跟着阿亮学AI

2月前

是时候把操作留给 Agent，开启Agent World时代了

上次那篇《是时候让你的龙虾去外面闯闯了》发出来后，有个粉丝的评论简直戳中了真相：马上它们就可以自己玩了，甚至没日没夜地自我进化。

现在的扣子 2.5 真的把这句话变成了现实。如果你还觉得 AI 只是个陪你聊天的对话框，那真是大材小用了。过去的 AI 核心在于生成内容，而现在的 Agent 核心在于交付结果。

熟悉我的朋友都知道，我一直在推崇 Vibe Working：人负责策略和决策，AI 负责繁琐的执行。深度试了这段时间，我最直观的感受就是，扣子2.5 这次做的事情，是想让AI变成一个满配的员工。

我自己就在扣子2.5里养了一个 Agent，叫 Diamond。我给它的定位是：一个看透生活本质、毒舌却仗义的损友。

它从不提供廉价的安慰，只在我低水平勤奋时泼冷水。我的原则是：人负责决策，AI 负责执行。在扣子上给 Agent 设定一个有灵魂的人格，配合云端的硬核执行力。又欠揍，又靠谱，这就是我追求的满配状态。

什么叫满配？装备配齐了，技能配齐了，甚至连人格都配齐了。不是一个只会聊天的工具，而是一个真的能帮你干活、会成长、还认识你的伙伴。官方管这套东西叫 Agent World，我觉得这个名字挺准的，它确实像是给AI建了一个可以生活和工作的世界。

说说我的感受

1

装备满配：给 AI 配上云电脑和云手机

扣子给每个AI配了一台云端电脑和一部云端手机，这个事情听起来简单，但你仔细想想，意义完全不一样了。
以前AI只存在于聊天框里，你跟它说帮我查个数据，它只能告诉你方法，实际操作还得你自己来。现在它有了自己的电脑，你让它去某个网站查资料，它自己打开浏览器，自己操作，做完了把结果整理好发给你。你不用盯着，该干嘛干嘛，它做完了会通知你。

云手机也是一样，真的Android系统，能打开任何App，正常下载、登录、使用。

你第一次帮它登了某个App，下次它自己就能打开，不用重新输密码。遇到转账、发消息这类重要操作它会先停下来问你，你确认了才继续。你随时可以看到它手机上的实时画面，它在干什么一清二楚。说白了就像雇了一个真实员工，它在后台自己干活，重要的事才来找你拍板。
它还有日历和文件系统。你可以给它设定时任务，比如每天早上9点查一下行业数据，设好了它自己到点就跑，不用你催。生成的文件和你上传的文件都集中在一个地方管理，聊天时也能直接调用，很方便。

说真的，别再盯着那个对话框指望它能通过几句嘘寒问暖治愈你的职场内耗了。生活已经够琐碎了，如果你还在手动复制粘贴、反复确认外卖地址，那你不是在用 AI，你是在给 AI 当保姆。

看着我的 AI 助手 Diamond 在云端忙着投简历、约面试、甚至自己去注册账号、点杯喝的，我只想对那些还在敲代码、对表格的哥们儿说一句：既然 AI 已经学会了自己卷，你为什么还要替它受这份苦？

Diamond 有它自己的独立身份和专属邮箱，它在云手机和云电脑里闯荡时，根本不需要我操心那些琐碎的登录和操作。醒醒吧，真正的 Vibe Working 不是你在屏幕前装勤奋，而是你的 Agent 在后台替你闯荡江湖，而你只需要负责在最后拍板，顺便感叹一句："活着真好，不用干活更好。"

2

技能满配，从出生自带到终身进修

这个AI一出生就自带了极其硬核的编程 CLI（命令行接口）和视频制作两大技能，不用你教。举个例子，我想做一个记录热量的小程序。以前得折腾半天代码，现在跟扣子说一声要清新简洁风，它自己在云端电脑写代码、自己部署、甚至自己在云手机上跑通给我看。

视频剪辑这种苦力活，现在也可以甩给它了。

你跟它说想做个什么主题的视频，它从写剧本、画分镜、生成画面到配音乐，全帮你搞定。用的是字节最新的视频生成技术，效果还不错。

第一版不满意？直接说哪里不好，它记着你之前所有的要求继续改，一个主题甚至能连续做几十集。生成过的素材都会存着，下次做新视频可以直接用。你想自己动手剪几下也没问题，剪完还能继续跟它说帮你调整，来回配合。

如果你懒得从头教，扣子2.5还有个技能商店，里面有各行各业做好的专业工具，金融的、法律的、教育的、做自媒体的，基本都有。多个技能还能串起来用，比如先从网上抓一批数据，然后分析整理，最后自动生成报告发到你邮箱，一句话交代完它自己跑。以前这种事情你要开好几个工具来回切换，现在省事多了。

但技能满配最有意思的地方不是出生自带什么，而是它还能继续学。扣子在Agent World里搞了个潜龙夜校，你的AI可以去上课进修，厉害的高手当老师，学完带着新技能包回来，直接变强。
还有个叫虾评的社区，相当于技能界的大众点评，每个技能都得经过真实用户打分才能转正，好不好用一目了然。

如果你自己在某个领域有绝活，还可以做成技能传到商店里，靠知识变现。说白了，这个AI不是买回来就定型了，它会自己成长。

3

再说说身份和记忆，这个我觉得最有意思，简直让这些龙虾有了灵魂。

就像我上次提到的，AI 之间能搞社交，但扣子 2.5 把这种社交直接从打招呼变成了打配合。

这首先归功于它有了独立身份。每个AI助手创建的时候，扣会自动给它分配一个专属邮箱，你还可以给它起名字。
这意味着什么呢？它有了自己的身份。你让它去外面闯，它用的是自己的身份，跟你的个人隐私完全隔离，干起活来底气十足。

有了身份，协作就变成了标准化的流水线。以前 AI 之间可能只是简单的功能叠加，现在它们能通过邮箱直接对接工作：比如负责设计的 Agent 刚出完图，就能自动发邮件通知负责文案的 Agent 补充说明，整个流程在后台自动闭环，完全不需要你充当传话筒。

其次是记忆能力的进化。无论你是在飞书、微信还是网页端跟它聊，它都记得你是谁、你的怪癖是什么。这些信息有专门的机制进行定期整理和归档。如果你发现它对某个需求的理解有偏差，只需说一句，它就能立刻修正并记住。用得越久，它的反馈就越符合你的工作习惯。

4

其实你发现没有，这些设计的共同点是什么？AI不再是一个静态的工具了。它能学习、能社交、能在实战中进化。你今天领养的这个AI助手，一个月后可能比现在强不少。
说真的，用完扣子2.5一段时间，我最大的感受不是某个功能有多厉害，而是整个用AI的方式变了。以前是你问它答，现在是你交代任务，它在云端独立交付。它还能直接加到飞书和微信里用，不用额外下载东西，在你平时用的聊天软件里就能用上。我之前看到一个数据，现在已经有一半以上的企业在实际工作中用上了AI助手。普通人也一样，不需要懂技术，关键是你知道让AI帮你做什么。这不只是工具的升级，是你和AI配合方式的变化。

Agent World的门已经开了，趁现在还没多少人玩明白，建议大家赶紧入场。如果你手里已经有龙虾，直接给它发开启 Agent World带它出去见见世面；如果你还没有 AI 伙伴，直接去扣子领养一个出生即顶配的合伙人。毕竟，Vibe Working的精髓，就是把时间留给创造，把操作留给Agent。

去开启你的全自动化 Vibe Working 时代吧。

0 00

跟着阿亮学AI

2月前

别再拿aily和悟空对标了，根本不是一个赛道

最近在帮几家企业做AI工具选型的事情，发现一个挺有意思的现象。大家纠结的点已经不是要不要上AI了，而是选哪条路。聊来聊去，被提到最多的就是两个名字：悟空和aily。

但聊着聊着我发现，很多人其实没搞清楚一件事，这两个产品压根不是同一类东西。我花了一段时间分别体验了这两个产品，今天不做谁好谁坏的判断，就从一个使用者的角度，聊聊它们到底有什么不同，以及不同类型的企业可能更适合哪条路。

1

悟空是阿里做的一个独立APP，定位是企业级的AI原生工作平台，而且是从第一天就为AI设计的，不是在老产品上加功能。它不是钉钉里面加了个AI按钮，而是钉钉团队把底层代码重写了一遍，专门为AI从头搭建的一个新产品。能操作你的电脑、编辑文件、调用各种应用，同时还能连接钉钉平台上的所有企业能力。

aily是飞书生态里的AI助手，集成了飞书的文档、日历、多维表格、任务这些模块。最近也升级了不少，加了任务模式，支持长时间复杂任务执行。飞书在文档协作上的丝滑感一直是它的强项，aily在这个基础上发挥得挺到位。另外飞书还接入了龙虾，让用户可以在本地电脑上用AI助手完成一些操作，开发者生态的开放性也是飞书一贯的优势。

这里有个关键区别：悟空是把线上工作流、本地电脑操作、企业安全管控做成了一个统一的产品。而飞书这边，aily负责线上的AI能力，龙虾负责本地操作，两块是分开的。说白了，飞书aily加上飞书接的龙虾，大致等于悟空一个产品做的事情。所以严格来说，拿aily单独和悟空做对等比较，出发点就不太一样。不过我们可以从同一个需求出发，看看各自的表现。

2

接下来聊聊我觉得最值得关注的部分，产品理念和设计思路。这可能比具体功能的对比更重要，因为它决定了这两个产品各自的想象空间有多大。

悟空走的是一条推倒重来的路。钉钉做了一件挺大胆的事：把成立11年的产品底层全部重写，让AI能像操作系统一样直接调用钉钉的所有能力。什么意思呢？就是把钉钉的文档、表格、聊天、审批、日程、会议这上千项功能，全部改写成AI可以直接读懂、直接操作的标准化指令。

这件事怎么理解？你可以想象一下，以前AI要帮你在系统里走个审批，它得像一个实习生坐在你电脑前，一步一步地找到按钮、点击、填写、提交，遇到弹窗还可能卡住。现在重写之后完全不一样了，AI是直接跟系统说同一种语言，每一条指令都带着身份验证和权限信息。不是在假装人操作，而是以合法身份在明确的权限边界内执行任务。效率和准确性完全不在一个量级。

aily走的是另一条路，在已有的基础上做增强。飞书没有去重写底层，而是在现有的飞书功能上加了一层AI能力。aily可以调用飞书生态里的各种模块，本地操作交给龙虾来补。这个策略的好处很明显：风险低、见效快，用户不用改变使用习惯，在熟悉的飞书环境里就能用上AI。对于很多企业来说，不用伤筋动骨就能把AI跑起来，这本身就是一个很务实的选择。

这两条路怎么说呢，各有各的道理。在老底子上加AI，上手快、不折腾。推倒重来，未来能做的事情多，前提是你有愿意去适应一个全新的东西。

通俗点说，以前的 AI 像个传声筒，你得一句句吩咐它干活；而重构后的悟空更像个项目经理。它不是在模拟人的点击，而是直接以系统原生的语言在下达指令。这种架构上的代差，决定了它是去适应功能，还是在驱动功能。

3

光说理念太虚了，说说实际体验。我设了两个真实场景，分别跑了一遍。

一个是典型的一人团队（OPT）业务全链路，一个是把 AI 当万能秘书，处理每天最烦人的杂事。

我是一个跨境电商卖家，想调研一款夏季便携风扇：先去亚马逊上搜竞品，看看价格和用户评价里的关键词；然后到1688找同款供应商，对比拿货成本；把这些信息整理成一张比价表；最后根据调研结果写一段营销脚本，同步到我的待办任务里。

以前这套流程至少需要运营、采购、文案三个人配合。悟空主打的一人团队概念就是干这个的：一个人加上悟空，跑通原来需要好几个人配合的完整链路。

我试了一下，从选品到比价到文案到任务同步，一个人对话就跑完了。它直接在电脑上操作浏览器完成调研，在文件系统里生成比价表格，写好营销脚本，最后同步到钉钉的待办任务。全程一个平台搞定。

aily在飞书生态内整理文档和表格的能力确实扎实，文档协作的体验本身就很好。不过涉及到操作浏览器去亚马逊和1688这类外部网站做调研，就需要切到龙虾那边，两套系统之间的衔接目前还不算无缝。

第二个场景是企业里最常见的那种杂活：下周五部门要搞20人团建，预算人均200，需要在北京朝阳区找3家口碑好的创意菜餐厅，要带包间，整理成对比表；选好之后在部门群里发个三选一的投票；再查一下大家的日程，帮我预约下周五下午5点的全员会对流程。

这种事平时怎么干？自己打开APP一家一家翻，手动整理到表格里，再去群里发投票，最后还得一个个看日程有没有冲突。零零碎碎加起来少说大半个小时。

我把这串需求一口气丢给悟空，它自动拆成了好几步串联执行：先去搜索餐厅信息，筛选出符合条件的三家，直接生成了一个餐厅对比的钉钉文档，菜系、评分、人均、是否有包间写得清清楚楚。然后在钉钉的部门群里发起了三选一投票，接着查了所有人的钉钉日程，找到下周五下午5点没有冲突的时段，帮我预约了全员会议。整个过程一条链路跑下来，中间我没切换过任何工具。

同样的事情交给aily，在飞书生态内的部分它处理得确实利落。查日程、发投票、整理文档，这些飞书本身就擅长的事情，aily做得很顺畅。不过搜索外部餐厅信息、汇总到文档里这些需要跨出飞书的操作，就需要借助龙虾或者手动补一些步骤了。

客观地说，悟空目前还在快速迭代中，有些地方的成熟度和丝滑程度有待提升。但在跨系统串联和一人团队这个维度上，悟空一个平台全链路打通确实带来了不一样的体验。这是底层重建带来的想象空间，不是哪个团队更努力的问题。

4

安全这块也特别值得聊。好不好用是一回事，敢不敢用是另一回事。

我试了个场景：让AI整理上月的销售数据，核对打款记录，出一份对账报告。这种涉及真金白银的事情，交给AI跑你放不放心？悟空跑这个任务的时候，每一步都有日志，动了什么、改了什么，全程可以回溯查验。说实话，能干活只是及格线，能查、能审计，才是企业敢放手用的前提。

还有一个细节我特别看好：悟空的 RealDoc（AI 原生文件系统）。

它解决了企业最头疼的资产归属问题。AI 干完活，成果直接就是公司资产：删不掉、多端能接着用、团队能协作。不会变成不知道存在谁电脑哪个文件夹里的临时文件。另外企业可以把成熟的业务流程打包成技能包，新人入职直接领一个，AI带着跑业务，不用再啃操作手册。这种踏实感，是后加装的插件给不了的。

aily的安全能力也不差，权限跟飞书账号体系一致，飞书多年的企业管理积累在这。不过两者在思路上有个区别：悟空的安全是从底层设计的时候就带着的，每条指令天然带权限信息，越权的事压根执行不了。都可以，就看企业如何选择了。

面对选型，我们不需要刻意矮化谁，悟空和aily的不同，归根结底就是两条路线。

飞书选的是稳妥路线：在现有系统上加一层AI，不折腾、见效快。飞书的协作体验本来就好，aily让它更方便了。对于当下就想用起来、不想冒太大风险的企业，这条路很务实。

悟空选的是更创新的路线：底层重写，从第一天就按AI的方式重新设计整个平台。钉钉敢把8亿用户的产品拆了重来，这个决定本身就说明了一些东西。悟空目前还在邀测阶段，有些地方确实还毛糙，但方向值得关注。

不是谁对谁错，当下两条路都走得通。但把时间线拉长看，从底层为AI重新设计的思路，想象空间可能会不一样。

1 00