即刻App年轻人的同好社区
下载
App内打开
陈惑仔Harry
117关注1k被关注1夸夸
Plaud AI产品经理🤖
关注AI与人类🧘🏻
热爱真知📖
置顶
陈惑仔Harry
2月前
Native AI产品经理呕心沥血将终身所学浓缩成11张图(上)

写了整整一天,应该是全网最细致的写生产用Prompt的指南了
除了大框架,把所有能想到的细节、可能踩的坑都写上了

相关资源:
- LLM-as-a-Judge(LaaJ)经典论文:arxiv.org
- Claude官方Prompt Engineering完整方法:platform.claude.com
- Claude Console Prompt生成器:platform.claude.com
- 字节Prompt Pilot:promptpilot.volcengine.com
849
陈惑仔Harry
2天前
小陈老师带你看懂 Claude Code Openclaw
- OpenClaw的底层设计几乎完全复刻了 Claude Code。因此想看懂龙虾不看懂 Claude Code 是不可能的。
- 只要耐心读完这篇文章,你就能看懂 Claude Code(真的!我保证!),因为【它的内核其实非常简单】。

一、一切的起点:ReAct 循环

所有的 Agent,不管名字叫得多花哨,内核都只有一个极其枯燥的循环:【ReAct (Reason + Act) 循环】。

为什么是 ReAct?这其实是在【模拟人类解决未知问题的本能】。

想象一下你策划一场线下活动的过程:先想(场地还没定,得搜一下这附近的酒店) -> 动(用手机搜关键词) -> 看(系统返回了几家酒店的名字和价格)。如果都不满意,就根据新返回的结果,换个关键词,继续想,继续动。

Claude Code 的基本盘,就是把这种本能,塞进了一个代码的 `while(true)` 循环里。

在模型内部,实际发生的只有这一件事:

1. 推理:我需要了解这家公司的财务状况。
2. 行动:执行“搜索最新财报”的指令。
3. 观察:拿到几十页的文字报告。
4. 推理:看到了“净利润”这一段,我得提取出具体数字。
然后,【循环往复】。

我们可以用一张图来表示这个最基础的循环:

┌─────────┐
agentic loop

Your prompt


[推 理]


[行 动]


[观 察]

─┘ (循环)


Done

You: interrupt
└─────────┘

但是,如果仅仅只有一个循环,它什么都干不了的。一个裸机循环,就像一个没有记忆、没有手脚的人。

要让这个循环变得真正智能和强大,我们就需要往这套架构里“加料”。这就是整个 Agent 框架设计的核心:【扩展(Extensions)】。

二、向外扩展:沿着正交维度“加料”

怎么加料?并不是胡乱塞功能,在 Claude Code 的设计里,扩展是沿着明确的【正交维度】进行的。

仔细看上面的 ReAct 循环,这个循环里有两个最关键的约束瓶颈:

1. 模型脑子里知道什么?(【Context 维度】)
2. 模型手里能干什么?(【Action 维度】)

所以,前三种扩展,就是分别针对 Context 扩充脑容量,以及针对 Action 扩充手脚。

(为了看清每一个扩展的本质,下面的每一个概念,我们都会沿着四个标准维度来扒开它:扩展了什么?继承主 Context 吗?结果流回主 Context 吗?何时加载?)

首先,是解决“脑子里知道什么”的两个扩展:CLAUDE.md Skills。

概念 1:CLAUDE.md

- 扩展维度:Context(给脑子加料)
- 继承主 Context:是
- 结果是否回到主 Context:直接在主 Context
- 加载时机:【启动时常驻加载】

这是最基础的扩展。你可以把它理解为公司的【新员工入职手册】,或者贴在工位上的团队纪律。它通常包含做事的最高原则、公司的行文规范格式。因为极其重要,所以在每次沟通启动时,它就会被完整加载进上下文里,时刻提醒着大模型。

概念 2:Skills

- 扩展维度:Context(给脑子加料)
- 继承主 Context:是(默认)
- 结果是否回到主 Context:直接在主 Context
- 加载时机:【两阶段加载】(启动时加载名字,按需加载全文)

仅仅有工位上的纪律标语是不够的,做大项目需要极深的专业知识(比如长达几万字的税务合规审查表)。如果把这些也全塞进对话刚开始的语境里,大模型的大脑很快就会被海量的信息撑爆。

所以,Skills 用了一个极其聪明的“两阶段加载”:启动时,只告诉模型系统库里有哪些【技能名称】(比如“有税务审查技能”,只占极其微小的存储空间)。等到模型真正做任务时决定要审查税务了,它才会去把那份【长长的明细拉进脑子】里。

解决完“脑子”的问题,接下来解决“手脚”的问题。

概念 3:MCP (Model Context Protocol)

- 扩展维度:Action(给手脚加料)
- 继承主 Context:是
- 结果是否回到主 Context:直接在主 Context
- 加载时机:【启动时常驻加载】

原生的基础模型,就像是被关在黑屋子里的人,只能跟你聊天。但真实的打工人需要看邮件列表、发内部软件消息、去云盘找文件。MCP 就是那个打破物理结界的【外挂工具箱】。通过标准的协议,大模型获得了直接读写外部软件的真实的“手和脚”。需要注意的是,MCP 的可用工具列表是在一次沟通刚开始就会注入的,所以给工具箱加太多工具,也会让大脑变得沉重。

讲完了在同一个大脑(主 Context)里加记忆和加手脚,Agent 会遇到下一个棘手的问题:如果有些任务过程极为繁琐、容错率又低,放在主循环里会导致主思路被干扰,该怎么办?

这就引出了另一个完全不同的扩展维度:跳出当前循环,开辟【独立 Loop】。

这就是 Subagents Agent Teams。

概念 4:Subagents

- 扩展维度:独立 Loop
- 继承主 Context:否
- 结果是否回到主 Context:【仅摘要返回】
- 加载时机:按需启动

理解 Subagents 最好的方式,就是把它看作主治医生安排去给病人做几百项常规化验的【实习生】。主治医生(主脑)根本不想看长篇累牍的几百张化验单,它开一个新的隔离思路(实习生),分派任务。实习生自己在那个循环里折腾着去对每一项指标,最后只带回一句话:“老板,各项指标正常,但血脂偏高。”这就通过任务隔离,极大地保护了【主脑思路的清晰度】。

概念 5:Agent Teams

- 扩展维度:独立 Loop
- 继承主 Context:否
- 结果是否回到主 Context:【双向消息对谈】
- 加载时机:按需启动

如果 Subagents 是上下级派发任务,Agent Teams 就是拉平级的【同事协作】。当面临一个极其复杂的新产品上市攻坚战时,你可能需要一个专门想营销创意的脑子和一个专门算利润表格的脑子。让他们独立运行,并在一个频道里交叉质疑、相互讨论,最后由一个统一的主流脑子得出结论。它用于解决极高并发的【并行分析】和【对抗讨论】挑战。

(讲到这儿,其实我们也就把市面上所有的外挂插件和所谓“多智能体系统”给说透了,万变不离其宗。)

三、治理层:在循环之外立规矩 (Hooks)

前面我们讲的,无论是扩展 Context、扩展 Action 还是开辟独立 Loop,都是在解决“能力上限”:让模型变得更聪明、手更长。

但在真实世界里,能力越强,没有规矩就越危险。这就是 【Hooks】 存在的意义。

很多研究 Agent 的人会把 Hooks 误认为是跟 Skills 一样的东西,这是大错特错。因为 【Hooks 根本就不运行在大模型的循环里】!

要理解这一点,你得先知道,模型脑子本身只是在做决定,并不直接执行动作。当模型决定“去给全员发一封邮件”时,它只是生成了一行表示“我要发邮件”的文本请求,真正跑去点发送键的是外面的“执行层”(也就是串联框架的那层代码程序)。

Hooks(钩子),就是硬性写在这层外部“执行层”里的【死规矩】,完全不受大模型是否聪明或者是否胡说八道的影响。你可以把它理解为流程审核里的“死卡点”:

1. 【拦截危险动作(事前拦截)】:
当大模型因为产生幻觉,决定在凌晨三点给客户群发未定稿的营销短信时,在这条指令到达短信系统前,外层的 `事前` Hook 审核程序会强行截获它,直接卡死阻止发送,并给大模型甩一句提醒:“非工作时间,禁止外发”。

2. 【旁路附属动作 (Side Effect)】:
当大模型刚刚艰难地总结完了一份长篇合同,`事后` Hook 可以在不干扰大模型继续工作的情况下,在后台悄悄调起一个自动排版工具,把生成的干瘪纯文本刷成带标题、带颜色的极佳排版。

3. 【强制控制流程 (Flow Control)】:
当大模型觉得“我已经把方案写好了可以交差结束了”,`结束前` Hook 会拦住大模型,自动跑一遍字数和格式检查,如果发现缺斤少两,就不管大模型怎么说,直接把它踢回循环里继续重写。

一言以蔽之:【前面的扩展,决定了 Agent 能做什么;而 Hooks 这套强制的外层治理逻辑,决定了 Agent 绝对不能做什么】。前者是赋能,后者是合规。

四、分发封装:Plugins

通过上面的全套组合拳:ReAct 循环(底座) + Context/Action/Loop扩展(能力) + Hooks(规矩),你其实已经打造出了一个针对你们公司业务完美适配的高级虚拟员工智能体。

这就带来了最后一个环节:你怎么让其他不那么懂技术的人也能一键用上你的这套系统?

答案就是 【Plugins】。

Plugins 没有任何自己的新能力。它的本质就是一个【打包箱】。把前面你配得最好的 Skills 知识点、连好的 MCP 数据飞线、以及写死的 Hooks 后勤规矩一起扔进箱子打包。别人一拆这个插件安装,一个完全成型的老手员工一键就位。至此,整个 Agent 的设计和分发生态【闭环】完成。

五、总结

读到这里,相信你已经掌握了研究 Agent 的核心框架。
【内核是什么、加了什么能力的维度、如何治理风险?】

再梳理一遍那条贯穿所有的线索:

1. 一切的起点,是极其简单的 【ReAct 循环】(想-动-看)。
2. 在循环之上,我们沿着 【Context 脑容量】和 【Action 手脚】的正交维度,以及开辟【独立 Loop】小分队的设计,给它无限添加能力。(CLAUDE.md、Skills、MCP、Subagents、Teams)。
3. 在能力之外,我们跳出模型,在执行层用 【Hooks】 加上强硬而确实的死规矩,实现闭环。

没看懂的同学去评论区答疑。
21
陈惑仔Harry
3天前
最近不少投资人、开发者、产品经理、爱好者配置了 OpenClaw,但使用体验并不好。原因可能是SOUL.md这种 System Prompt 的编写过于依赖直觉,缺乏结构。
工业级的 Prompt 优化是一套严谨的工程方法。
生产环境下的调优可概括为三步走:
1. 制定基准测试(Benchmark)
2. 构建初始 Prompt
3. 基于 A/B 测试循环迭代
核心总结【优秀的 Prompt 是测出来的,不是一次性写出来的】

1. 核心机制:LLM-as-a-Judge
面对海量测试样本,人工评估极不现实。解法是让 AI 充当“阅卷人”。
产品经理作为“出卷人”定义量化标准:维度 + 权重 + 评分细则。

例如「AI 减脂建议」的评测标准:

- 有用性 70% + 易操作性 20% + 情绪价值 10%

- 细则量化:3分(学术验证有效),2分(多数人有效),1分(无效)。

2. 评测提示词(Judge Prompt)的最佳实践
构建“阅卷人”的标准操作:

- 解耦维度:每个维度独立编写 Prompt 并分开调用 API,避免模型注意力分散。

- 结构化:使用 XML 标签(如 <task>, <examples>)隔离指令。

- 对齐人工:提供覆盖高低分的 Few-shot 示例,先人工打标 10-20 条,对比 AI 打分直至标准对齐。

- 稳定性:Temperature 务必设为 0。

3. 生产提示词(System Prompt)的结构化写法
推荐采用标签化的 xml 模块写法:

<role> 设定系统角色
<task> 明确核心任务
<guideline> 分步拆解执行逻辑
<examples> 提供多场景的 Few-shot
<format_requirement> 约束输出格式

优势:结构清晰,便于后续控制变量进行单模块的优化与实验。

4. 科学迭代:控制变量法
A/B 测试的核心在于控制变量。切忌同时修改多个模块,否则无法归因提升来源。

正确的迭代路径:

分析低分 Case -> 判断是通用逻辑缺陷(General Case)还是边缘场景(Edge Case) -> 抓主要矛盾 -> 单独修改影响最大的段落(如只改 Guideline) -> 重跑 Benchmark 验证。

5. 工程实践与产品反思
大批量跑测时的避坑指南:

- 务必使用多线程并设定 Checkpoint 定期存档,采用 append 模式写入,避免异常中断导致数据丢失。

- 如果调优毫无起色,需反思任务本身是否具备可行性(Practical)。

- 如果一两次就拿满分,需检查评估标准是否过于宽松。

最后的最后,AI 只是工具,即使机评分数达标,仍需进行人工抽样走查,对最终结果负责,判断表现是否在Use Case上是否符合预期。Overall it's taste that matters.
015
陈惑仔Harry
7天前
要我说高达动画就是预言家
OO里的中东暴乱、超级智能介入就不说了。自动杀人机、硬件陪伴、量子计算不是一个个都实现了,亚、美、欧三极也差不多了。

还有seed里的人造子宫、基因编辑、太空移民、移民和地球人的矛盾…

可惜人类就是无法从历史里学习。
23
陈惑仔Harry
9天前
能这么清晰地剖析自己已经很厉害了。也更佩服张一鸣的想象力是天空,同理心是地基,中间是逻辑和工具

刘勿锋: 细节人人看得见,宏观人人会模仿,真正难的是把两者串成成果的能力。 最近慢慢意识到,我常常活成两个极端,像坐在一辆没有自动驾驶的车里:方向盘一会儿被想很多的我抢走,一会儿又被忙到飞起的我抢走。 先说第一个我:爱抬头看天。 我能把行业、机会、竞争、路径讲得像在做路演:现在该做什么、以后该做什么、什么是关键、什么是噪音。越想越顺,越想越有劲儿,脑子里像开了发布会——台上我讲得热血沸腾,台下未来的我疯狂鼓掌。 可一旦要把它写进日历,变成今天就做这一件,我的手就卡住了。不是不会做,是突然觉得:再想想吧,想得更稳一点,方案更漂亮一点,万一做错呢? 于是我继续打磨。打磨到最后,逻辑越来越圆,行动越来越少。 就好像,我最擅长的不是战略,是战略的想象。 成了思想的巨人,行动的矮子。 这不是没计划,只是把计划当成了完成。 第二个我呢,低头忙地。 我会陷进细节里:客户报的问题一条条抠,客户需求一轮轮聊,研发进度一件件盯。每天都像在救火:这个崩了、那个卡了、谁又不满意、哪条链路又出问题。我也确实很能扛,很能推进,很能把事情做完。 但忙着忙着,我会突然抬头发愣:我到底要去哪?我做的这些,怎么连成一条路? 然后更荒诞的一幕出现了:我不是不想思考路线,是我根本没空思考路线。 忙碌像一条毯子,盖住了那个刺痛的问题:我以为我在前进,其实我只是在不停原地练习高抬腿跑步。 细节能让我感觉有用,但不一定能让我有方向。 后来我才明白,细节和宏观都很容易得到。 细节太容易看见了。每天都有人提醒你:这里错了、那里卡了、这个需求要加、那个版本要赶。你只要活着上班,就会被细节追着跑。 宏观也很容易看见。网上太多了:框架、方法论、行业报告、成功故事。你把几段话拼起来,也能说得像模像样。宏观甚至是一种很省力的努力感,站在高处讲两句,就显得你懂,显得你在掌控。 但真正稀缺的是第三件事。 把细节里的真实摩擦,和宏观里的方向判断,串成一条能落地、能验收、能产生增量的路径。 这件事很难装,因为它会立刻被现实打脸:到底有没有成果,数据、客户、团队状态都会说话;它也很少人系统性分享,因为不够性感;更因为只看分享没用,得自己动手,在噪音里取舍,在慢反馈里坚持。 路线会让人短期变得不体面。 你会从什么都能解释,变成先做一个不完美的选择;从每件事都能推进,变成很多事不得不忍痛不做。 所以这道坎最狠的地方不是方法,是心理。 我得承认,我没法同时要确定、要体面、还要稳赢。 我现在更愿意把这段卡住,理解成能力进阶的必经卡点。 当你还停留在初级阶段,细节就够你忙; 当你只想显得成熟,宏观就够你讲; 但当你真的要往上走,你必须回答一个更难的问题:我每天看到的这些细节,到底要服务哪个结果?我口头说的那些宏观,到底能落在哪个成果? 而这个问题没有统一模板,没法照抄。它只能在一次次真实取舍里长出来。 回头看,我不是不努力,只是把力气用在了两个更容易让我不受伤的位置上:把天上的故事讲得越来越顺,把地上的任务做得越来越满。 可我的路仍然在中间。 我终于发现:想明白,不等于开始;做很多,也不等于在走。 真正的路线,不在脑子里,也不在救火里。 它在我愿意承认不确定的那一步里。 我不缺天空的故事,也不缺地面的琐碎。缺的,是一条把天空落到地上、又能从地上长回天空的路。

00
陈惑仔Harry
12天前
今天看了《下一个是谁》第六季的最后一集,太好看了、太热血了。
突然联想到从我初中开始,b站up主之前的团和团综总是因为某一个人塌房:
鬼畜四大天王(白鼠、狮子),游戏区F4(番茄、某幻、花少北、Lex),360(少爷、六道、狮子),变形兄弟(福乐、老坛),青春旅行团,下一个是谁...

为什么下一个是谁能这么持久?
可能是因为他们只一起做这一个综艺,平常互相有空间、专注自己的频道;
可能因为每个人渐渐粉丝数势均力敌;
可能因为他们起家的经历很像、更聊得来;

但我隐隐觉得就是一种年轻人的真诚。
一种少年热血的真诚。
一种比起回报、更看重把事情做成的真诚。

少年心气是不可再得之物。
祝他们越办越好。
愿奋斗路上充满真诚。
00
陈惑仔Harry
13天前
Gai和功夫胖的新歌《山歌王》的副歌也太喜欢了
有一个自己的特色、哪怕别人觉得土、听不懂,也比没有特色好多了
因为时间的复利会带给你独一无二的对特色的理解,把它慢慢融合到一个处于特色/共识的边界
感觉很多领域的成功都是从认识自我开始
00
陈惑仔Harry
16天前
我宣布皈依孙教了
31
陈惑仔Harry
16天前
新SEO
1. Web search工具的算法
2. 针对算法优化的链接
3. agent友好型基于代码的文档

陈惑仔Harry: 看开年这架势今年不是Agent Infra大年,应该是Agent经济大年

00
陈惑仔Harry
20天前
【行为经济学思维模型:一套可推演的公理系统】
芒格的"25条人类误判心理",你背得出几条?
我赌大多数人的答案是:零。

不是因为记性差。是因为那张清单——尽管精彩——本质上是一堆孤立的概念。它告诉你"人有损失厌恶",但没告诉你损失厌恶和锚定效应有什么关系;它告诉你"人会高估小概率",但没告诉你这跟双系统理论怎么接在一起。
我花了好几年想解决这个问题。

高二的时候,因为原生家庭的事,我开始读心理学自救。《爱的艺术》是入门,后来进化心理学、社会心理学、《思考快与慢》……书越读越多,概念越记越杂,但始终感觉缺一根线把它们穿起来。

后来到哥大商学院读价值投资,自然读到《穷查理宝典》。芒格那张思维清单让我激动了一阵子。但激动完,问题依旧——25条,我记不住,更用不出来。

直到最近读《人类简史》,有一个想法击中了我:
人的所有心理结构,都是被进化塑造的。大脑不是白纸,是一台在远古环境里被调校过的机器。

如果这是真的,那行为经济学里那些散落的"偏差",就不应该是孤立的bug,而应该能从少数进化原则出发,一层一层推出来。

这篇文章就是我花一周做的尝试:把行为经济学从一张偏差清单,改写成一套可推演的公理系统。
我不确定这个尝试有多成功。但至少对我自己来说,它让那些散落的概念第一次有了逻辑上的位置。

一、为什么要做这件事?

清单和公理系统的区别,像"背单词"和"学语法"的区别。

背单词,你只能说出你背过的句子。学语法,你能造出你从未见过的句子。

行为经济学的流行版本是一本单词书——损失厌恶、锚定效应、心理账户……100多个概念散落着,用到哪个想起哪个。

但如果你有一套语法呢?

二、结构总览

这套框架分五层。

第零层只有一条——进化适应性。它不参与具体推演,但能帮你判断"这个偏差在什么情境下更强或更弱"。

第一层是两个硬件约束:双系统处理、有限认知资源。解释"为什么启发式必然存在"。

第二层是四个价值计算偏差:参照点依赖、损失厌恶、敏感性递减、概率加权。这四条合起来就是前景理论,行为经济学最硬的内核。

第三层是时间与社会维度扩展:双曲贴现、社会效用。人不只活在一个时点、一个人的世界里。

第四层是四个启发式规则:可得性、叙事偏好、表征依赖、自我一致性。前八条告诉你大脑会走捷径,这四条告诉你大脑走的是哪条捷径。

最后一节,我会分享几个我自己用这套东西的真实场景。不一定对,但是我实际的思考过程。

第零层:元约束

先接受一个前提:

所有偏差,都是远古环境里演化出的适应性策略。

我们祖先的生活:小部落,一辈子见不到几百人;草丛里可能藏着狮子;没有统计局和互联网;今天吃了明天可能没有。

在那个环境里,"偏差"不是bug,是feature。

对小概率威胁过度反应?这救过命。对损失比收益更敏感?这帮你活下来。用容易想到的例子做判断?在信息匮乏时,这是唯一可行的策略。

但我们现在活在完全不同的环境里。

超市有一万种食物,可你的大脑还在为"今天吃不上怎么办"焦虑。你知道定投指数基金长期收益不错,可暴跌时还是忍不住割肉。你明知DeepSeek只是技术突破不是世界末日,看到英伟达暴跌27%还是心慌。

这就是【环境错配】。

偏差不是"大脑坏了",是"大脑没来得及更新"。它们在现代环境中系统性地偏离"理性"——但偏离方向是可预测的。

可预测,意味着可利用,也意味着可防范。

这是整个框架的根基。

第一层:两个硬件约束

在讨论"大脑怎么计算价值"之前,先要理解大脑这台机器本身的限制。

1. 公理1:双系统处理

你的大脑运行两套系统。

- System 1:默认运行。快速、自动、情感驱动。高吞吐、低精度。不费力。
- System 2:需要主动激活。缓慢、费力、逻辑驱动。低吞吐、高精度。容易疲劳。

绝大多数日常决策由System 1完成。System 2只在被显式触发时介入。

一个常见场景:深夜刷到一个"改变人生的课程"广告,主讲人西装革履、金句频出,你当场就想付款。第二天早上醒来再看——这不就是成功学换了个PPT模板吗?

System 1被故事打动了。但故事不是事实。

顺着System 1设计,能让决策更流畅;激活System 2,能让决策更审慎。但后者成本高,且不可持续。

2. 公理2:有限认知资源

注意力、工作记忆、计算能力都是稀缺资源。

- 大脑必须对信息做筛选和压缩。
- 必须使用启发式(heuristic)而非完整计算。
- 人不是效用最大化者,而是"满意即止"(satisficing)的决策者。

翻译成大白话:人不会算到最优解,只会算到"够好了"就停。

为什么AI产品都在做"精选回答"而不是给你十个选项让你挑?因为AI能生成无限内容,但用户的注意力有限。给一个90分的答案,比给十个60-100分的答案让用户自己挑,体验好得多。

这一层的功能:解释"为什么启发式必然存在"。既然大脑默认用System 1,既然计算资源有限,走捷径不是例外,是常态。

下一步:大脑走捷径时,怎么计算"价值"?

第二层:四个价值计算偏差

这四条合在一起,构成【前景理论】的完整描述。这是行为经济学最硬的部分,拿了诺贝尔经济学奖的那种硬。

1. 公理3:参照点依赖

人不评估绝对水平,只评估相对于某个【参照点】的变化。

参照点可以是现状、预期、他人的状态、或者被外部设定的锚。

几乎所有SaaS产品都是三档定价:基础版$9、专业版$29、企业版$79。中间那档通常是真正想卖的。基础版是"锚点下限"——让专业版显得功能丰富;企业版是"锚点上限"——让专业版显得性价比高。

这就是诱饵效应。诱饵本身不需要被选择,它只需要存在,就能改变其他选项的相对价值。

OpenAI的API定价也是这个逻辑:GPT-4o是主力,GPT-4o-mini让它显得功能强大,o1-pro让它显得价格合理。

移动参照点,就能改变人的判断。这是定价、谈判、融资的核心杠杆。

2. 公理4:损失厌恶

相对于参照点,等量损失的心理权重约为等量收益的2到2.5倍。

重要区分:人不是【风险厌恶】,而是【损失厌恶】。

- 在收益域,人会风险厌恶——有确定收益就不想赌了。
- 在损失域,人反而风险偏好——为了避免确认损失而赌一把。

散户投资里最常见的错误模式:涨了10%就想卖(锁定收益),跌了30%还在扛(不想确认损失)。结果:赚的股票拿不住,亏的股票死不放。

有个经典场景:股票跌了30%死扛,理由是"都亏这么多了,卖了就是认输"。但外卖少送一包辣椒酱,能追着骑手打三个电话。同一个人,对30%的损失麻木,对一包辣椒酱锱铢必较。这不是"心态不好",是损失厌恶的必然结果。大脑在收益域和损失域的运作方式本来就不一样。

另一个应用:为什么Notion、Figma、ChatGPT Plus都给你免费试用?一旦你用了30天,取消订阅就不再是"省钱",而是"失去"已经拥有的权益。这是禀赋效应——人对已拥有之物的估值会高于未拥有时。

劝你花钱买一个新东西,难。让你放弃一个已经用上的东西,更难。所以免费试用不是在展示功能,是在制造损失。

3. 公理5:敏感性递减

离参照点越远,对同等绝对变化量的感知越钝。

从100到200,感觉翻倍。从10100到10200,几乎无感。

你重仓一只股票亏了50%。这时有人说"再跌10%",你的反应是什么?"反正都跌成这样了,再跌10%也无所谓。"

同样10%的跌幅,从0到-10%让你心惊肉跳,从-50%到-60%你已经麻木了。

危险在于:这种麻木会让你在该止损的时候不止损,在该恐惧的时候已经无感。

反过来,很多创业者融资时会说"我们已经拿了A轮"——既然你已经投了大头,再跟投一点也不觉得多。

这也解释了定价策略:打折在低价商品上感知更强烈;附加费用在大额交易中更容易被接受。

4. 公理6:概率加权

人对概率的主观权重不是线性的。系统性地高估小概率事件,低估中高概率事件。

这就是为什么同一个人会同时买彩票(高估小概率收益)和买保险(高估小概率损失)——这不矛盾,是概率加权的必然结果。

风险投资的本质是买彩票。每个项目成功概率可能只有1-5%,但一旦成功可能是100倍回报。VC会组合足够多的标的,让大数定律发挥作用。

反过来,散户投资者容易高估"小概率暴富"——追逐妖股,高估"小概率暴跌"——恐慌性抛售。两边都被概率加权坑。

银行理财最爱说的词是"保本"。从数学上看,一个年化4%的产品和一个"保本+浮动"的产品期望收益可能差不多。但"保本"把亏损概率从"很小"变成了"零"——这是一个质变。心理权重的提升远超实际风险的降低。

这一层给出了行为经济学最硬的价值函数框架:参照点依赖 + 损失厌恶 + 敏感性递减 + 概率加权 = 前景理论。

但人不只活在一个时点。人活在时间流里,嵌在社会网络中。

第三层:时间与社会维度扩展

前面六条描述的是"一个人在一个时刻面对一个决策"。但真实人生不是这样的。

1. 公理7:双曲贴现

标准经济学假设人对未来的贴现是指数型的——每过一年,折一个固定比例。这意味着时间偏好一致。

但真实的人不是这样。人对未来的贴现是双曲型的——对"现在vs稍后"的贴现率,远高于"稍后vs更远"。

今天的100块和明天的110块?多数人选今天。30天后的100块和31天后的110块?多数人选后者。同样是一天之差,同样是10块收益。但距离现在越近,那个"一天"的权重越高。

这就是【现在偏好】。

Affirm、Klarna、花呗——为什么"先买后付"能显著提升转化率?因为它让用户立刻获得商品带来的快感,而将支付痛苦推迟到未来。利用对未来的高贴现率,"未来的钱"在心理上被打了很大折扣。

这也解释了为什么信用卡能成为万亿级生意:把消费和支付在时间上分开,就是在利用双曲贴现。

定投之所以有效,一半是数学(平均成本法),一半是心理学。设定自动定投,就是在用承诺机制对抗现在偏好。如果每个月都让你手动决定"这个月投不投",大多数人会在市场下跌时停止——恰恰是最应该买入的时候。

2. 公理8:社会效用

人的效用函数中包含社会性变量:公平感、互惠、社会认同、身份、归属。

这些变量的运作逻辑不同于市场交换。社会规范(基于信任、互惠、身份)和市场规范(基于价格、合同、交换)是两套不兼容的操作系统。

关键警告:市场规范一旦介入,会破坏社会规范,且难以逆转。

早期创业公司为什么爱给股权不爱给高薪?资金紧张是一个原因,但不是唯一原因。

给股权,员工会觉得"我是合伙人,我在为自己干"——社会规范。给高薪,员工会觉得"我是打工的,多干多要钱"——市场规范。

一旦把关系定义成市场交换,员工就会开始精确计算"这个任务值多少钱"、"加班有没有加班费"。这也解释了为什么很多创始人发现:一旦开始给期权折现,团队氛围就再也回不去了。

开源社区、AI社区里成千上万的人愿意无偿贡献代码、分享prompt和教程。他们图什么?利他、声誉、身份认同、社区归属——社会规范下的驱动力。但如果你给他们发微薄的工资?"这点钱侮辱了我的劳动。"市场规范的引入,反而扼杀了贡献动力。

这一层解释同一个人为何会在时间和社会关系中出现稳定但非"纯理性"的偏离。

第四层:四个启发式规则

前八条定义了硬件约束、价值函数形状和时间社会维度。但大脑在具体执行中"怎么走捷径"?还需要四条操作层面的规则。

这四条依赖前八条,但不能完全从前八条推出——前八条告诉你大脑会走捷径,这四条告诉你大脑走的是哪条捷径。

1. 规则A:可得性与显著性

大脑对信息的权重分配,取决于该信息被提取的容易程度和感知上的突出程度。

什么样的信息权重高?最近发生的、情感强烈的、画面生动的、被频繁重复的——不论其客观重要性如何。

每次有AI安全相关的新闻——某个AI说了奇怪的话、某个研究说AI可能失控——社交媒体就炸锅。但统计上,你更应该担心的是AI生成的钓鱼邮件(这才是真实威胁)、而不是"AI失控"。公众关注点为什么总是错位?因为"AI失控"画面感太强、太容易被想象,可得性太高。

2023年硅谷银行倒闭引发的银行股暴跌,很大程度是可得性偏差。SVB的问题(久期错配+储户集中)在很多银行并不存在。但"银行倒闭"这个画面太强烈,所有银行股都被连带砸盘。事后来看,那是很好的买点。但在当时,多少人一边喊着"别人恐惧我贪婪",一边手抖着点了清仓。

很多"风险"之所以看起来大,只是因为它最近上了新闻。

2. 规则B:因果叙事偏好

大脑倾向于将离散事件组织成连贯的因果故事,即使数据本身是随机的或仅仅是相关的。一旦故事形成,大脑会对其过度自信。

这里有一个重要缩写:WYSIATI——What You See Is All There Is。你看到的就是全部。你会忽略缺失信息,低估偶然性。

财经媒体总要为当天的涨跌找一个"原因"——"受非农数据影响,美股三大指数集体下跌","受DeepSeek利好刺激,AI概念股全线上涨"。哪怕当天实际上只是随机波动。人们无法忍受没有因果解释的随机性,即使解释完全是事后诸葛亮。

成功的创业者总会讲一个"我是怎么想到这个点子的"故事。但大多数时候,成功中有大量运气成分。只是成功之后,大脑会自动把散乱的事件组织成一个因果故事。这对创业者本人有激励作用,但对学习者可能是误导。

用故事说服比用数据说服更容易——顺System 1。但做决策时要警惕自己编的故事——要激活System 2。复盘时可以刻意问:如果故事不成立,还有什么解释?

3. 规则C:表征依赖

决策不作用于客观事态,而作用于大脑对事态的内部表征。同一客观信息的不同编码方式——语言、视觉、分类、排列——会产生不同的决策输出。

这是框架效应的底层原因。

美国的401k退休账户,有两种设计:Opt-in(默认不参加,需要主动勾选参加)和Opt-out(默认参加,需要主动勾选退出)。改成Opt-out之后,参与率从不到50%飙升到90%以上。唯一的区别就是表格的默认选项。

同样的逻辑适用于产品设计:默认选中年付vs默认选中月付、默认打开通知vs默认关闭、默认勾选"同意协议"vs要求手动勾选。

呈现信息的方式,和信息本身同等重要。

4. 规则D:自我一致性驱动

大脑维护一个关于"我是谁"的内部模型,并持续驱动行为、信念、记忆与该模型保持一致。当出现不一致时,大脑优先通过修改最低成本的元素来恢复一致性——通常是信念或记忆,而非行为。

这个过程大部分由System 1自动完成,人往往意识不到自己的信念已经被修改。

你重仓了一只股票,公开说看好它。现在基本面变了,但你会发现自己很难承认"我错了"。因为"我是一个有眼光的投资者"是自我概念的一部分。承认错误,就是在攻击这个自我概念。

大脑的应对方式是:修改信念("这只是短期波动")而不是修改行为(卖掉)。

这就是为什么匿名账户更容易做出理性决策——没有公开承诺,就没有自我一致性的压力。

三、多重公理叠加:Figma的过山车

上面讲的都是单个公理。但现实中,它们经常同时作用、互相放大,形成芒格所说的lollapalooza。

Figma去年IPO是个完美的例子。

2025年7月,Figma上市,定价33美元。首日收盘115美元,涨了250%。两天后摸到142。

当时的情绪是什么样的?

1. 叙事偏好:Figma的故事太好了:一家小公司,硬生生从Adobe手里抢下设计工具市场,Adobe想收购它都没成功。"大卫战胜歌利亚",谁不爱听?

2. 可得性:AI设计工具是当时最热的概念,成功案例随处可见。"下一个万亿市场"这种话天天有人说。你想到的都是成功的画面。

3. 概率加权:"说不定真是下一个Adobe"。小概率事件被放大。

4. 社会效用:朋友圈里都在讨论,都在买。不买好像显得你不懂。

四条公理同时满足,股价不涨才怪。

然后呢?

半年后,股价跌到23美元。跌了80%。

下跌的时候,另一套公理接管了。

- 142成了参照点。所以100美元的时候,感觉是"已经亏了30%",而不是"还比发行价高三倍"。参照点依赖。
- 损失厌恶让人不愿意卖。"卖了就是真亏了,不卖还有希望"。
- 如果你公开说过看好Figma,自我一致性会让你更难承认判断失误。大脑会自动找理由:"这只是市场恐慌""长期肯定没问题"。
- 而敏感性递减让后期的下跌变得麻木——从142跌到100,那叫惨烈;从50跌到23,感觉就没那么痛了。其实后者跌幅更大。

据说当时有人差点冲进去,没买的唯一原因是:开户流程太长,填到第三页手机没电了。这大概是拖延症第一次保住了一个人的钱包。

这就是多重公理叠加的威力。你以为自己在做一个判断,其实同时被好几条公理推着走,而且它们方向一致、互相增强。

知道这些有什么用?至少下次看到类似的情况,能给自己一个暂停键:现在哪几条公理在同时作用?它们是不是在推我往同一个方向走?

四、回到芒格

我们从芒格的25条开始。

他的清单是一本单词书,而这篇文章尝试做的事情,是提炼出它的语法。

芒格的25条是地图。但我想要的是指南针。

地图告诉你"这里有一条河"。指南针告诉你"往东走"——不管你在哪儿,不管地图有没有画到这个地方。

对我来说,这套东西最大的改变是:看世界的方式变了。

以前看到一个产品设计、一个投资决策、一个谈判策略,我会想"这个好巧妙"或者"这个好蠢"。现在我会自动去想:这里在触发哪条公理?哪条规则?

不是每次都能想到,也不是每次想到了就能用好。但那种"原来如此"的感觉,本身就有价值。

就像第一次知道"拖延症"这个词——原来不是我意志力差,是大脑出厂设置就这样。

【给混乱的感受一个名字,本身就是一种解放。】

附录:公理速查表

第零层:元约束
进化适应性 偏差是远古环境的适应策略,方向可预测

第一层:硬件约束
公理1:双系统处理 System 1默认运行,System 2高成本激活
公理2:有限认知资源 满意即止,必须用启发式

第二层:价值计算偏差
公理3:参照点依赖 评估变化,不评估绝对值
公理4:损失厌恶 等量损失权重是收益的2-2.5倍
公理5:敏感性递减 离参照点越远,感知越钝
公理6:概率加权 高估小概率,低估中高概率

第三层:时间与社会维度
公理7:双曲贴现 现在vs稍后的贴现率远高于稍后vs更远
公理8:社会效用 效用函数包含公平、互惠、认同、归属

第四层:启发式规则
规则A:可得性与显著性 容易想起的信息权重更高
规则B:因果叙事偏好 把随机组织成故事,并过度自信
规则C:表征依赖 呈现方式决定决策,不是客观事态
规则D:自我一致性驱动 维护自我概念,修改信念而非行为
12
陈惑仔Harry
22天前
如果道德和智商正相关,Anthropic会打败OpenAI
00