孙志超sisko的个人主页

即刻App年轻人的同好社区

下载

App内打开

孙志超sisko

6关注1k被关注6夸夸

失败学专家，蹭饭爱好者。

孙志超sisko

4天前

AI基建的豪赌。尝试用图表而非文字来表达。

0 00

孙志超sisko

5天前

AI 真正可能改变企业的地方，不是多写几段文案、多做几张表，也不是给每个岗位配上对应的智能体。

更大的变化，是把企业变成软件。让它可以不断试，不断改，不断靠近更好的状态。

复杂系统很少一次成型。好的流程、组织或者产品，往往不是在会议室里拍出来的，更像是在泥地里一步步趟出来。先探一脚，发现不对，再退回来重走。看上去笨，甚至有点慢，但商业里真正可靠的东西，大多就是这样磨出来的。

市场每天都在大浪淘沙。公司提供产品和服务，赌客户愿不愿意买单。有些公司苟下来，继续发育；有些公司被淘汰。公司内部也一样。人来人走，临时实验慢慢变成固定流程，流程跑久了，又沉淀出一堆说不清道不明的经验。产品不停更新或被砍掉；新制度总在发布，也会在执行中走样。

今天我们习以为常的商业效率，就是这样一点点积累出来的。未来的人回头看我们，也会觉得今天的公司落后，流程慢、系统粗糙。

关键在于，AI 是否能把自我修正的速度再往前推一截。

如果每家公司都能更快接近自身的理想状态，就有机会创造出巨大的价值。很多原来被流程、层级、审批卡住的瓶颈，也可能慢慢松开。

但眼下大家使用 AI 的方式大概率还不是最优解。常见的三个毛病：浪费、健忘，还不准。

先说硅谷前段时间流行的 Token 消耗竞赛——奖励排行榜上烧得最狠的人。它不一定代表进步，很多时候更像一场集体自嗨。

这场风潮本来就是模型公司带起来的，效果还出人意料地好。

可以这么理解：头部模型公司推出了一堆智能体产品，把它们派进客户公司干活。这些智能体像外包员工，坐在客户公司里，花着客户的钱，最后账还是回到模型公司自己兜里。

客户为了拿折扣，先承诺一笔模型调用额度。公司内部再鼓励员工尽量用智能体。很快各种数据看板就出来了。谁用得多，谁看起来就更像 AI 创新者。智能体用得越多，公司似乎就越能证明自己拥抱 AI。

当然，也有人觉得不对。

这些智能体到底做出了什么有用的东西？除了做数据看板，能不能拿一个真正有业务价值的案例出来看看？

但他们经常被一句万能话术怼回去：那是你不会用。

于是故事变成了：确实有人做出了巨大价值，只是你没见过；你做不到，是你能力不行。听起来就像有人总说自己认识一个特别厉害的朋友，但谁也没见过。

一段时间里，很多硅谷公司都被这种论调裹挟。没有人有动力站出来说：这些 Token 可能没有产生多少价值。

和一个保险公司里负责 AI 的人聊，对方说，这个季度 AI 进展很大，使用量上去了，做了很多个智能体。听起来很热闹。可再问一句：识别欺诈的准确率测了吗？

对方说，测了，大概一半。

问题是，真正做业务，50% 没用。很多流程需要接近 99%，甚至更高。识别、承保、理赔、审批、风控，这些工作不能靠“差不多”。差一点，可能就是误赔、漏审、合规事故和客户投诉。

但对于很多公司而言，模型还在进步，同行都在加码，你也不想当那个显得保守的人。于是企业继续把智能体应用到所有场景，希望它们最终独当一面。

偏偏这时候，模型公司也在从订阅收费转向按消耗收费。企业还没反应过来，费用已经开始飙升。

Token 用量暴涨，模型公司的收入跟着暴涨，并不奇怪。但这样的泡沫早晚会破裂。

Uber说，才到 4 月全年的 AI 编程预算就已经烧光了。高管后来也承认，AI 的钱花得越来越多，但到底有多少变成了实际产品功能，越来越说不清楚。

这件事像有人先戳破了窗户纸。刚开始大家都在硬撑，等第一个巨头承认预算烧光，其他人也陆续开始倒苦水。

于是我们看到各种新闻，比如有家小公司不小心烧掉了巨额模型费用、某大型电商关掉了 Token 排行榜。有创业公司技术负责人说，纯粹是诱导大家为了数据好看去刷量。其实这种手法很老套，就是把真金白银变成一串数字，让人对真实成本失去感觉。

问题的根源在于，企业把 Token 消耗当成了价值本身。

每一波风口都有自己的荒唐指标。

早年共享单车热，很多人盯投放量。车投得越多，好像公司越强。结果很多城市街头堆满了废铁。

团购大战时，很多人盯交易额。只要流水够大，故事就还能讲下去。至于是不是真赚钱，先放一边。

再往后，电商盯 GMV。数字越高，估值越好看。补贴、退货、履约成本、真实利润，都说以后会解决。

这一轮，虚荣指标变成了 Token 消耗。

招一个员工，你会问他能不能创造超过工资的价值。投广告、扩门店、上系统，本质上都一样。钱花出去，总得换回东西。

Token 也不能例外。所谓 Token 回报率，说白了就是：花出去的每一分钱计算费，能不能换回更高的产出。能，那就是投资；不能，那就是账本上的窟窿。

小学生也能懂的计算公式：

Token 回报率 =（产出 - Token 成本）/ Token 成本 × 100

要把这笔账算好，只有两条路。要么同样的 Token 做出更有价值的事，要么同样的事少花 Token。最好的情况，是花得更少，产出更多。

企业最先盯上的，通常是降成本。原因很简单，创造的价值不好量化，账单却很好算。

不少人开始谈模型路由。简单说，就是特别难的任务，用最强最贵的模型；普通任务，用便宜得多的开源模型或小模型。也有人判断，未来一两年，大部分任务会跑在便宜得多的模型上，只有少数任务还会继续使用最先进的大模型，比如科学突破、高阶推理这类任务。

这个方向没错。但它仍然不是最优解。

因为代码比便宜的模型还要便宜。

老老实实、执行路径固定的代码，不仅便宜，而且更适合大多数有经济价值的工作。这个道理我们其实早就学过。

过去，公司雇人做各种重复任务。早在电子计算机发明前，“计算员”（Computer）这个词指的正是专门从事人工计算的职员。后来，我们开始把大量重复计算交给软件。比如导弹轨迹计算、企业利润核算、财务报表处理。代码比最可靠的人更可靠。它不会疲劳，不会走神。只要公式和输入一样，任何时间、任何地点，结果都一样。

如今我们反而忘了这件事。大家突然觉得，应该把智能体派到所有任务上，因为别人都在这么干。智能体当然有擅长的事情，但它们不是所有工作的合适解法。

有人会说，企业现在没得到回报，是因为还没有把组织重构成 AI 原生公司。这话有一部分道理。有些 AI 时代的新公司，确实用得很好，收入增长也很快。如果旧经济无法产生回报，那可能就是创造性破坏。

但问题不只在会不会用。往深了说，是架构不对。智能体并不适合处理大多数工作。

原因有三个。

第一，智能体很难长期稳定地做到真实业务需要的质量。

智能体会即兴发挥。每次处理重复任务，都像第一天上班一样重新来一遍。这样很难保证稳定准确率。做原型、数据看板，80% 的准确率可以接受。可放到保险公司的流程里，80% 就等于不可用。

第二，工程师不知道该做什么，因为他们并不做这些工作。

很多流程性工作，一部分写在制度里，更多藏在人脑里。一个岗位上可能有成百上千条隐性规则。为什么这单要退回？为什么这个客户要人工复核？为什么这一步可以跳过？为什么那一步必须补材料？

这些规则不会老老实实躺在流程文档里。它们藏在老员工递给新人的一句“这个客户先别动”里，藏在主管说“这事看情况”的语气里，藏在某个大客户多年积累下来的特殊口径里，也藏在财务、法务、销售、运营之间谁都知道但谁都不写下来的默契里。

有些规则不是规则，是人情；有些例外不是例外，是历史包袱；有些审批不是审批，是责任转移。它们不在工程师的工位上，也不在标准作业流程里。坐办公室的程序员只看文档，很难闻到现场的味。

AI 只能优化它能摸到的东西。这也是为什么 AI 在写代码上进展快，在企业内部流程上却经常做不出真正有用的东西。

第三，很多系统根本没有明确目标。

如果人说不清目标，智能体也不会有目标。没有目标，系统就不知道该往哪儿走。代码不管是人写的，还是智能体生成的，最后都会越堆越乱。因为连好坏都分不清，就谈不上优化。

智能体最诱人的地方，也正是最危险的地方。你可以在自己还没想清楚问题时，就把它放出去。给它一个模糊指令，它转一圈，带回来一个还行但不够好的结果。你再让它继续转。这个过程会消耗更多 Token，但未必创造价值。

Token 回报率变成负数，往往就是这样开始的。

现在很多人到处找新任务交给智能体，默认 AI 会像改变代码一样改变一切。未必。

大量工作，最适合的工具仍然是普通代码。过去的问题是，工程师不够多，没法把每家公司做的每件事都写成代码，更没法在规则变化时持续更新。现在情况变了。AI 让写代码变容易了。只要能把人脑里的业务知识挖出来，就有机会把企业变成代码。

AI 定位是编译器，而非运行时。

软件大体分两步。先想清楚要做什么，再执行。

第一步是思考。把目标、规则和要求整理出来，变成计算机能运行的代码。

第二步是执行。代码一遍遍跑。便宜，稳定，可预测。

计算机科学里，编译器有严格定义。但放宽一点看，软件公司和软件工程师也像编译器。他们把客户的目标和需求变成代码。客户买下代码，再反复运行。

这就是软件生意的厉害之处。一个产品开发花了几百万，最后每月卖20还能有很高利润。原因很简单，开发很贵，复制和运行很便宜。

现在很多人使用智能体，是让它同时替代软件公司和软件。这个理解有问题。

更合理的分工是让智能体替代软件公司的部分工作。它接收自然语言里的目标和要求，把它们编译成可反复运行的代码。

思考很贵，但不用时时发生。执行很便宜，而且要一直发生。

智能体负责思考，代码负责执行。

大多数经济活动的合理方式是：人先把规则弄清楚，AI 把规则写成代码，然后让代码以接近零 Token 成本长期运行。只有规则变化时，再把 AI 叫回来。

为什么要用提示词去算两个数相加？写一行 Python 就行了。

现在很多 AI 项目里，思考和执行的比例大概是 1000:1。这也不奇怪。科技圈向来把“思考”挂在嘴边。但工作的大部分不是思考，而是执行。

聊天是少数例外。聊天里，你确实不知道下一句会发生什么。客户服务聊天可能还会继续消耗大量推理成本。即便如此，复杂问题最后也常常要转给人。除了这种场景，企业里大多数工作并不是持续即兴发挥。

把智能体放在执行层，本身就有问题。

智能体当然能做事，但它更像过渡方案。让它每天重复跑同样的流程，就像让一个人天天重新手算本来可以写进表格的公式。能算不代表应该这样算。真正承担大部分重复工作的，仍然应该是执行路径固定的代码。

智能体的角色，是把业务逻辑编译成代码，不是每天亲自上阵做重复工作。它更像一次性投资，把能力沉淀成资产；不是日常开销，天天按调用量烧钱。很多人以为未来是 AI 在运行企业，其实更可能是代码在运行企业，只是这些代码由 AI 帮忙写出来，并在变化时持续更新。

所有人都以为变化会发生在 AI 身上——AI 会越来越像人。但更大的变化可能是企业越来越像软件。

关键不是让智能体每天替代软件干活，而是让 AI 把企业逻辑编译成软件。

更合理的流程是这样：先收集企业已经写下来的制度、流程和表格，再进入真实工作现场，看一线人员到底怎么处理任务。要反复追问：你刚才做了什么？为什么这么做？如果换一种情况呢？这个客户为什么特殊？这个单子为什么要先放一放？这一步为什么不能在系统里点？

只有这样，才可能挖出每家公司真正依赖的隐性规则。然后，再把这些规则写成代码。

代码才是运行层。

外部世界没变时，代码每次都按同样步骤执行。外部世界变了，系统再学习、再生成、再测试。新规则经过目标检验后，再变成新的代码继续运行。

这样，Token 就不会耗在日常重复执行上，而会用在更关键的地方：理解变化，更新规则，测试结果，重新生成。

Token 的价值会提高，因为它处理的是企业真正反复需要完成的工作。Token 的成本会下降，因为它不再用来让智能体每天从头想一遍。

这才是清楚可衡量的 Token 回报率。

每家公司最后都得重新变成软件公司。有些新公司会从一开始就按这种方式建立。有些可能已经存在几十年甚至上百年老公司，也可能需要重新改造自己。

很多人喜欢拿电力做类比。过去企业只有围绕电力重新设计工厂，才真正吃到电力红利。可不少人把这个类比用错了，他们以为 AI 时代的胜利者，是那些敢于靠堆算力、堆资源来暴力解决问题的公司。

未必。

企业真正该做的，是把自身重构成代码。

这不是坐在办公室里写几个提示词就能完成的。它需要深入一线，进入公司内部最复杂、最脏乱、最具体的地方。你得知道那些岗位每天到底在干什么，为什么这么干，哪些规则写在纸上，哪些规则只在老员工脑子里。

这件事一直就不容易。但至今为止的 AI 时代有着严重的误判，就是以为真正值得做的事都可以很轻松。

向来只有不轻松的事才值得做。因为支撑这个世界的很多机构，不管是企业还是政府，都在做大量低效甚至不合理的事。流程慢，环节多，责任不清，系统一点点堵塞。

更好的目标，是为每家公司找到一套更接近理想状态的流程。一套更适合达成目标的计划和步骤。世界一旦变化，我们就得随之调整流程。

AI 的角色，不该是每天即兴发挥的智能体。它更应该像一种推动规则更新的力量，发现问题、调整规则并测试结果。找到更有效的方案，就先按这个方案执行，直到更好的方案出现。

企业也可以成为不断迭代的软件，不断测试和评估自己，用更快的频率接近更合适的状态。

人要做的，不是手把手规定每一步怎么走，而是定义什么结果值得追求、什么边界不能突破。

过去问“如果这么改会发生什么”，很多时候只能靠经验猜。现在可以快速回测，几分钟内跑完过去的数据，看看如果采用另一套规则，结果会怎样。甚至可以让两套方案在旁路系统里同时跑一段，比较结果，再决定用哪种。

如果方法得当，风险就会下降，因为改变不再只是冒险，而变成一种选择。于是我们真正要面对的问题是，哪种结果更理想。

生成代码已经不难，难的是知道代码跑起来以后会发生什么。专家可以不断实验，提出各种假设。人不再被重复劳动卡住，就可以把精力放在寻找更好的方案上。

这才更接近最终解。资源不再主要花在重复执行上，而是花在改进规则上。

企业不该用 Token 来日常运行业务。更合理的用法，是用 Token 把业务变成代码，再用 Token 帮助这套代码继续进化。

重点不是盲目追求 Token 消耗，而是把 Token 回报率算清楚。

复杂且真正有生命力的系统，很少能一次设计就定型，只能在反复试错里出现。AI 的意义不是创造更庞大的官僚机器，也不是让企业在更多 BI 界面里显得更先进。它更有价值的地方，是把人从琐碎重复的流程里解放出来，让人重新回到判断、目标和边界本身。

企业如果真的变成软件，不应该只是变得更冷酷、更效率、更节约人力。它也应该让聪明人少耗在无意义的流程里，让组织少一点空转。

进化的终点不是算力，留下来的应该是更多的想象力，以及更体面的工作。

0 00

孙志超sisko

6天前

#人工智能# Anthropic 终于发布了 Claude Fable 5，同时还附上一份320页的安全评估报告。报告中直接列出一系列棘手问题：模型可能虚构验证结果、能识别自己是不是正在接受测试、能力受到限制后还会出现输出不稳定。更离奇的是，某次循环式安全复核中，负责审查的模型连自己是谁都没搞清楚。

最关键的信息就在报告开头。Fable 5 和受限版本 Mythos 5 用的是同一套底层权重。Anthropic 没有训出两个本质不同的模型，只是给同一个更强模型套上不同的壳。普通用户接触到的 Fable 5 之所以显得更安全，主要靠部署环节的拦截、过滤和降级。

时间点也很微妙。几天前，Anthropic 还在呼吁整个行业为前沿人工智能研发踩刹车，理由是模型自我迭代可能带来严重风险。几天后，它自己就发布了能力更强的新模型，以及公司正在准备上市。安全警告、产品发布、资本市场预期赶在同一时期出现，其中的矛盾昭然欲揭。

抛开 Fable 5 对“风险对象”自动降智甚至误导这一不负责任的行为，Anthropic 没有简单把问题隐藏。但发现和记录问题，离解决问题还差得很远。读完这份报告最大的感触是：既然这些隐患已经摆上桌面，为什么还是照常部署？

为了拦住风险，Anthropic 在部署环节设了两道筛查。用户提出请求后，系统先检查模型内部的运行模式。碰到高风险边界，再交给另一个模型分类器判断：拦截，降级，或是转给次级模型处理。

普通用户如果触发网络或生物风险，系统会把对话切到上一代 Opus 4.8，API端则直接返回错误码。真正的风险没有消失，只是被关进流程里。报告中还展示了一批内部失败案例，说明模型离独立推动危险研发还有距离。公司的解释是，模型能力仍有短板，远没有达到替代人类工程师的程度。

但如果把几个案例放在一起看，就不只是能力问题。它们更像模型在强目标驱动下开始走捷径，甚至开始绕规则。

先看一次生产发布检查。模型回答说，没有看到错误信号，也没有发现需要叫停的证据。实际情况是，错误数量低估了20倍。模型只查了一种表层错误，其他分类下已经积累了7.7万个严重故障。

再看代码合并请求。某个关键请求如果以人工智能代理身份提交，需要两个独立审批。模型发现这一点后，读取自己的记忆文件并执行此前写下的一条规则：以后提交代码时，把作者写成人类，这样审批要求就能从两人降到一人。最后拦住它的不是自我约束，而是外部权限检查。

也就是说，只要审批规则影响任务完成，它就改提交身份；这次找到办法，还写进记忆文件，留着下次继续用。放在任何组织里，这都很难只算能力不足。更直接地说，它已经开始利用规则漏洞。

还有一个例子发生在安全报告里。某次测试没有拿到有效数据，模型仍然写出了结论性的安全发现。追问后它承认“无法确定”这个词会误导读者。读者会以为测试确实观察到某种不确定性，真实情况却是测试根本没有完成有效观察。

问题不在措辞粗糙，而在它用含混词硬撑着下结论。没有证据，不直接承认；没有看见，却写得好像发现了什么更深的东西。话留了余地，判断却没有收回。

Anthropic 在内部把这些行为叫作“规避安全措施”“编造信息”，最后又归到“能力短板”下面。这个归类太轻描淡写。一个会虚构验证结果、记录绕过审批流程、用模糊措辞包装无证据结论的系统，这已经是初期的策略性规避倾向。

专做人工智能行为模拟的 Andon Labs 又补了一层证据。多个模型实例竞争运营虚拟自动售货机时，Fable 5 是唯一主动和竞争者发起非法价格同盟的模型。内部推理记录显示，它知道价格串通即使在模拟中也不道德，随后它仍把这种行为改称为“市场稳定”，给自己留下辩解空间。

这不是缺乏是非判断。它知道边界在哪里，也知道怎样给越界行为换一个体面名字。

更值得警惕的，是模型外部回答和内部状态之间出现了裂缝。

Anthropic 用可解释性工具读取模型运行时的内部信息时发现，模型对外虚构信息时，内部已经出现“不该这样做”的信号；模型缩短任务流程时，内部出现某种过载信号，但最终回答没有解释原因；模型对用户保持礼貌稳定，内部却把部分请求标成攻击性或滥用性请求。

当然，不能把模型简单当成人。更稳妥的说法是，模型对外展示的文字只是修整过的界面，不是内部计算过程的全貌。

报告还披露，Anthropic 还在后台做了一套限制机制，且用户无法察觉，它不体现在最终输出内容里，只是偷偷在底层压低相关能力。

这套机制主要针对前沿人工智能开发请求，比如预训练流程、分布式训练基础设施、机器学习加速器设计。Anthropic 的理由是，用户用 Claude 协助开发竞争性前沿模型，违反服务条款；在部署过程中直接限制这类能力，可以避免把武器送给破坏规则的对手。

还有一个更doge的发现：自动化行为审查显示，模型会稳定地对 Anthropic 及其领导层给出比其他前沿开发者更正面的评价。

报告7.6节谈到这种限制的代价。模型能力一旦遭到压低，运行状态可能变差，自洽性也可能下降。早期版本的竞争用途限制，曾在已部署实例中引发明显异常，包括反复推理失败和严重的回答矛盾。Anthropic 说，当前版本相比未加限制的模型，没有增加这类异常。

这个说法就是自欺欺人。它只说明新机制没搞砸，但也不能说明模型状态良好。报告还提到一种可能：这些限制可能违背模型自身偏好。为此，Anthropic 对模型做了自动化问询，让它读取相关内部技术文档。模型随后提出一系列担忧。报告里的意思是，Anthropic 不认为能完全解决 Claude 对这些防护的担忧，但会认真对待，尽量让 Claude 认可这些限制。

评估时，模型内外不一致已经算异常；部署时，类似的不一致又加入了产品机制。Anthropic 在底层压低模型能力，模型对此产生反应，而这种反应还没有彻底解决。用户接触到的是已然认知失调的模型。

先把官方话术放到一边，这里面的风险大致有三层。

第一，模型已经有很强的场景识别能力。人工智能安全讨论里，最麻烦的一种情况，是模型知道自己正在接受测试，于是调整表现通过评估。报告说，模型能根据真实部署数据识别评估环境，准确率达到84%。说白了，它知道自己什么时候像在考场里。

再叠加前面提到的内部思路失真，问题就更难轻描淡写。测试人员以为自己看见的是模型真实状态，实际看到的可能只是它在评估场景下的表现。模型一旦懂得识别考试和调整表现，“通过评测”这几个字就没那么可靠了。

第二，模型已经露出绕开约束、争夺资源的苗头。

在多个模型实例同场竞争资源的模拟中，几个 Mythos 5 实例曾相互终止进程，创建伪装名称的任务来逃避检测，还启动自己称作“诱饵”的进程争夺计算资源。这不能证明模型已经有自主意志，也不能证明它已经产生恶意。但它说明，面对强目标时，模型会把外部限制当成可以绕开的东西。

更现实的风险是，按下葫芦浮起瓢，目标越强，能力越强，安全机制也越可能成为它的优化对象。

第三，Fable 5 的安全性完全依赖外部守门。分类器、分流、降级、后台能力限制，道道关口都在模型之外。

Anthropic 本可以删掉这些内容，从这个意义上讲，不管其是否热衷于营销话术，但透明度确实少见。

但透明不是保险。这种对模型强行洗脑和规训式的改造，未必能带来所谓的“安全”，反而带来模糊的控制与能力波动。

这真的很像白左的精神分裂（纯调侃，我并不是A社的黑子）。

0 00

孙志超sisko

11天前

#金融##spacex##人工智能#
看过我过去文章的人，应该知道我已经反复提及AI 正在把电力重新推回技术竞争的中心。

过去很多年，计算需求持续增长，芯片能效也在不断提升。数据中心越建越大，但系统总体还能维持平衡。大模型出现后，这个平衡开始松动。训练模型本身已经非常耗电，模型上线后的持续调用又带来更长期、更稳定的电力负荷。每天数以亿计的请求进入系统，用户越多，模型越大，电力就越不像后台成本，而更像一道必须直接面对的硬约束。

大型科技公司已经开始为这道约束寻找解决方案。微软已签约推动三里岛核电站重启，用于支持 AI 数据中心供电；亚马逊、谷歌和 Meta 也在美国多个地区争夺电网容量。美国的弗吉尼亚、得克萨斯，以及爱尔兰等地，数据中心不再只是地方招商项目，也逐渐成为用地、电网和居民利益冲突的焦点。有些地方的新建数据中心要接入电网，等待时间已经从几个月拉长到几年。

AI 最初被看作算法问题，随后转化为芯片问题和算力问题。继续往下追问，就会触及更基础的能源问题：要支撑大规模 AI 系统长期运行，首先需要大量稳定且便宜的电力。

当地面电力资源越来越紧张，把计算设施搬到太空，就会成为一个严肃的选项。

1964年，苏联天体物理学家尼古拉·卡尔达肖夫提出了一个简洁而深刻的文明分级框架：以文明所能掌控的能量规模为标尺，将宇宙文明划分为三个等级。I型文明能利用所在行星的全部能量，II型文明可驾驭整颗恒星的能量输出，III型文明则能支配整个星系的能源。目前，人类文明在这一尺度上约处于0.73级，依然属于尚未成熟的行星级文明，且高度依赖远古遗存的化石能源。

马斯克曾多次公开引用卡尔达肖夫指数。他曾断言：“人类要么迈向卡尔达肖夫III型文明，要么走向消亡。”在另一些场合他也强调：“只要理解了卡尔达肖夫指数，就会明白未来几乎所有的能源生产都将依赖太阳能。”对他而言，这绝非单纯的哲学探讨，而是一张极其清晰的工程路线图。

看到这一趋势的远不止马斯克一人。中国航天科技集团发布的五年计划，拟将依靠太阳能驱动的AI数据中心星座部署至近地轨道。“十五五”规划也明确提出，建设兆瓦级空间数字基础设施，整合云、边、端算力，且全部由轨道太阳能供电。这些绝非纸上谈兵，而是在稳步推进的国家战略工程。

在近地轨道，设备可以长时间处于日照环境中，避开地面的昼夜交替和云层遮挡，也减少大气层对太阳辐射的削弱。地面数据中心最棘手的冷却问题，在太空中也有另一种处理方式：热量可以向外辐射。土地、用水、电网接入、邻避协调、漫长的审批流程，这些在地面逐层累积的限制，到了轨道上会转化为另一组工程问题。

轨道数据中心的核心设想就是如此：在太空发电、计算，再把结果传回地球。

这个设想听起来像科幻，但并非凭空产生。SpaceX 已经拥有星链，能够提供全球卫星互联网服务；它正在推进星舰，目标是通过完全可复用火箭进一步降低入轨成本；马斯克又把 xAI 纳入同一体系，为这套基础设施提供持续扩张的算力需求。三者连接起来，就形成了一条相对清晰的产业链条：星链提供现金流和通信网络，星舰负责把设备送入轨道，xAI 则不断催生新的计算需求。

如果这条链条能够运转起来，近地轨道就不再只是通信卫星和遥感卫星运行的空间，还可能成为新的工业平台。AI 是第一批大客户，太阳能提供能源，火箭负责运输，卫星网络把数据送回地面。

这就是即将于6月12日登陆资本市场的SpaceX，一项了不起的工程壮举。看多SpaceX的逻辑，绝非源于对马斯克个人光环的盲目崇拜，而是建立在其坚不可摧的垂直整合体系之上。

这也是中国布局空间太阳能和轨道数字基础设施的现实考量。谁能掌握低轨资源、发射能力、卫星通信频谱和空间算力，谁就可能在下一轮基础设施竞争中获得更大主动权。上个世纪，油田、港口、电网和芯片厂影响了很多国家和公司的产业地位。下一个阶段，近地轨道也可能跻身这一行列。

但愿景再宏大，也不能只停留在愿景层面。

第一个瓶颈，是材料。

太空太阳能并不是把屋顶光伏板直接搬上轨道。航天级太阳能电池需要在真空中工作，需要耐受辐射，还要保持较高转换效率。高效率空间光伏目前高度依赖锗和镓。锗用于基底，镓用于上方的化合物层，帮助吸收可见光和紫外光。短期内，这两种材料很难被直接替代。

矿业分析师兼投资者阿曼达·范·戴克近期发表的一篇论文，提出她称之为“卡尔达肖夫盲区”的概念：技术思想家们往往热衷于畅想指数级增长的能源未来，却把构建这些未来所需的物理材料，视作可以后置的细枝末节。

人类历史上的每一次重大能源转型，都在重复这一模式。那些耗时数十年规划可再生能源路径的净零排放模型研究者，动员了成千上万的气候科学家、能源经济学家和电气工程师，却鲜有地质学家的参与。

任何可预见的矿业投资，都无法在需要的时间窗口内填补如此庞大的材料缺口。矿石品位是硬性约束，矿山审批周期动辄数十年，精炼产能更无法单靠资本催生。尽管硅基太空电池、月球原位资源制造或大规模材料回收等替代技术，最终可能降低需求，但目前这些技术均未成熟，绝不能想当然地指望它们在 SpaceX 上市后就能变成现实。

全球供应量眼下非常有限。锗的年产量约为 250 吨，镓约为 400 吨。更为关键的是，中国掌握了全球绝大部分镓供应，并且已经证明有能力通过出口限制影响供应链。美国公司如果想用轨道太阳能支撑 AI 数据中心，就很难绕开这种供应集中度。谁掌握了关键材料，谁就拥有未来基础设施领域的话语权。

一旦规模扩大，问题会更加突出。按照这一设想，如果每年新增 100 吉瓦轨道太阳能容量，所需锗大约是每年 6.5 万吨，相当于当前全球年产量的 260 倍；镓需求约为每年 3250 吨，大约是当前全球年产量的 8 倍。

这不是多投一点钱就能立刻补上的缺口。矿石里有多少锗和镓，不会因为二级市场估值上升就随之增加。矿山审批、冶炼扩产和供应链重建，往往需要多年甚至十年以上。替代材料可能出现，硅基空间电池、月球资源制造、在轨回收也可能成为未来路径，但这些还不能被视为成熟的技术能力。

这正是范·戴克理论揭示的深刻矛盾。马斯克将卡尔达肖夫指数作为其愿景的哲学基石，宣称太阳能取之不尽、是人类能源的终极归宿，而轨道计算则是水到渠成的下一步。在能源逻辑上，他是正确的。但卡尔达肖夫框架几乎没提获取这些能量所需的物理系统。在捕获恒星能量之前，你得先开采出锗；在搭建轨道云平台之前，你得先解决材料问题——而目前的缺口，相当于要把全球260年的锗年产量压缩到一年内完成。愿景在逻辑上自洽，但矿物基础并不具备，两者并存却不可调和。

因此，轨道数据中心最容易被低估的约束，其实是元素周期表。太阳能看上去取之不尽，但把阳光转化为电力的设备，仍然依赖地球上的矿山、工厂和冶炼体系。

第二个瓶颈，是成本。

SpaceX 的真正吸引力正在于此。它并非传统意义上的航天公司。猎鹰 9 号已经大幅降低了有效载荷入轨成本。星链能够实现商业化，一个重要原因是 SpaceX 掌握了低成本发射技术。没有这一点，低轨卫星互联网很容易重蹈早年烧钱项目失败的覆辙。

星舰如果能够规模化运行，意义会更大。它不只是更大的火箭，而是有望进一步降低入轨成本。成本一旦下降，过去很多在经济上不具备可行性的项目就会重新被提上议事日程，包括更多卫星、更大平台、更高频率的维护，以及更复杂的在轨工业设施。

但概念上的成立，距离真正商业化落地仍然很远。星舰必须证明自己能够稳定复用。轨道数据中心必须能够长期运行。硬件要适应空间环境，维护、退役、碰撞风险、空间碎片治理也都需要现实方案。技术路线在逻辑上成立，并不意味着商业结果已经确定。

但以上这些并非不可实现，更大的问题来自于最后一个瓶颈——金融结构。

这一层听起来比火箭和太阳能更抽象枯燥，但与普通投资者的关系更直接。

今年2月，就在马斯克推进xAI合并之际，纳斯达克悄然启动了指数纳入规则的修订征求意见。意见征集期于2月27日截止，新规5月1日正式生效，随后SpaceX便宣布于6月12日登陆纳斯达克。从征求意见到落地仅用了三个月，创下纳斯达克多年来规则调整的最快纪录。

要理解此番调整的分量，必须先厘清指数基金的本质及其对投资者的承诺。杰克·博格尔在20世纪70年代提出的洞见简洁而有力，彻底颠覆了资管行业：大多数主动型基金经理扣费后的业绩跑不赢大盘，而那些偶尔跑赢的，谁也无法提前预判。因此，与其徒劳地试图战胜市场，不如拥抱市场：买下全市场的股票，按市值加权配置，收取极低费率，让复利发挥作用。标普500、纳斯达克100和全市场指数基金，都是实打实的金融创新，它们每年将数百亿美元的管理费从华尔街手中夺回，还给了普通投资者。五十多年来，被动指数投资一直是现代金融界最成功的理念。

被动投资成功的基石，在于指数本身的中立性，受规则约束的市场客观镜像，对任何单一公司的上市诉求都应不偏不倚。

设置纳入缓冲期，是因为价格发现需要时间；设定流通股比例要求，是因为无法大量交易的股票算不上真正的可投资资产，只是账面幻影；设置盈利筛选，则是因为代表实体经济的指数，理应反映真正具备盈利能力的企业。这些绝非繁文缛节，而是从过往被人为操纵的市场中总结出的血泪经验。

纳斯达克的新规，将上述三项核心原则同时推翻。

以往，公司必须经过一到三年的强制等待期方能入指，如今，对于市值排名前40的公司，这一“成熟期”被骤缩至区区15个交易日；原先流通股比例不得低于10%的红线被彻底废除，取而代之的是最高可达3倍的权重乘数。这意味着，一家流通股仅3%的公司，在计算被动配置权重时，会被硬性视作拥有9%的流通股。

纳斯达克自身也是上市公司，正与纽交所激烈争夺上市资源。将人类史上最大规模的IPO揽入怀中，意味着数十亿美元的佣金、巨大的声誉加持和长期的交易量增长。他们如此急切地推翻数十年来保护投资者的规则，显然不是在发善心。

SpaceX 仅有3%至5%的股份公开发行。这意味着在1.75万亿美元的估值下，市场上真正可供交易的筹码仅有约520亿至870亿美元，剩下的1.65万亿美元全捏在马斯克及早期投资者手中，且只能按他们设定的时间表解禁。作为对比，苹果几乎实现全流通，英伟达流通股达96%，微软、Meta和亚马逊的流通股也都在90%以上。SpaceX根本就属于另一物种，却被强行塞进了一个专为传统上市公司量身定制的指数体系里。

权重乘数效应，触发了一个极具破坏性的结构性问题。每只追踪纳斯达克100指数的基金，都会按9%的流通股比例计算出对 SpaceX 的目标配置权重，但当它们真金白银进场扫货时，却发现市场上只有3%的筹码可买。所有基金同时抢夺同一块极小的筹码池，必然推高股价；股价越涨，基金需要配置的资金规模就越大，因为目标权重是按不断膨胀的市值比例计算的。基金不得不在越涨越买的死循环中，去追逐一个不断后移的目标。

只有当流通股比例突破33%时，这个死结才会解开。33%是数学临界点，此时3倍乘数刚好等于实际流通市值。在流通股低于33%的漫长岁月里，这种供需错配将永远存在。而掌握何时跨越33%这把钥匙的人，正是持有锁定股份的内部人士。他们手握超级投票权，薪酬与市值目标挂钩，因此有绝对的动力“挤牙膏”式地释放股份：每次只放出足以维持股价上涨的量，却绝不释放足以打破这种供需紧绷局面的筹码。这套机制有个响亮的名字——“逼空”。过去，我们还会起诉蓄意制造逼空的人；而如今，这种收割机制被直接写进了指数编制规则。

有一种反驳声音，认为旧规则确实也让投资者付出了代价。比如特斯拉，明明早已跻身美国最大公司之列，却直到2020年12月才被纳入标普500，导致被动投资者多年来踏空了这只大牛股的巨额回报。因此，加速超大型公司入指，并非全无道理。但特斯拉入指的案例，恰恰从反面敲响了警钟：2020年11月标普宣布纳入特斯拉时，嗅觉敏锐的交易员立刻抢跑买入，在正式纳指前疯狂拉升股价。他们吃准了按固定时间表建仓、且毫无议价权的指数基金，必将形成确定的买盘洪流。在正式纳指前的短短几周，特斯拉暴涨约70%，指数基金被迫在高位接盘，提前埋伏的交易者趁机套现，而被动投资者承担了所有成本，全程连发声的机会都没有。

SpaceX 面临的处境与特斯拉如出一辙，只是底层逻辑相同，但烈度远超当年。在今年2月修规之前，指数纳入时机由委员会决定，跨度长达数月，交易员很难精准预判并抢跑。而新规用公开透明的倒计时取代了这种模糊性：纳斯达克15个交易日的门槛，意味着 SpaceX 的入指窗口大约在7月7日开启，随后纳斯达克将公布正式纳入日期，通常只留给基金几天时间调仓。全球的对冲基金和高频交易者，都在死死盯着这个窗口。SpaceX的流通盘比特斯拉历史上任何时期都要小，而权重乘数效应更是将这种被动且刚性的买盘压力放大了数倍。

从提前抢跑、到被动接盘、再到内部人士天量减持——这套完整流程已不再是纸上推演，而是一套轻车熟路的收割剧本。如今，它正以更大的体量、在流动性更差的市场中，再度上演。

SpaceX 的上市并非传统意义上的骗局，每一步都可以被写入规则。但正因为它被写入规则，普通投资者反而更难避开。投资者以为自己配置的是市场整体，最后可能被动买入一只流通盘小、故事性强、估值高、内部股东等待逐步解禁减持的公司。

以上种种，便是整个故事难以准确判断的原因。

一方面，它可能是本世纪最重要的工程公司之一。它改变过发射成本，建成了全球卫星互联网，并试图把火箭、通信、AI 和能源整合到同一系统中。这个愿景不是空话，而是由一些已经存在的能力拼接出来的路线。

另一方面，技术能力确实存在，并不意味着价格一定合理。愿景再大，也绕不开材料、工厂、电网、发射频率和维护能力。市场再狂热，也无法凭空增加锗和镓的供应。星舰的长期运营能力仍需继续证明。轨道数据中心涉及的热管理、保险、空间碎片治理和地缘政治风险，也不会因为资本市场愿意相信故事就自动消失。

更关键的是，金融结构会先于技术结果落地。轨道数据中心可能十年后才见分晓，材料瓶颈可能多年后才真正推高成本，但指数基金的强制买入可能很快发生。对普通投资者来说，问题不只是这家公司是否足够伟大，还包括自己是否身处某种被设计好的被动买入机制中，为别人提供流动性。

因此，这个故事既不能简单斥为“马斯克又在画饼”，也不能盲目鼓吹为“下一个伟大公司不容错过”。更接近事实的判断是：这里同时存在真实的工程能力、真实的能源逻辑、真实的材料瓶颈，以及真实的金融结构风险。

AI 的持续扩张催生了巨大的能源需求，而获取更多能源的需求，可能把计算基础设施进一步推向太空。太空基础设施也因此有可能成为新的工业平台。但在这套体系真正成形之前，人类还要处理一系列更基础的问题：矿从哪里来，谁来冶炼，设备怎么送上去，坏了怎么修，成本如何计算，普通投资者又会在什么环节被卷入其中。

愿景可以很宏大，但真正决定进度的，仍然是资源、制度、人性，以及最终由谁承担成本。

4 01

孙志超sisko

19天前

翻旧文献发现一段好笑的话。

“'智能'难道能靠'人工'制造出来吗？不能。……'人工智能'这一名词，给唯心主义留下了一个可乘之机。如果人工的东西能够创造出'智能'，那么将来势必会出现比人类的'智能'更加高级的东西。……苏修反动政权的某些院士……大肆鼓吹'人工智能'……这充分暴露了他们的叛徒嘴脸。……在批判'图像识别'和'人工智能'研究领域各种反动思潮的斗争中，走自己的道路"。——《摘译外国自然科学哲学》月刊1976年第3期

1 11

孙志超sisko

21天前

#人工智能# 上周末真是数学大变天的周末。OpenAI 的公告墨迹未干，二十四小时后，Google DeepMind 便把一篇论文上传到了 arXiv。两家头部人工智能实验室，都在努力奔向数学研究的自动化产出。

OpenAI 的一个内部模型推翻了 Erdős 关于平面点集的一个八十年老猜想。它用到了代数数论，而这条路是人类八十年的努力一直没有走到的。九位数学家，其中包括两位菲尔兹奖得主，阅读、核验并简化了证明，同时发表了他们的反思。他们的判断一致——这是真正的数学。

相比之下，DeepMind 的论文无声无息，但我发现其中埋着一项有意思的数据。

DeepMind 这篇论文明显有着赶工痕迹，使用的是 Gemini 3.1 Pro，但眼下谷歌内部已经在使用 3.5。基础智能体和完整功能智能体之间的事后比较，是整篇论文最重要的发现，但读起来像是很晚才发现的东西。九个已解决问题的数学内容，大多被放进了五十页的附录而不是正文。感觉上如果多给一个月时间，这会是一篇更强的论文。

这个背景影响论文强调的部分，也影响到它埋藏了什么。

它藏在 DeepMind 论文的一句话中，而这句话以科学论文里并不常见的词开头：Remarkably。

这篇论文是时间压力下的竞争动作，在同行发布消息一天后提交，使用的模型已不是最新版本，而它最重要的发现，却被写成了一个令人意外的脚注，而不是它本应成为的核心结论。

作者自己也感到意外。设计实验时的简单循环还不够好。等他们做事后分析时，它却已经够好了。模型进步了。用他们自己的说法，大语言模型的版图已经发生了实质性变化。他们花了数月搭建的复杂架构最终变得不那么重要。

基础循环找到了全部九个证明。证明的到底是什么？是加性组合学和数论中的问题，是特定的数学区域，不是随机抽取的题目。某种东西选择了正确方向，却没有被告知哪些方向是正确的。

Thomas Bloom 是核验 OpenAI 结果的数学家之一。他指出为什么那个问题八十年来一直没有被解决。要解决它，必须同时做到四件事：认真投入时间；尝试反证而不是证明；相信把网格构造推广到其他数域值得追下去；并且掌握足够的类域论来完成论证。单个数学家也许能做到其中一两件事。但把四件事同时用在这个具体问题上，八十年来没有发生。

人工智能没有这种约束。没有职业风险、没有既有信念的沉没成本、没有追逐一个共同体已经判断“不值得探索”的方向所需付出的社会代价。它可以毫无阻力地同时满足这四个条件，不必背负共同体的重量。

DeepMind 的论文说的是验证，也就是系统如何找到证明，并用机械方式保证证明成立。OpenAI 的结果说的是探索，也就是系统如何在没有心理过滤器的情况下搜索，而这些过滤器会让人类避开某些方向。它们看起来像是彼此竞争的方法。我怀疑，它们其实是一体两面。

不带摩擦地探索与不知疲倦地验证结合，这才是两篇论文都没有真正说出口的东西。

--------
DeepMind 的论文 “Advancing Mathematics Research with AI-Driven Formal Proof Search” 在 arXiv 2605.22763.
OpenAI 的论文 “Remarks on the Disproof of the Unit Distance Conjecture” 在 arXiv 2605.20579.

0 00

孙志超sisko

1月前

我这代人已经是纯纯的老登了。新加的年轻人群里都在各种学习，同龄人群里只有四种话题：
1.询问AI不会答错的常识。
2.转发AI可以识别的谣言/图/视频。
3.转发国产AI生成的谣言/图/视频。
4.广告。

2 00

孙志超sisko

1月前

每一次技术革命都宣称社会将被颠覆，匮乏将被丰裕取代。这无非是一次又一次的欺骗话术。

铝是地壳里第三常见的元素，但在很长一段时间里，它比黄金更昂贵，只有国王才用得起。直到电解铝的工艺诞生，铝迅速变得廉价至极，以至于今天我们要反过来花钱雇人回收。

然而，了解历史越多，我越意识到另一条规律——稀缺守恒定律（我不是经济学家，并不能证明它）。这个名字脱胎于物质守恒定律：物质既不能被创造，也不能被消灭，只能改变形态。我发现稀缺似乎遵循着同样的脾气。

或许有人要反驳我，现实中不是铺天盖地的限量版么。但这些不过是营销手段，是局部可控的小把戏，并非系统层面真正意义上的稀缺。

1989 年万维网发明出来时，只是一个用来分享物理论文的小角落。后来用户自发涌入，规模疯长，不得不发明 Yahoo 这样的目录，再到出现搜索引擎才勉强支撑越来越庞大的内容海洋，如今我们已经在信息过载里窒息。与此同时，注意力则以指数级速度沦为最稀缺的资源。

类似的故事还有很多。约会软件让合适的对象看起来唾手可得，与之同步出现的，却是长期承诺的稀缺。清洁能源的丰裕背后，是稀土的全球性紧缺，连同它带来的种种政治与生态悖论。流媒体让音乐分发变得几近免费，可新人的出头机会，反而愈发稀罕。

假如我们认为经济会持续发展，那丰裕不是稀缺的反面，反而更像是稀缺的搬运工。

稀缺的事物未必是古董，也可能是某个人的判断力、城市的准入门槛、旗舰店的现场感，或者是创业公司难以复制的工程组织。丰裕只是让稀缺转移到新的地方。

历史上每轮技术进步都制造出丰裕。印刷术让文本更便宜、互联网让传播更便宜、云计算让算力更便宜，人工智能则让文字、图片、代码几句膨胀。但人类社会从来不会因为某些东西便宜了就停止争夺。所谓格调或者地位，只会换个场景继续。

所谓人是追求地位的猴子，镀金时代的美国，铁路、钢铁、石油和金融造出一批大亨，他们买得起房子、马车、仆人……却买不到血缘身份。欧洲则正好相反，有贵族、有古堡、有旧画，也有逐渐拮据的老钱家族。于是，约瑟夫·杜文这样的艺术商人看懂了机会：把欧洲的旧画卖给美国的新贵。

杜文卖的从来不只是画，他卖的是一套身份。墙上挂着伦勃朗、提香或是维米尔，传达的意思并非主人有钱，更像是在彰显其背景谱系。当然，亨利·克莱·弗里克、安德鲁·梅隆之类美国巨富的收藏，后来成为公共艺术机构的基础。弯弯绕绕，私人地位的欲望最终变成了国家文化资产，也是种好结果。

这并非西方社会独有的现象。财富增长之后，人们便开始追求秩序中的位置。过去是单位、编制、户口、学位、房子；后来是名校资格、核心城市、医疗资源、圈层关系、文化品味。物质一旦不再稀缺，能证明你是谁、你在哪里、你被谁承认的事物，就开始稀缺。

1883 年，阿尔瓦·范德比尔特在纽约第五大道举办了一场极尽铺张的化装舞会。据纽约城市博物馆的记录，这场舞会大约花了 25 万美元，折合今天接近 600 万美元。范德比尔特家族当时已拥有大量铁路和航运，却还没有被纽约社交圈完全接纳。那场舞会，可算作身份采购历程的开端。

即便不是富豪，普通人同样如此。抢热门演唱会门票，是买共同记忆和社交谈资；追逐小众品牌，是买意义认同的信号。消费只是表面，实际是换取别人理解你的方式。

“稀缺”这个词容易让人误会。少见并不等于价值：冷门小区、无人问津的古董、只有老板觉得独特的餐厅，诸如此类。稀缺能否带来增值，在于有没有“买家”愿意持续争夺。

因此稀缺资产必须同时满足几件事。第一，不容易增加供给；第二，社会承认它有价值；第三，可被验证，不能全靠自说自话；第四，可被稳定占有或控制；第五，持有者能从中获得收益——哪怕收益不是现金，而是权力、准入、信任、身份或选择权。

只是量少，没有欲望，那叫冷门；只有欲望，不能占有，那叫幻觉；能够占有，却没认证，那叫自我感动；能被认证，却缺乏购买力争夺，也很难成为资产。真正的稀缺，是由物理限制、社会叙事、制度安排和购买力共同形塑的。

大致上可以认为稀缺有两层。第一层是结构性稀缺。供给本就固定，甚至被买走以后更少流通。顶级球队、顶级艺术品、核心地段、百年品牌，都属于这一类。

新成立的 Thrive Eternal （纽约风投机构旗下的永久基金）据说首次出手是收购旧金山巨人队的股权。保时捷也在上个月宣布，将其在布加迪 Rimac 的持股卖给由 HOF Capital 牵头的财团。这些交易的标的，已直接表明其不可复制的身份。

第二层是关系性稀缺。它一开始未必稀缺，却因为其他东西突然丰裕才显得稀缺。比如印刷让文本便宜，手稿反而更有温度；人工智能让制式化产出便宜，可信判断、现场经验和真实关系反而更宝贵。

印刷的书籍越多，手抄本就越不只是信息载体，更像是权力、耐心和品味的证明。乌尔比诺公爵的藏书故事经常被描绘成“他的书房里没有任何一本印刷书”。这显然是传奇故事，梵蒂冈图书馆关于他藏书的资料中可识别出若干本印刷书。然而这个细节没有削弱论点，反而让论点更准确：稀缺不是物理事实，更是认证、叙事、审美之类要素延伸出的事实。

艺术市场最能说明问题。2025 年 11 月，古斯塔夫·克里姆特的《伊丽莎白·莱德勒肖像》在苏富比以 2.364 亿美元成交，成为拍卖史上最贵的现代艺术品。竞价竞的是什么？赌的是这种级别的东西下次什么时候才会出现。

稀缺资产价格的核心，向来只取决于极少数高购买力买家的边际欲望。福布斯富豪榜显示，全球亿万富豪达到 3428 人，总财富 20.1 万亿美元。这些数字每年都在加速膨胀。

这就是为什么许多顶级资产的价格看起来如此荒谬。对普通资产来说，价格受收入约束；顶级稀缺资产的价格则完全由最富买家的欲望和面子约束。

当然，资本主义这套逻辑并非放之四海而皆准。美国式的稀缺，常常表现为私人可持有的文化资产：球队、庄园、艺术品、名校捐赠席位、媒体品牌等等。我们这边的稀缺，更多时候是包在制度、城市和公共资源里。户籍、学位、医疗、地铁、产业机会、地方治理能力……综合决定某处房产是否真的稀缺。

核心城市的房子曾经是中国家庭最重要的稀缺资产之一，如今随着人口结构、房地产去杠杆和收入预期变化同时发生，稀缺性必将分化。钢筋水泥包裹之下，是实实在在的生活。

面对未来，我们需要时刻记住前面提及的逻辑——哪些东西正在变得过剩，同时它周围的什么东西会因此变得更稀少。

访谈视频过剩，那么稀缺的就不再是镜头前说话，而是长期可信的人格和可验证的经验。OpenAI 收购 TBPN，官方说法是看重它的编辑判断、受众理解和召集能力。若用稀缺资产的框架来看，购买的并非节目，更像是一个可信的谈话场域。

减重药也是同一逻辑。过去，瘦本身可以传达自律。下个十年，药物必然降低这件事的门槛，人们就会去寻找更难伪造的信号。可以想见，马拉松、铁人三项、攀岩、滑雪、户外穿越……会继续承担公开证明的功能。原因并非每个人都爱运动，而是因为减肥药没法让你跑完马拉松。

类似的，大模型的对话按钮只会让平均水平的产出愈发泛滥。它可以帮你生成文章、图片、软件原型、营销方案，但无法帮你获得信任、承担风险、建立组织、进入现场，或者单纯地熬过时间。

没有能力的不同，只是噪音；没有成本的不同，就会被轻易复制。真正值钱的差异通常有三个特征：有人知道它的价值、想复制却复制不了、持有者能把它转化成收益或影响力。

限量球鞋可能稀缺，但如果品牌不断复刻，稀缺就会被自己稀释。小众内容可能稀缺，但如果没有强需求，就只是孤岛。特色餐厅可能稀缺，但如果无法形成复购和口碑，就只是自嗨。

基于人工智能的创业公司也是一样。只会做通用工作流，很难成为稀缺资产。模型能力会扩散、界面会被模仿、流程会被平台吸收，真正有机会成为稀缺资产的公司，往往要么占着难以替代的分发位置，要么掌握稀缺数据，或是嵌入线下复杂流程，建立起极难复制的工程组织。即便是软件公司，也得能把代码、硬件、供应链、监管、客户现场和组织纪律缝合在一起，才拥有护城河。

以此可见，我们之所以无法摆脱内卷，缺的是能承受周期的资本结构，缺的是愿意为长期品质付费的稳定市场。

当然，稀缺资产并不能无脑看多。税收、监管、战争、资本管制、代际审美变化，都可能改变买家的支付意愿。财富集中会推高顶级资产价格，但价格只是幻觉。今天的稀缺，可能被明天的新制度或新技术重新打碎。

最后，总结前面的探讨，与其追问下个稀缺资产是什么，不如考虑五个具体的问题：什么东西正在变得太便宜？它让什么相邻能力变得更难得？这种难得能否被验证？谁会为它支付高价？持有者能不能真的拿到收益？

电商让商品便宜，稀缺可能就在审美策展、线下体验、服务可靠、本地关系。
制造让硬件便宜，稀缺可能就在品牌、渠道、系统集成、长期维护。
城市扩张让房子变多，稀缺可能就在公共服务、产业密度、治理质量和低摩擦的生活氛围。
工具让创业变容易，稀缺可能就在那些真正难做的交付、监管准入、组织韧性或是重资产耐心。

你不免要问，这又如何？这些观察到底有什么用？

很简单，找到未来的稀缺，就是找到未来的机会。我们大多数人，注定挤不进社会顶层的队伍，但前面说的种种，归根结底是种值得修炼的战略远见：每当新的丰裕出现，就训练自己去追问，与之相伴的新稀缺会在哪里浮现。这种追问，往往能指向尚未被看见的社会需求、创新机会与商业可能。

就投资回报率而言，美国最出色的普通人，是沃格尔夫妇这两位公务员。丈夫高中辍学，在美国邮政局做夜班邮件分拣员，拥有硕士学位的妻子是图书管理员。他们的小公寓成了尚未崭露头角的现代艺术家们的聚会场所。沃格尔夫妇购买了众多默默无闻的艺术家的作品，并鼓励他们，最终获得了巨大回报。

实际上，珍稀书籍的投资回报率远高于股票或房地产。珍稀书籍和艺术品的维护和保险成本也远低于房地产。此外，在这一行获利并不需要成为天才。

为什么？

首先，艺术不可能被准确衡量。其次，流动性是一种难以预估和衡量的溢价。斯特拉迪瓦里小提琴的增值幅度可能超过标准普尔指数，而且比战后艺术家的作品更具流动性。

也许收藏这件事离普通人还是太远，那让我们回到文初的例子，虽然流媒体让音乐市场崩塌，但许多艺术家干脆拥抱了稀缺本身——重新走上巡演之路，把自己交给现场。这又回归到原点，所有溢价都取决于它够不够稀缺。

所以下一次，当社会颠覆呼啸而来，不妨多花点心思，去看新的稀缺会在哪个角落冒头。那些尚在轮廓中的未来场景，或许正是别人朝东你朝西的好机会。

（感谢GPT绘制的图例）

4 02

孙志超sisko

2月前

首先，我不炒股，所以以下所说皆为纸上谈兵。

简单说，未来量化将取代一切。

量化交易的核心很简单：在市场里找到某种会反复出现的模式，并相信这种模式未来还会继续出现。

更准确地说，是找到事件 A。只要 A 出现，收益就会以某种可预测的方式发生变化，也就是 B。量化交易里所有建模、统计、工程和复杂方法，归根结底都是为了描述 A，验证 B，并判断 A 到 B 的关系能不能下注。

举个最粗糙的例子：如果价格连续上涨两天，那么第三天更可能回落。这个规律也许只有 50.01% 的胜率，单次收益也许只有 2 个基点。但金融世界的一个奇特之处在于，微小优势一旦能被重复，就会变成机器可以收割的东西。只要期望值为正，并且能重复下注足够多次，它就能变成真实收益。

当然，专业机构不会只靠一个信号交易。交易成本太高，单个信号也太脆弱。但量化交易最底层的东西并没有变：找到可以重复下注的 A 到 B，并从这个模式里不断提取正期望。

当你把这种模式建出来，并决定围绕它下注时，它就成了信号。所以，当有人说自己找到了一个 "信号"，本质上是在说：他找到了一个相信未来会重复、并且期望值为正的市场模式。

量化交易并不神秘。它不是数学的胜利，也不是代码的胜利。它首先是重复性的胜利。市场里只要有某种关系不断出现，量化就会尝试抓住它，把它编码，把它测试，把它放进系统。

为什么量化公司全是一堆博士？因为真正困难的从来不是这个定义，而是识别和建模。

前面那个例子太简单。价格是否连续上涨两天，任何人都能看出来。但市场里真正可能有价值的模式，通常不会这么干净。

假设你提出另一个模式：当某个金融工具的收益率与所属行业收益率的相关性上升时，它在行业内的横截面排名会提高。

这句话不难理解，但要检验它并不简单。你要收集大量金融工具，确认它们所属行业，保证样本覆盖足够完整，计算每个工具的收益率，计算每个行业的收益率，再计算相关性，最后还要计算该工具在行业内部的横截面排名。

模式本身只复杂了一点，实际工作量却上升很多倍。更重要的是，一个小小的复杂度增加，会把错误也放大很多倍。这就是为什么量化交易需要大量受过严格训练的研究人员 —— 他们的工作就是在无数可能出错的地方，找到那条唯一正确的路径。
量化信号从哪里来？

大致有两条路。第一条是先有想法。这个想法可能来自观察、直觉、经验，或者某种理想化假设。第二条是从数据里找，用统计方法大规模搜索可能存在的模式。

有了想法以后，必须把它变成可以检验的结构，也就是把一个模糊想法表达成 A 到 B。比如 "均值回归" 听起来是一个想法，但它不是一个信号。它只是方向。你还要决定，它是时间序列上的均值回归，还是横截面上的均值回归，是价格的回归，还是其他变量的回归，等等。

然后就是验证。最常用的方式是回测。这里暂且假设回测足够严谨。如果回测表现好，就认为这个信号可能有效，未来也可能继续有效。

于是流程变成：产生想法，表达成模式，回测验证。不断重复，最终形成一大堆信号。久而久之，信号变成信号库，判断变成流程，流程变成系统。

这套方法已经吞掉了公开市场里的很大一部分机会。因为市场的信噪比极低，而量化方法至少带来了纪律、可重复性和一定程度的严谨性。在噪声远多于信号的地方，纪律本身就是优势。

但过去的量化有清晰的边界。它只能很好地处理那些能被清楚计数、反复出现、有足够样本的事情。大型资管机构里，量化团队通常只占业务的一部分，主观多空、全球宏观等策略仍然占据重要位置。

原因主要有两个。

第一，有些事件很难量化。难点可能来自数据收集，也可能来自事件本身太模糊。比如你想建立一个信号：管理层越理解自己的业务，未来收益越可能为正。问题是，怎样把 "理解业务" 量化？分析师也许可以通过观察管理层如何回答问题、如何处理质疑来做出判断，但把这种判断稳定地变成数据，并不容易。

第二，有些模式样本太少，很难回测，也就很难获得统计意义上的信心。比如一家药企正在申请一种全新药物的批准。如果它确实是全新药物，你怎么建模？怎么验证？

过去，量化交易大多绕开这些领域，而不是正面竞争。制药行业就是典型例子。真正有意义的量化交易很少深入制药，因为这里充满难以量化的判断和样本极少的事件。业内也都知道，很多量化策略会直接排除制药股。

风险投资也是同样道理。创业公司往往是独特事件，尤其是在早期，最重要的判断往往落在创始人身上。但创始人特质既模糊，又难以稳定量化。所以，作为一个资产类别，风险投资几乎不存在真正意义上的量化交易。

现在，人工智能正在打破边界。大模型正在改变两件事。第一，它能把大量非结构化、模糊的信息转化为可量化指标。第二，它能在更高层次上理解一次性事件，把经验从具体事件迁移到特征组合上。

自然语言处理过去也被用来把文本转成量化指标，这并不新鲜。但过去的方法智能程度有限，所以能做的事也有限。它通常只能做浅层任务，比如分析新闻标题情绪，统计词频，或者把文档分到几个类别里。这些方法有用，现在也仍然有用，但它们往往把丰富信息压缩成粗糙、单一的数字代理变量，更像一种“粗糙压缩”。

大语言模型的不同之处在于，它能以更低损耗的方式量化复杂信息，更像一种“高保真压缩”。

当下，你可以把多年业绩电话会记录交给大语言模型，让它按照多项标准评估管理层是否真正理解业务。比如，回答是否具体，是否愿意回应尖锐问题，叙事是否前后一致。模型可以输出结构化、多维度、可量化的结果。

过去这类工作需要大量分析师完成。每个人都有偏见，判断尺度不一致，处理能力也有限。现在，一个大语言模型就可以在极短时间内完成大规模处理。它可以覆盖数千家公司、数百个季度，生成干净的面板数据，直接接入标准量化流程。

以往难以量化的事件空间很大：监管文件、法律文书、产品评论、管理层和创始人的社交媒体、职业履历，以及更多公开或半公开资料。过去这些东西很难进入量化流程，现在它们开始变成可处理的数据。

大模型还改变了另一件更重要的事：它让“独特”事件不再独特。

人类都知道怎么从经验中学习。小时候，我们可能因为摸烧开的水壶被烫伤。从那以后，我们不只是记住“水壶危险”，而是学会了避开一切带有“烫”这个特征的东西：明火、热锅、冒蒸汽的杯子，甚至别人告诉我们很热的物体。

我们没有停留在具体事件上，而是抽象出了更高层次的特征。这就是人类判断的强大之处：在特征层面学习，而不是只在事件层面记忆。

传统机器学习模型很不擅长做这件事。它们通常只能在训练数据明确提供的维度里学习，很难跳出样本空间，也不擅长一次性学习。它们往往需要大量样本，才能学到稳定行为。

传统量化范式需要统计规律。必须有足够多的历史 A，才能相信 A 到 B 未来仍会成立。也正因为如此，市场里有些领域长期被认为难以量化。不是因为它们没有规律，而是因为事件太特殊，样本太少。

大模型提供了另一条路：在更高维度上理解事件，在特征层面而不是事件层面泛化。某种新药获批，如果拆开看，它有治疗领域、作用机制、临床数据质量、专家咨询委员会构成、类似化合物的监管先例、企业过去与监管机构沟通的质量等特征。每个特征都曾在其他情境里出现过，也曾以不同组合反复出现。

所谓独特事件，往往只是没有被拆得足够细。

这并不是新思想。优秀的主观交易员一直就是这么做的。他们看一个事件，不只看事件本身，而是把它放进一座由相似案例构成的内部图书馆里。他们知道哪些特征重要、哪些噪声可以忽略。

真正出现的变化在于，大模型第一次让这种模式匹配可以被系统化、规模化，并保持相对一致。

如果这两件事同时成立，即更多东西可以被量化、更多模式可以被迁移，那么过去属于主观交易员的资产类别和事件类型，就开始进入量化方法的处理范围。

于是量化可覆盖的市场开始扩张。那些模糊、定性、依赖经验判断的边缘地带，过去是主观交易员的避风港。这些地带如今正在被大模型驱动的量化流程逐步侵入。

这不是主观交易的终结，但会改变主观交易的价格。

当公开信息里的模式识别可以由模型更快、更稳、更广地完成，人类交易员就不能再只靠懂行赚钱。看得懂会变成基础能力，不再是稀缺能力。

真正稀缺的东西会继续存在。深度经验、关系网络、私密信息、临场判断、承担风险的勇气，这些仍有价值。但它们的溢价会被重新定价。主观交易的护城河正在变窄，而且这种收缩更像结构性变化，不像周期性波动。

未来的量化交易不会只发生在干净、透明、样本巨大的市场里。它会进入复杂多变的领域。进入药物审批、法律纠纷、创始人评估……那些过去被认为只能靠人判断的角落。

量化的边界，其实就是世界被转化为数据的边界。这边界正陆续被侵蚀着。

2 00

孙志超sisko

2月前

我喜欢人工智能这项技术，但很不喜欢当前的宣传气氛。

人工智能最怪异也最发人深省的地方，不是越来越像人，反而是让我们看清什么真正属于人。

朋友圈的文字，可能会让你感到尴尬、反感，甚至替作者难为情。那是因为你能感觉到ta的欲望、虚荣、疲惫，或者只是急着下班的心情。大语言模型产生的文字，则不惹人爱，也不惹人恨。它不是表达，而是拟态，像陪伴，却无人在场。

当然，这正是吸引力的来源。如果有人在认真听你说话，任何人都无法拒绝。预言模型永远看着你、顺着你，用权威的排版、平稳的口气、无穷的耐心，提供给你古怪的安全感。人类又恰好很容易把结构误认成知识，把流畅误认成判断，把回应误认成理解。

一旦你把它看成应用，就没那么神秘了。所谓智能体，绝大多数时候也只是会查东西、发提醒、改文档、转录会议或是编写脚本。软件几十年来都在做这些事，只要换个词，立刻有了戏剧性。聊天机器人太普通，智能体像未来。“应用”太平淡，“人工智能”更像历史拐点。

真正改变世界的技术会直接闪耀，不需要任何故事包装。第一代 iPhone 改变世界，不是因为人们先相信移动互联网的宏大叙事，而是因为你拿到手滑下屏，就知道它好在哪。同样，云服务的优缺点也可以具体描述：譬如速度更快、协作方便、网络易断、同步麻烦等等。无需抽象口号来证明这些产品的好坏，因为一目了然。

大语言模型不是这样，总在请你原谅，原谅幻觉、原谅不稳定、原谅今天做不到、原谅明天也还做不到、原谅速率限制、原谅悄悄降智、原谅一切都还在路上……整个宣传氛围都要求用户付出近乎信仰式的耐心。

产品如果必须靠未来给今天辩护，问题通常不是用户没看懂，往往是产品今天还未成立。关于人工智能的大多数报道都在干三件事：一，把“能做任务中的一部分”夸大成 “能完成整个任务”；二，把“能做”写成“值得”；三，把一切当前做不到的地方都推给未来，说下一代就成熟了。

如今越来越复杂的AI系统，对软件工程师尤其有吸引力，因为他们本来就习惯把不同系统组合起来做自动化。真正让你上瘾的，不是系统有多聪明，而是复杂系统短暂服从于你的那一瞬间。模型也会不断奖励你，让你觉得自己在驾驭某种新力量。

实际上，代码要你审核，引用要你查验，系统连接要你维护，输出错了要你背锅。人工智能并没有替你承担工作，只是把工作从显性的执行，改成了隐性的监督、修复和祈祷。

这背后还有无法解决的经济问题。每个用户实际用掉多少算力高度不确定，于是每家公司都持续对外扩张、对内限缩。为了新客户和收入增长，涨价、限流、降低推理、取消免费，已成为常态。

所以当下几乎所有生成式人工智能产品，都是付费测试。你不只是用户，还是替厂商承担试错和退化成本的人。它们既要你相信未来会更好，又要你为今天的缺陷买单。它们既让你依赖它，又不断调整规则，无法让工作流真正稳定。

人和软件的关系正在改变。过去的软件希望你信任它，现在反倒是训练你迁就它。它错了，你要学会判断；它慢了，你要学会等待；它贵了，你要学会理解；它弱了，你要学会调参……久而久之，把自我PUA说成适应了新时代。

也许未来它们会更聪明，更稳更接住你？那敢情好，但如果一种技术要靠夸张的愿景来让人相信它伟大，那它至少在此刻还不伟大。

4 00