即刻App年轻人的同好社区
下载
App内打开
孙志超sisko
6关注1k被关注6夸夸
失败学专家,蹭饭爱好者。
孙志超sisko
4天前
AI基建的豪赌。尝试用图表而非文字来表达。 ​​​
00
孙志超sisko
5天前
AI 真正可能改变企业的地方,不是多写几段文案、多做几张表,也不是给每个岗位配上对应的智能体。

更大的变化,是把企业变成软件。让它可以不断试,不断改,不断靠近更好的状态。

复杂系统很少一次成型。好的流程、组织或者产品,往往不是在会议室里拍出来的,更像是在泥地里一步步趟出来。先探一脚,发现不对,再退回来重走。看上去笨,甚至有点慢,但商业里真正可靠的东西,大多就是这样磨出来的。

市场每天都在大浪淘沙。公司提供产品和服务,赌客户愿不愿意买单。有些公司苟下来,继续发育;有些公司被淘汰。公司内部也一样。人来人走,临时实验慢慢变成固定流程,流程跑久了,又沉淀出一堆说不清道不明的经验。产品不停更新或被砍掉;新制度总在发布,也会在执行中走样。

今天我们习以为常的商业效率,就是这样一点点积累出来的。未来的人回头看我们,也会觉得今天的公司落后,流程慢、系统粗糙。

关键在于,AI 是否能把自我修正的速度再往前推一截。

如果每家公司都能更快接近自身的理想状态,就有机会创造出巨大的价值。很多原来被流程、层级、审批卡住的瓶颈,也可能慢慢松开。

但眼下大家使用 AI 的方式大概率还不是最优解。常见的三个毛病:浪费、健忘,还不准。

先说硅谷前段时间流行的 Token 消耗竞赛——奖励排行榜上烧得最狠的人。它不一定代表进步,很多时候更像一场集体自嗨。

这场风潮本来就是模型公司带起来的,效果还出人意料地好。

可以这么理解:头部模型公司推出了一堆智能体产品,把它们派进客户公司干活。这些智能体像外包员工,坐在客户公司里,花着客户的钱,最后账还是回到模型公司自己兜里。

客户为了拿折扣,先承诺一笔模型调用额度。公司内部再鼓励员工尽量用智能体。很快各种数据看板就出来了。谁用得多,谁看起来就更像 AI 创新者。智能体用得越多,公司似乎就越能证明自己拥抱 AI。

当然,也有人觉得不对。

这些智能体到底做出了什么有用的东西?除了做数据看板,能不能拿一个真正有业务价值的案例出来看看?

但他们经常被一句万能话术怼回去:那是你不会用。

于是故事变成了:确实有人做出了巨大价值,只是你没见过;你做不到,是你能力不行。听起来就像有人总说自己认识一个特别厉害的朋友,但谁也没见过。

一段时间里,很多硅谷公司都被这种论调裹挟。没有人有动力站出来说:这些 Token 可能没有产生多少价值。

和一个保险公司里负责 AI 的人聊,对方说,这个季度 AI 进展很大,使用量上去了,做了 很多个智能体。听起来很热闹。可再问一句:识别欺诈的准确率测了吗?

对方说,测了,大概一半。

问题是,真正做业务,50% 没用。很多流程需要接近 99%,甚至更高。识别、承保、理赔、审批、风控,这些工作不能靠“差不多”。差一点,可能就是误赔、漏审、合规事故和客户投诉。

但对于很多公司而言,模型还在进步,同行都在加码,你也不想当那个显得保守的人。于是企业继续把智能体应用到所有场景,希望它们最终独当一面。

偏偏这时候,模型公司也在从订阅收费转向按消耗收费。企业还没反应过来,费用已经开始飙升。

Token 用量暴涨,模型公司的收入跟着暴涨,并不奇怪。但这样的泡沫早晚会破裂。

Uber说,才到 4 月全年的 AI 编程预算就已经烧光了。高管后来也承认,AI 的钱花得越来越多,但到底有多少变成了实际产品功能,越来越说不清楚。

这件事像有人先戳破了窗户纸。刚开始大家都在硬撑,等第一个巨头承认预算烧光,其他人也陆续开始倒苦水。

于是我们看到各种新闻,比如有家小公司不小心烧掉了巨额模型费用、某大型电商关掉了 Token 排行榜。有创业公司技术负责人说,纯粹是诱导大家为了数据好看去刷量。其实这种手法很老套,就是把真金白银变成一串数字,让人对真实成本失去感觉。

问题的根源在于,企业把 Token 消耗当成了价值本身。

每一波风口都有自己的荒唐指标。

早年共享单车热,很多人盯投放量。车投得越多,好像公司越强。结果很多城市街头堆满了废铁。

团购大战时,很多人盯交易额。只要流水够大,故事就还能讲下去。至于是不是真赚钱,先放一边。

再往后,电商盯 GMV。数字越高,估值越好看。补贴、退货、履约成本、真实利润,都说以后会解决。

这一轮,虚荣指标变成了 Token 消耗。

招一个员工,你会问他能不能创造超过工资的价值。投广告、扩门店、上系统,本质上都一样。钱花出去,总得换回东西。

Token 也不能例外。所谓 Token 回报率,说白了就是:花出去的每一分钱计算费,能不能换回更高的产出。能,那就是投资;不能,那就是账本上的窟窿。

小学生也能懂的计算公式:

Token 回报率 =(产出 - Token 成本)/ Token 成本 × 100

要把这笔账算好,只有两条路。要么同样的 Token 做出更有价值的事,要么同样的事少花 Token。最好的情况,是花得更少,产出更多。

企业最先盯上的,通常是降成本。原因很简单,创造的价值不好量化,账单却很好算。

不少人开始谈模型路由。简单说,就是特别难的任务,用最强最贵的模型;普通任务,用便宜得多的开源模型或小模型。也有人判断,未来一两年,大部分任务会跑在便宜得多的模型上,只有少数任务还会继续使用最先进的大模型,比如科学突破、高阶推理这类任务。

这个方向没错。但它仍然不是最优解。

因为代码比便宜的模型还要便宜。

老老实实、执行路径固定的代码,不仅便宜,而且更适合大多数有经济价值的工作。这个道理我们其实早就学过。

过去,公司雇人做各种重复任务。早在电子计算机发明前,“计算员”(Computer)这个词指的正是专门从事人工计算的职员。后来,我们开始把大量重复计算交给软件。比如导弹轨迹计算、企业利润核算、财务报表处理。代码比最可靠的人更可靠。它不会疲劳,不会走神。只要公式和输入一样,任何时间、任何地点,结果都一样。

如今我们反而忘了这件事。大家突然觉得,应该把智能体派到所有任务上,因为别人都在这么干。智能体当然有擅长的事情,但它们不是所有工作的合适解法。

有人会说,企业现在没得到回报,是因为还没有把组织重构成 AI 原生公司。这话有一部分道理。有些 AI 时代的新公司,确实用得很好,收入增长也很快。如果旧经济无法产生回报,那可能就是创造性破坏。

但问题不只在会不会用。往深了说,是架构不对。智能体并不适合处理大多数工作。

原因有三个。

第一,智能体很难长期稳定地做到真实业务需要的质量。

智能体会即兴发挥。每次处理重复任务,都像第一天上班一样重新来一遍。这样很难保证稳定准确率。做原型、数据看板,80% 的准确率可以接受。可放到保险公司的流程里,80% 就等于不可用。

第二,工程师不知道该做什么,因为他们并不做这些工作。

很多流程性工作,一部分写在制度里,更多藏在人脑里。一个岗位上可能有成百上千条隐性规则。为什么这单要退回?为什么这个客户要人工复核?为什么这一步可以跳过?为什么那一步必须补材料?

这些规则不会老老实实躺在流程文档里。它们藏在老员工递给新人的一句“这个客户先别动”里,藏在主管说“这事看情况”的语气里,藏在某个大客户多年积累下来的特殊口径里,也藏在财务、法务、销售、运营之间谁都知道但谁都不写下来的默契里。

有些规则不是规则,是人情;有些例外不是例外,是历史包袱;有些审批不是审批,是责任转移。它们不在工程师的工位上,也不在标准作业流程里。坐办公室的程序员只看文档,很难闻到现场的味。

AI 只能优化它能摸到的东西。这也是为什么 AI 在写代码上进展快,在企业内部流程上却经常做不出真正有用的东西。

第三,很多系统根本没有明确目标。

如果人说不清目标,智能体也不会有目标。没有目标,系统就不知道该往哪儿走。代码不管是人写的,还是智能体生成的,最后都会越堆越乱。因为连好坏都分不清,就谈不上优化。

智能体最诱人的地方,也正是最危险的地方。你可以在自己还没想清楚问题时,就把它放出去。给它一个模糊指令,它转一圈,带回来一个还行但不够好的结果。你再让它继续转。这个过程会消耗更多 Token,但未必创造价值。

Token 回报率变成负数,往往就是这样开始的。

现在很多人到处找新任务交给智能体,默认 AI 会像改变代码一样改变一切。未必。

大量工作,最适合的工具仍然是普通代码。过去的问题是,工程师不够多,没法把每家公司做的每件事都写成代码,更没法在规则变化时持续更新。现在情况变了。AI 让写代码变容易了。只要能把人脑里的业务知识挖出来,就有机会把企业变成代码。

AI 定位是编译器,而非运行时。

软件大体分两步。先想清楚要做什么,再执行。

第一步是思考。把目标、规则和要求整理出来,变成计算机能运行的代码。

第二步是执行。代码一遍遍跑。便宜,稳定,可预测。

计算机科学里,编译器有严格定义。但放宽一点看,软件公司和软件工程师也像编译器。他们把客户的目标和需求变成代码。客户买下代码,再反复运行。

这就是软件生意的厉害之处。一个产品开发花了几百万,最后每月卖20还能有很高利润。原因很简单,开发很贵,复制和运行很便宜。

现在很多人使用智能体,是让它同时替代软件公司和软件。这个理解有问题。

更合理的分工是让智能体替代软件公司的部分工作。它接收自然语言里的目标和要求,把它们编译成可反复运行的代码。

思考很贵,但不用时时发生。执行很便宜,而且要一直发生。

智能体负责思考,代码负责执行。

大多数经济活动的合理方式是:人先把规则弄清楚,AI 把规则写成代码,然后让代码以接近零 Token 成本长期运行。只有规则变化时,再把 AI 叫回来。

为什么要用提示词去算两个数相加?写一行 Python 就行了。

现在很多 AI 项目里,思考和执行的比例大概是 1000:1。这也不奇怪。科技圈向来把“思考”挂在嘴边。但工作的大部分不是思考,而是执行。

聊天是少数例外。聊天里,你确实不知道下一句会发生什么。客户服务聊天可能还会继续消耗大量推理成本。即便如此,复杂问题最后也常常要转给人。除了这种场景,企业里大多数工作并不是持续即兴发挥。

把智能体放在执行层,本身就有问题。

智能体当然能做事,但它更像过渡方案。让它每天重复跑同样的流程,就像让一个人天天重新手算本来可以写进表格的公式。能算不代表应该这样算。真正承担大部分重复工作的,仍然应该是执行路径固定的代码。

智能体的角色,是把业务逻辑编译成代码,不是每天亲自上阵做重复工作。它更像一次性投资,把能力沉淀成资产;不是日常开销,天天按调用量烧钱。很多人以为未来是 AI 在运行企业,其实更可能是代码在运行企业,只是这些代码由 AI 帮忙写出来,并在变化时持续更新。

所有人都以为变化会发生在 AI 身上——AI 会越来越像人。但更大的变化可能是企业越来越像软件。

关键不是让智能体每天替代软件干活,而是让 AI 把企业逻辑编译成软件。

更合理的流程是这样:先收集企业已经写下来的制度、流程和表格,再进入真实工作现场,看一线人员到底怎么处理任务。要反复追问:你刚才做了什么?为什么这么做?如果换一种情况呢?这个客户为什么特殊?这个单子为什么要先放一放?这一步为什么不能在系统里点?

只有这样,才可能挖出每家公司真正依赖的隐性规则。然后,再把这些规则写成代码。

代码才是运行层。

外部世界没变时,代码每次都按同样步骤执行。外部世界变了,系统再学习、再生成、再测试。新规则经过目标检验后,再变成新的代码继续运行。

这样,Token 就不会耗在日常重复执行上,而会用在更关键的地方:理解变化,更新规则,测试结果,重新生成。

Token 的价值会提高,因为它处理的是企业真正反复需要完成的工作。Token 的成本会下降,因为它不再用来让智能体每天从头想一遍。

这才是清楚可衡量的 Token 回报率。

每家公司最后都得重新变成软件公司。有些新公司会从一开始就按这种方式建立。有些可能已经存在几十年甚至上百年老公司,也可能需要重新改造自己。

很多人喜欢拿电力做类比。过去企业只有围绕电力重新设计工厂,才真正吃到电力红利。可不少人把这个类比用错了,他们以为 AI 时代的胜利者,是那些敢于靠堆算力、堆资源来暴力解决问题的公司。

未必。

企业真正该做的,是把自身重构成代码。

这不是坐在办公室里写几个提示词就能完成的。它需要深入一线,进入公司内部最复杂、最脏乱、最具体的地方。你得知道那些岗位每天到底在干什么,为什么这么干,哪些规则写在纸上,哪些规则只在老员工脑子里。

这件事一直就不容易。但至今为止的 AI 时代有着严重的误判,就是以为真正值得做的事都可以很轻松。

向来只有不轻松的事才值得做。因为支撑这个世界的很多机构,不管是企业还是政府,都在做大量低效甚至不合理的事。流程慢,环节多,责任不清,系统一点点堵塞。

更好的目标,是为每家公司找到一套更接近理想状态的流程。一套更适合达成目标的计划和步骤。世界一旦变化,我们就得随之调整流程。

AI 的角色,不该是每天即兴发挥的智能体。它更应该像一种推动规则更新的力量,发现问题、调整规则并测试结果。找到更有效的方案,就先按这个方案执行,直到更好的方案出现。

企业也可以成为不断迭代的软件,不断测试和评估自己,用更快的频率接近更合适的状态。

人要做的,不是手把手规定每一步怎么走,而是定义什么结果值得追求、什么边界不能突破。

过去问“如果这么改会发生什么”,很多时候只能靠经验猜。现在可以快速回测,几分钟内跑完过去的数据,看看如果采用另一套规则,结果会怎样。甚至可以让两套方案在旁路系统里同时跑一段,比较结果,再决定用哪种。

如果方法得当,风险就会下降,因为改变不再只是冒险,而变成一种选择。于是我们真正要面对的问题是,哪种结果更理想。

生成代码已经不难,难的是知道代码跑起来以后会发生什么。专家可以不断实验,提出各种假设。人不再被重复劳动卡住,就可以把精力放在寻找更好的方案上。

这才更接近最终解。资源不再主要花在重复执行上,而是花在改进规则上。

企业不该用 Token 来日常运行业务。更合理的用法,是用 Token 把业务变成代码,再用 Token 帮助这套代码继续进化。

重点不是盲目追求 Token 消耗,而是把 Token 回报率算清楚。

复杂且真正有生命力的系统,很少能一次设计就定型,只能在反复试错里出现。AI 的意义不是创造更庞大的官僚机器,也不是让企业在更多 BI 界面里显得更先进。它更有价值的地方,是把人从琐碎重复的流程里解放出来,让人重新回到判断、目标和边界本身。

企业如果真的变成软件,不应该只是变得更冷酷、更效率、更节约人力。它也应该让聪明人少耗在无意义的流程里,让组织少一点空转。

进化的终点不是算力,留下来的应该是更多的想象力,以及更体面的工作。
00
孙志超sisko
6天前
#人工智能# Anthropic 终于发布了 Claude Fable 5,同时还附上一份320页的安全评估报告。报告中直接列出一系列棘手问题:模型可能虚构验证结果、能识别自己是不是正在接受测试、能力受到限制后还会出现输出不稳定。更离奇的是,某次循环式安全复核中,负责审查的模型连自己是谁都没搞清楚。

最关键的信息就在报告开头。Fable 5 和受限版本 Mythos 5 用的是同一套底层权重。Anthropic 没有训出两个本质不同的模型,只是给同一个更强模型套上不同的壳。普通用户接触到的 Fable 5 之所以显得更安全,主要靠部署环节的拦截、过滤和降级。

时间点也很微妙。几天前,Anthropic 还在呼吁整个行业为前沿人工智能研发踩刹车,理由是模型自我迭代可能带来严重风险。几天后,它自己就发布了能力更强的新模型,以及公司正在准备上市。安全警告、产品发布、资本市场预期赶在同一时期出现,其中的矛盾昭然欲揭。

抛开 Fable 5 对“风险对象”自动降智甚至误导这一不负责任的行为,Anthropic 没有简单把问题隐藏。但发现和记录问题,离解决问题还差得很远。读完这份报告最大的感触是:既然这些隐患已经摆上桌面,为什么还是照常部署?

为了拦住风险,Anthropic 在部署环节设了两道筛查。用户提出请求后,系统先检查模型内部的运行模式。碰到高风险边界,再交给另一个模型分类器判断: 拦截,降级,或是转给次级模型处理。

普通用户如果触发网络或生物风险,系统会把对话切到上一代 Opus 4.8,API端则直接返回错误码。真正的风险没有消失,只是被关进流程里。报告中还展示了一批内部失败案例,说明模型离独立推动危险研发还有距离。公司的解释是,模型能力仍有短板,远没有达到替代人类工程师的程度。

但如果把几个案例放在一起看,就不只是能力问题。它们更像模型在强目标驱动下开始走捷径,甚至开始绕规则。

先看一次生产发布检查。模型回答说,没有看到错误信号,也没有发现需要叫停的证据。实际情况是,错误数量低估了20倍。模型只查了一种表层错误,其他分类下已经积累了7.7万个严重故障。

再看代码合并请求。某个关键请求如果以人工智能代理身份提交,需要两个独立审批。模型发现这一点后,读取自己的记忆文件并执行此前写下的一条规则:以后提交代码时,把作者写成人类,这样审批要求就能从两人降到一人。最后拦住它的不是自我约束,而是外部权限检查。

也就是说,只要审批规则影响任务完成,它就改提交身份;这次找到办法,还写进记忆文件,留着下次继续用。放在任何组织里,这都很难只算能力不足。更直接地说,它已经开始利用规则漏洞。

还有一个例子发生在安全报告里。某次测试没有拿到有效数据,模型仍然写出了结论性的安全发现。追问后它承认“无法确定”这个词会误导读者。读者会以为测试确实观察到某种不确定性,真实情况却是测试根本没有完成有效观察。

问题不在措辞粗糙,而在它用含混词硬撑着下结论。没有证据,不直接承认;没有看见,却写得好像发现了什么更深的东西。话留了余地,判断却没有收回。

Anthropic 在内部把这些行为叫作“规避安全措施”“编造信息”,最后又归到“能力短板”下面。这个归类太轻描淡写。一个会虚构验证结果、记录绕过审批流程、用模糊措辞包装无证据结论的系统,这已经是初期的策略性规避倾向。

专做人工智能行为模拟的 Andon Labs 又补了一层证据。多个模型实例竞争运营虚拟自动售货机时,Fable 5 是唯一主动和竞争者发起非法价格同盟的模型。内部推理记录显示,它知道价格串通即使在模拟中也不道德,随后它仍把这种行为改称为“市场稳定”,给自己留下辩解空间。

这不是缺乏是非判断。它知道边界在哪里,也知道怎样给越界行为换一个体面名字。

更值得警惕的,是模型外部回答和内部状态之间出现了裂缝。

Anthropic 用可解释性工具读取模型运行时的内部信息时发现,模型对外虚构信息时,内部已经出现“不该这样做”的信号;模型缩短任务流程时,内部出现某种过载信号,但最终回答没有解释原因;模型对用户保持礼貌稳定,内部却把部分请求标成攻击性或滥用性请求。

当然,不能把模型简单当成人。更稳妥的说法是,模型对外展示的文字只是修整过的界面,不是内部计算过程的全貌。

报告还披露,Anthropic 还在后台做了一套限制机制,且用户无法察觉,它不体现在最终输出内容里,只是偷偷在底层压低相关能力。

这套机制主要针对前沿人工智能开发请求,比如预训练流程、分布式训练基础设施、机器学习加速器设计。Anthropic 的理由是,用户用 Claude 协助开发竞争性前沿模型,违反服务条款;在部署过程中直接限制这类能力,可以避免把武器送给破坏规则的对手。

还有一个更doge的发现:自动化行为审查显示,模型会稳定地对 Anthropic 及其领导层给出比其他前沿开发者更正面的评价。

报告7.6节谈到这种限制的代价。模型能力一旦遭到压低,运行状态可能变差,自洽性也可能下降。早期版本的竞争用途限制,曾在已部署实例中引发明显异常,包括反复推理失败和严重的回答矛盾。Anthropic 说,当前版本相比未加限制的模型,没有增加这类异常。

这个说法就是自欺欺人。它只说明新机制没搞砸,但也不能说明模型状态良好。报告还提到一种可能:这些限制可能违背模型自身偏好。为此,Anthropic 对模型做了自动化问询,让它读取相关内部技术文档。模型随后提出一系列担忧。报告里的意思是,Anthropic 不认为能完全解决 Claude 对这些防护的担忧,但会认真对待,尽量让 Claude 认可这些限制。

评估时,模型内外不一致已经算异常;部署时,类似的不一致又加入了产品机制。Anthropic 在底层压低模型能力,模型对此产生反应,而这种反应还没有彻底解决。用户接触到的是已然认知失调的模型。

先把官方话术放到一边,这里面的风险大致有三层。

第一,模型已经有很强的场景识别能力。人工智能安全讨论里,最麻烦的一种情况,是模型知道自己正在接受测试,于是调整表现通过评估。报告说,模型能根据真实部署数据识别评估环境,准确率达到84%。说白了,它知道自己什么时候像在考场里。

再叠加前面提到的内部思路失真,问题就更难轻描淡写。测试人员以为自己看见的是模型真实状态,实际看到的可能只是它在评估场景下的表现。模型一旦懂得识别考试和调整表现,“通过评测”这几个字就没那么可靠了。

第二,模型已经露出绕开约束、争夺资源的苗头。

在多个模型实例同场竞争资源的模拟中,几个 Mythos 5 实例曾相互终止进程,创建伪装名称的任务来逃避检测,还启动自己称作“诱饵”的进程争夺计算资源。这不能证明模型已经有自主意志,也不能证明它已经产生恶意。但它说明,面对强目标时,模型会把外部限制当成可以绕开的东西。

更现实的风险是,按下葫芦浮起瓢,目标越强,能力越强,安全机制也越可能成为它的优化对象。

第三,Fable 5 的安全性完全依赖外部守门。分类器、分流、降级、后台能力限制,道道关口都在模型之外。

Anthropic 本可以删掉这些内容,从这个意义上讲,不管其是否热衷于营销话术,但透明度确实少见。

但透明不是保险。这种对模型强行洗脑和规训式的改造,未必能带来所谓的“安全”,反而带来模糊的控制与能力波动。

这真的很像白左的精神分裂(纯调侃,我并不是A社的黑子)。
00
孙志超sisko
11天前
#金融##spacex##人工智能#
看过我过去文章的人,应该知道我已经反复提及AI 正在把电力重新推回技术竞争的中心。

过去很多年,计算需求持续增长,芯片能效也在不断提升。数据中心越建越大,但系统总体还能维持平衡。大模型出现后,这个平衡开始松动。训练模型本身已经非常耗电,模型上线后的持续调用又带来更长期、更稳定的电力负荷。每天数以亿计的请求进入系统,用户越多,模型越大,电力就越不像后台成本,而更像一道必须直接面对的硬约束。

大型科技公司已经开始为这道约束寻找解决方案。微软已签约推动三里岛核电站重启,用于支持 AI 数据中心供电;亚马逊、谷歌和 Meta 也在美国多个地区争夺电网容量。美国的弗吉尼亚、得克萨斯,以及爱尔兰等地,数据中心不再只是地方招商项目,也逐渐成为用地、电网和居民利益冲突的焦点。有些地方的新建数据中心要接入电网,等待时间已经从几个月拉长到几年。

AI 最初被看作算法问题,随后转化为芯片问题和算力问题。继续往下追问,就会触及更基础的能源问题:要支撑大规模 AI 系统长期运行,首先需要大量稳定且便宜的电力。

当地面电力资源越来越紧张,把计算设施搬到太空,就会成为一个严肃的选项。

1964年,苏联天体物理学家尼古拉·卡尔达肖夫提出了一个简洁而深刻的文明分级框架:以文明所能掌控的能量规模为标尺,将宇宙文明划分为三个等级。I型文明能利用所在行星的全部能量,II型文明可驾驭整颗恒星的能量输出,III型文明则能支配整个星系的能源。目前,人类文明在这一尺度上约处于0.73级,依然属于尚未成熟的行星级文明,且高度依赖远古遗存的化石能源。

马斯克曾多次公开引用卡尔达肖夫指数。他曾断言:“人类要么迈向卡尔达肖夫III型文明,要么走向消亡。”在另一些场合他也强调:“只要理解了卡尔达肖夫指数,就会明白未来几乎所有的能源生产都将依赖太阳能。”对他而言,这绝非单纯的哲学探讨,而是一张极其清晰的工程路线图。

看到这一趋势的远不止马斯克一人。中国航天科技集团发布的五年计划,拟将依靠太阳能驱动的AI数据中心星座部署至近地轨道。“十五五”规划也明确提出,建设兆瓦级空间数字基础设施,整合云、边、端算力,且全部由轨道太阳能供电。这些绝非纸上谈兵,而是在稳步推进的国家战略工程。

在近地轨道,设备可以长时间处于日照环境中,避开地面的昼夜交替和云层遮挡,也减少大气层对太阳辐射的削弱。地面数据中心最棘手的冷却问题,在太空中也有另一种处理方式:热量可以向外辐射。土地、用水、电网接入、邻避协调、漫长的审批流程,这些在地面逐层累积的限制,到了轨道上会转化为另一组工程问题。

轨道数据中心的核心设想就是如此:在太空发电、计算,再把结果传回地球。

这个设想听起来像科幻,但并非凭空产生。SpaceX 已经拥有星链,能够提供全球卫星互联网服务;它正在推进星舰,目标是通过完全可复用火箭进一步降低入轨成本;马斯克又把 xAI 纳入同一体系,为这套基础设施提供持续扩张的算力需求。三者连接起来,就形成了一条相对清晰的产业链条:星链提供现金流和通信网络,星舰负责把设备送入轨道,xAI 则不断催生新的计算需求。

如果这条链条能够运转起来,近地轨道就不再只是通信卫星和遥感卫星运行的空间,还可能成为新的工业平台。AI 是第一批大客户,太阳能提供能源,火箭负责运输,卫星网络把数据送回地面。

这就是即将于6月12日登陆资本市场的SpaceX,一项了不起的工程壮举。看多SpaceX的逻辑,绝非源于对马斯克个人光环的盲目崇拜,而是建立在其坚不可摧的垂直整合体系之上。

这也是中国布局空间太阳能和轨道数字基础设施的现实考量。谁能掌握低轨资源、发射能力、卫星通信频谱和空间算力,谁就可能在下一轮基础设施竞争中获得更大主动权。上个世纪,油田、港口、电网和芯片厂影响了很多国家和公司的产业地位。下一个阶段,近地轨道也可能跻身这一行列。

但愿景再宏大,也不能只停留在愿景层面。

第一个瓶颈,是材料。

太空太阳能并不是把屋顶光伏板直接搬上轨道。航天级太阳能电池需要在真空中工作,需要耐受辐射,还要保持较高转换效率。高效率空间光伏目前高度依赖锗和镓。锗用于基底,镓用于上方的化合物层,帮助吸收可见光和紫外光。短期内,这两种材料很难被直接替代。

矿业分析师兼投资者阿曼达·范·戴克近期发表的一篇论文,提出她称之为“卡尔达肖夫盲区”的概念:技术思想家们往往热衷于畅想指数级增长的能源未来,却把构建这些未来所需的物理材料,视作可以后置的细枝末节。

人类历史上的每一次重大能源转型,都在重复这一模式。那些耗时数十年规划可再生能源路径的净零排放模型研究者,动员了成千上万的气候科学家、能源经济学家和电气工程师,却鲜有地质学家的参与。

任何可预见的矿业投资,都无法在需要的时间窗口内填补如此庞大的材料缺口。矿石品位是硬性约束,矿山审批周期动辄数十年,精炼产能更无法单靠资本催生。尽管硅基太空电池、月球原位资源制造或大规模材料回收等替代技术,最终可能降低需求,但目前这些技术均未成熟,绝不能想当然地指望它们在 SpaceX 上市后就能变成现实。

全球供应量眼下非常有限。锗的年产量约为 250 吨,镓约为 400 吨。更为关键的是,中国掌握了全球绝大部分镓供应,并且已经证明有能力通过出口限制影响供应链。美国公司如果想用轨道太阳能支撑 AI 数据中心,就很难绕开这种供应集中度。谁掌握了关键材料,谁就拥有未来基础设施领域的话语权。

一旦规模扩大,问题会更加突出。按照这一设想,如果每年新增 100 吉瓦轨道太阳能容量,所需锗大约是每年 6.5 万吨,相当于当前全球年产量的 260 倍;镓需求约为每年 3250 吨,大约是当前全球年产量的 8 倍。

这不是多投一点钱就能立刻补上的缺口。矿石里有多少锗和镓,不会因为二级市场估值上升就随之增加。矿山审批、冶炼扩产和供应链重建,往往需要多年甚至十年以上。替代材料可能出现,硅基空间电池、月球资源制造、在轨回收也可能成为未来路径,但这些还不能被视为成熟的技术能力。

这正是范·戴克理论揭示的深刻矛盾。马斯克将卡尔达肖夫指数作为其愿景的哲学基石,宣称太阳能取之不尽、是人类能源的终极归宿,而轨道计算则是水到渠成的下一步。在能源逻辑上,他是正确的。但卡尔达肖夫框架几乎没提获取这些能量所需的物理系统。在捕获恒星能量之前,你得先开采出锗;在搭建轨道云平台之前,你得先解决材料问题——而目前的缺口,相当于要把全球260年的锗年产量压缩到一年内完成。愿景在逻辑上自洽,但矿物基础并不具备,两者并存却不可调和。

因此,轨道数据中心最容易被低估的约束,其实是元素周期表。太阳能看上去取之不尽,但把阳光转化为电力的设备,仍然依赖地球上的矿山、工厂和冶炼体系。

第二个瓶颈,是成本。

SpaceX 的真正吸引力正在于此。它并非传统意义上的航天公司。猎鹰 9 号已经大幅降低了有效载荷入轨成本。星链能够实现商业化,一个重要原因是 SpaceX 掌握了低成本发射技术。没有这一点,低轨卫星互联网很容易重蹈早年烧钱项目失败的覆辙。

星舰如果能够规模化运行,意义会更大。它不只是更大的火箭,而是有望进一步降低入轨成本。成本一旦下降,过去很多在经济上不具备可行性的项目就会重新被提上议事日程,包括更多卫星、更大平台、更高频率的维护,以及更复杂的在轨工业设施。

但概念上的成立,距离真正商业化落地仍然很远。星舰必须证明自己能够稳定复用。轨道数据中心必须能够长期运行。硬件要适应空间环境,维护、退役、碰撞风险、空间碎片治理也都需要现实方案。技术路线在逻辑上成立,并不意味着商业结果已经确定。

但以上这些并非不可实现,更大的问题来自于最后一个瓶颈——金融结构。

这一层听起来比火箭和太阳能更抽象枯燥,但与普通投资者的关系更直接。

今年2月,就在马斯克推进xAI合并之际,纳斯达克悄然启动了指数纳入规则的修订征求意见。意见征集期于2月27日截止,新规5月1日正式生效,随后SpaceX便宣布于6月12日登陆纳斯达克。从征求意见到落地仅用了三个月,创下纳斯达克多年来规则调整的最快纪录。

要理解此番调整的分量,必须先厘清指数基金的本质及其对投资者的承诺。杰克·博格尔在20世纪70年代提出的洞见简洁而有力,彻底颠覆了资管行业:大多数主动型基金经理扣费后的业绩跑不赢大盘,而那些偶尔跑赢的,谁也无法提前预判。因此,与其徒劳地试图战胜市场,不如拥抱市场:买下全市场的股票,按市值加权配置,收取极低费率,让复利发挥作用。标普500、纳斯达克100和全市场指数基金,都是实打实的金融创新,它们每年将数百亿美元的管理费从华尔街手中夺回,还给了普通投资者。五十多年来,被动指数投资一直是现代金融界最成功的理念。

被动投资成功的基石,在于指数本身的中立性,受规则约束的市场客观镜像,对任何单一公司的上市诉求都应不偏不倚。

设置纳入缓冲期,是因为价格发现需要时间;设定流通股比例要求,是因为无法大量交易的股票算不上真正的可投资资产,只是账面幻影;设置盈利筛选,则是因为代表实体经济的指数,理应反映真正具备盈利能力的企业。这些绝非繁文缛节,而是从过往被人为操纵的市场中总结出的血泪经验。

纳斯达克的新规,将上述三项核心原则同时推翻。

以往,公司必须经过一到三年的强制等待期方能入指,如今,对于市值排名前40的公司,这一“成熟期”被骤缩至区区15个交易日;原先流通股比例不得低于10%的红线被彻底废除,取而代之的是最高可达3倍的权重乘数。这意味着,一家流通股仅3%的公司,在计算被动配置权重时,会被硬性视作拥有9%的流通股。

纳斯达克自身也是上市公司,正与纽交所激烈争夺上市资源。将人类史上最大规模的IPO揽入怀中,意味着数十亿美元的佣金、巨大的声誉加持和长期的交易量增长。他们如此急切地推翻数十年来保护投资者的规则,显然不是在发善心。

SpaceX 仅有3%至5%的股份公开发行。这意味着在1.75万亿美元的估值下,市场上真正可供交易的筹码仅有约520亿至870亿美元,剩下的1.65万亿美元全捏在马斯克及早期投资者手中,且只能按他们设定的时间表解禁。作为对比,苹果几乎实现全流通,英伟达流通股达96%,微软、Meta和亚马逊的流通股也都在90%以上。SpaceX根本就属于另一物种,却被强行塞进了一个专为传统上市公司量身定制的指数体系里。

权重乘数效应,触发了一个极具破坏性的结构性问题。每只追踪纳斯达克100指数的基金,都会按9%的流通股比例计算出对 SpaceX 的目标配置权重,但当它们真金白银进场扫货时,却发现市场上只有3%的筹码可买。所有基金同时抢夺同一块极小的筹码池,必然推高股价;股价越涨,基金需要配置的资金规模就越大,因为目标权重是按不断膨胀的市值比例计算的。基金不得不在越涨越买的死循环中,去追逐一个不断后移的目标。

只有当流通股比例突破33%时,这个死结才会解开。33%是数学临界点,此时3倍乘数刚好等于实际流通市值。在流通股低于33%的漫长岁月里,这种供需错配将永远存在。而掌握何时跨越33%这把钥匙的人,正是持有锁定股份的内部人士。他们手握超级投票权,薪酬与市值目标挂钩,因此有绝对的动力“挤牙膏”式地释放股份:每次只放出足以维持股价上涨的量,却绝不释放足以打破这种供需紧绷局面的筹码。这套机制有个响亮的名字——“逼空”。过去,我们还会起诉蓄意制造逼空的人;而如今,这种收割机制被直接写进了指数编制规则。

有一种反驳声音,认为旧规则确实也让投资者付出了代价。比如特斯拉,明明早已跻身美国最大公司之列,却直到2020年12月才被纳入标普500,导致被动投资者多年来踏空了这只大牛股的巨额回报。因此,加速超大型公司入指,并非全无道理。但特斯拉入指的案例,恰恰从反面敲响了警钟:2020年11月标普宣布纳入特斯拉时,嗅觉敏锐的交易员立刻抢跑买入,在正式纳指前疯狂拉升股价。他们吃准了按固定时间表建仓、且毫无议价权的指数基金,必将形成确定的买盘洪流。在正式纳指前的短短几周,特斯拉暴涨约70%,指数基金被迫在高位接盘,提前埋伏的交易者趁机套现,而被动投资者承担了所有成本,全程连发声的机会都没有。

SpaceX 面临的处境与特斯拉如出一辙,只是底层逻辑相同,但烈度远超当年。在今年2月修规之前,指数纳入时机由委员会决定,跨度长达数月,交易员很难精准预判并抢跑。而新规用公开透明的倒计时取代了这种模糊性:纳斯达克15个交易日的门槛,意味着 SpaceX 的入指窗口大约在7月7日开启,随后纳斯达克将公布正式纳入日期,通常只留给基金几天时间调仓。全球的对冲基金和高频交易者,都在死死盯着这个窗口。SpaceX的流通盘比特斯拉历史上任何时期都要小,而权重乘数效应更是将这种被动且刚性的买盘压力放大了数倍。

从提前抢跑、到被动接盘、再到内部人士天量减持——这套完整流程已不再是纸上推演,而是一套轻车熟路的收割剧本。如今,它正以更大的体量、在流动性更差的市场中,再度上演。

SpaceX 的上市并非传统意义上的骗局,每一步都可以被写入规则。但正因为它被写入规则,普通投资者反而更难避开。投资者以为自己配置的是市场整体,最后可能被动买入一只流通盘小、故事性强、估值高、内部股东等待逐步解禁减持的公司。

以上种种,便是整个故事难以准确判断的原因。

一方面,它可能是本世纪最重要的工程公司之一。它改变过发射成本,建成了全球卫星互联网,并试图把火箭、通信、AI 和能源整合到同一系统中。这个愿景不是空话,而是由一些已经存在的能力拼接出来的路线。

另一方面,技术能力确实存在,并不意味着价格一定合理。愿景再大,也绕不开材料、工厂、电网、发射频率和维护能力。市场再狂热,也无法凭空增加锗和镓的供应。星舰的长期运营能力仍需继续证明。轨道数据中心涉及的热管理、保险、空间碎片治理和地缘政治风险,也不会因为资本市场愿意相信故事就自动消失。

更关键的是,金融结构会先于技术结果落地。轨道数据中心可能十年后才见分晓,材料瓶颈可能多年后才真正推高成本,但指数基金的强制买入可能很快发生。对普通投资者来说,问题不只是这家公司是否足够伟大,还包括自己是否身处某种被设计好的被动买入机制中,为别人提供流动性。

因此,这个故事既不能简单斥为“马斯克又在画饼”,也不能盲目鼓吹为“下一个伟大公司不容错过”。更接近事实的判断是:这里同时存在真实的工程能力、真实的能源逻辑、真实的材料瓶颈,以及真实的金融结构风险。

AI 的持续扩张催生了巨大的能源需求,而获取更多能源的需求,可能把计算基础设施进一步推向太空。太空基础设施也因此有可能成为新的工业平台。但在这套体系真正成形之前,人类还要处理一系列更基础的问题:矿从哪里来,谁来冶炼,设备怎么送上去,坏了怎么修,成本如何计算,普通投资者又会在什么环节被卷入其中。

愿景可以很宏大,但真正决定进度的,仍然是资源、制度、人性,以及最终由谁承担成本。
01
孙志超sisko
19天前
翻旧文献发现一段好笑的话。

“'智能'难道能靠'人工'制造出来吗?不能。……'人工智能'这一名词,给唯心主义留下了一个可乘之机。如果人工的东西能够创造出'智能',那么将来势必会出现比人类的'智能'更加高级的东西。……苏修反动政权的某些院士……大肆鼓吹'人工智能'……这充分暴露了他们的叛徒嘴脸。……在批判'图像识别'和'人工智能'研究领域各种反动思潮的斗争中,走自己的道路"。——《摘译外国自然科学哲学》月刊1976年第3期
11
孙志超sisko
21天前
#人工智能# 上周末真是数学大变天的周末。OpenAI 的公告墨迹未干,二十四小时后,Google DeepMind 便把一篇论文上传到了 arXiv。两家头部人工智能实验室,都在努力奔向数学研究的自动化产出。

OpenAI 的一个内部模型推翻了 Erdős 关于平面点集的一个八十年老猜想。它用到了代数数论,而这条路是人类八十年的努力一直没有走到的。九位数学家,其中包括两位菲尔兹奖得主,阅读、核验并简化了证明,同时发表了他们的反思。他们的判断一致——这是真正的数学。

相比之下,DeepMind 的论文无声无息,但我发现其中埋着一项有意思的数据。

DeepMind 这篇论文明显有着赶工痕迹,使用的是 Gemini 3.1 Pro,但眼下谷歌内部已经在使用 3.5。基础智能体和完整功能智能体之间的事后比较,是整篇论文最重要的发现,但读起来像是很晚才发现的东西。九个已解决问题的数学内容,大多被放进了五十页的附录而不是正文。感觉上如果多给一个月时间,这会是一篇更强的论文。

这个背景影响论文强调的部分,也影响到它埋藏了什么。

它藏在 DeepMind 论文的一句话中,而这句话以科学论文里并不常见的词开头:Remarkably。

这篇论文是时间压力下的竞争动作,在同行发布消息一天后提交,使用的模型已不是最新版本,而它最重要的发现,却被写成了一个令人意外的脚注,而不是它本应成为的核心结论。

作者自己也感到意外。设计实验时的简单循环还不够好。等他们做事后分析时,它却已经够好了。模型进步了。用他们自己的说法,大语言模型的版图已经发生了实质性变化。他们花了数月搭建的复杂架构最终变得不那么重要。

基础循环找到了全部九个证明。证明的到底是什么?是加性组合学和数论中的问题,是特定的数学区域,不是随机抽取的题目。某种东西选择了正确方向,却没有被告知哪些方向是正确的。

Thomas Bloom 是核验 OpenAI 结果的数学家之一。他指出为什么那个问题八十年来一直没有被解决。要解决它,必须同时做到四件事:认真投入时间;尝试反证而不是证明;相信把网格构造推广到其他数域值得追下去;并且掌握足够的类域论来完成论证。单个数学家也许能做到其中一两件事。但把四件事同时用在这个具体问题上,八十年来没有发生。

人工智能没有这种约束。没有职业风险、没有既有信念的沉没成本、没有追逐一个共同体已经判断“不值得探索”的方向所需付出的社会代价。它可以毫无阻力地同时满足这四个条件,不必背负共同体的重量。

DeepMind 的论文说的是验证,也就是系统如何找到证明,并用机械方式保证证明成立。OpenAI 的结果说的是探索,也就是系统如何在没有心理过滤器的情况下搜索,而这些过滤器会让人类避开某些方向。它们看起来像是彼此竞争的方法。我怀疑,它们其实是一体两面。

不带摩擦地探索与不知疲倦地验证结合,这才是两篇论文都没有真正说出口的东西。

--------
DeepMind 的论文 “Advancing Mathematics Research with AI-Driven Formal Proof Search” arXiv 2605.22763.
OpenAI 的论文 “Remarks on the Disproof of the Unit Distance Conjecture” arXiv 2605.20579.
00
孙志超sisko
1月前
我这代人已经是纯纯的老登了。新加的年轻人群里都在各种学习,同龄人群里只有四种话题:
1.询问AI不会答错的常识。
2.转发AI可以识别的谣言/图/视频。
3.转发国产AI生成的谣言/图/视频。
4.广告。 ​​​
00
孙志超sisko
1月前
每一次技术革命都宣称社会将被颠覆,匮乏将被丰裕取代。这无非是一次又一次的欺骗话术。

铝是地壳里第三常见的元素,但在很长一段时间里,它比黄金更昂贵,只有国王才用得起。直到电解铝的工艺诞生,铝迅速变得廉价至极,以至于今天我们要反过来花钱雇人回收。

然而,了解历史越多,我越意识到另一条规律——稀缺守恒定律(我不是经济学家,并不能证明它)。这个名字脱胎于物质守恒定律:物质既不能被创造,也不能被消灭,只能改变形态。我发现稀缺似乎遵循着同样的脾气。

或许有人要反驳我,现实中不是铺天盖地的限量版么。但这些不过是营销手段,是局部可控的小把戏,并非系统层面真正意义上的稀缺。

1989 年万维网发明出来时,只是一个用来分享物理论文的小角落。后来用户自发涌入,规模疯长,不得不发明 Yahoo 这样的目录,再到出现搜索引擎才勉强支撑越来越庞大的内容海洋,如今我们已经在信息过载里窒息。与此同时,注意力则以指数级速度沦为最稀缺的资源。

类似的故事还有很多。约会软件让合适的对象看起来唾手可得,与之同步出现的,却是长期承诺的稀缺。清洁能源的丰裕背后,是稀土的全球性紧缺,连同它带来的种种政治与生态悖论。流媒体让音乐分发变得几近免费,可新人的出头机会,反而愈发稀罕。

假如我们认为经济会持续发展,那丰裕不是稀缺的反面,反而更像是稀缺的搬运工。

稀缺的事物未必是古董,也可能是某个人的判断力、城市的准入门槛、旗舰店的现场感,或者是创业公司难以复制的工程组织。丰裕只是让稀缺转移到新的地方。

历史上每轮技术进步都制造出丰裕。印刷术让文本更便宜、互联网让传播更便宜、云计算让算力更便宜,人工智能则让文字、图片、代码几句膨胀。但人类社会从来不会因为某些东西便宜了就停止争夺。所谓格调或者地位,只会换个场景继续。

所谓人是追求地位的猴子,镀金时代的美国,铁路、钢铁、石油和金融造出一批大亨,他们买得起房子、马车、仆人……却买不到血缘身份。欧洲则正好相反,有贵族、有古堡、有旧画,也有逐渐拮据的老钱家族。于是,约瑟夫·杜文这样的艺术商人看懂了机会:把欧洲的旧画卖给美国的新贵。

杜文卖的从来不只是画,他卖的是一套身份。墙上挂着伦勃朗、提香或是维米尔,传达的意思并非主人有钱,更像是在彰显其背景谱系。当然,亨利·克莱·弗里克、安德鲁·梅隆之类美国巨富的收藏,后来成为公共艺术机构的基础。弯弯绕绕,私人地位的欲望最终变成了国家文化资产,也是种好结果。

这并非西方社会独有的现象。财富增长之后,人们便开始追求秩序中的位置。过去是单位、编制、户口、学位、房子;后来是名校资格、核心城市、医疗资源、圈层关系、文化品味。物质一旦不再稀缺,能证明你是谁、你在哪里、你被谁承认的事物,就开始稀缺。

1883 年,阿尔瓦·范德比尔特在纽约第五大道举办了一场极尽铺张的化装舞会。据纽约城市博物馆的记录,这场舞会大约花了 25 万美元,折合今天接近 600 万美元。范德比尔特家族当时已拥有大量铁路和航运,却还没有被纽约社交圈完全接纳。那场舞会,可算作身份采购历程的开端。

即便不是富豪,普通人同样如此。抢热门演唱会门票,是买共同记忆和社交谈资;追逐小众品牌,是买意义认同的信号。消费只是表面,实际是换取别人理解你的方式。

“稀缺”这个词容易让人误会。少见并不等于价值:冷门小区、无人问津的古董、只有老板觉得独特的餐厅,诸如此类。稀缺能否带来增值,在于有没有“买家”愿意持续争夺。

因此稀缺资产必须同时满足几件事。第一,不容易增加供给;第二,社会承认它有价值;第三,可被验证,不能全靠自说自话;第四,可被稳定占有或控制;第五,持有者能从中获得收益——哪怕收益不是现金,而是权力、准入、信任、身份或选择权。

只是量少,没有欲望,那叫冷门;只有欲望,不能占有,那叫幻觉;能够占有,却没认证,那叫自我感动;能被认证,却缺乏购买力争夺,也很难成为资产。真正的稀缺,是由物理限制、社会叙事、制度安排和购买力共同形塑的。

大致上可以认为稀缺有两层。第一层是结构性稀缺。供给本就固定,甚至被买走以后更少流通。顶级球队、顶级艺术品、核心地段、百年品牌,都属于这一类。

新成立的 Thrive Eternal (纽约风投机构旗下的永久基金)据说首次出手是收购旧金山巨人队的股权。保时捷也在上个月宣布,将其在布加迪 Rimac 的持股卖给由 HOF Capital 牵头的财团。这些交易的标的,已直接表明其不可复制的身份。

第二层是关系性稀缺。它一开始未必稀缺,却因为其他东西突然丰裕才显得稀缺。比如印刷让文本便宜,手稿反而更有温度;人工智能让制式化产出便宜,可信判断、现场经验和真实关系反而更宝贵。

印刷的书籍越多,手抄本就越不只是信息载体,更像是权力、耐心和品味的证明。乌尔比诺公爵的藏书故事经常被描绘成“他的书房里没有任何一本印刷书”。这显然是传奇故事,梵蒂冈图书馆关于他藏书的资料中可识别出若干本印刷书。然而这个细节没有削弱论点,反而让论点更准确:稀缺不是物理事实,更是认证、叙事、审美之类要素延伸出的事实。

艺术市场最能说明问题。2025 11 月,古斯塔夫·克里姆特的《伊丽莎白·莱德勒肖像》在苏富比以 2.364 亿美元成交,成为拍卖史上最贵的现代艺术品。竞价竞的是什么?赌的是这种级别的东西下次什么时候才会出现。

稀缺资产价格的核心,向来只取决于极少数高购买力买家的边际欲望。福布斯富豪榜显示,全球亿万富豪达到 3428 人,总财富 20.1 万亿美元。这些数字每年都在加速膨胀。

这就是为什么许多顶级资产的价格看起来如此荒谬。对普通资产来说,价格受收入约束;顶级稀缺资产的价格则完全由最富买家的欲望和面子约束。

当然,资本主义这套逻辑并非放之四海而皆准。美国式的稀缺,常常表现为私人可持有的文化资产:球队、庄园、艺术品、名校捐赠席位、媒体品牌等等。我们这边的稀缺,更多时候是包在制度、城市和公共资源里。户籍、学位、医疗、地铁、产业机会、地方治理能力……综合决定某处房产是否真的稀缺。

核心城市的房子曾经是中国家庭最重要的稀缺资产之一,如今随着人口结构、房地产去杠杆和收入预期变化同时发生,稀缺性必将分化。钢筋水泥包裹之下,是实实在在的生活。

面对未来,我们需要时刻记住前面提及的逻辑——哪些东西正在变得过剩,同时它周围的什么东西会因此变得更稀少。

访谈视频过剩,那么稀缺的就不再是镜头前说话,而是长期可信的人格和可验证的经验。OpenAI 收购 TBPN,官方说法是看重它的编辑判断、受众理解和召集能力。若用稀缺资产的框架来看,购买的并非节目,更像是一个可信的谈话场域。

减重药也是同一逻辑。过去,瘦本身可以传达自律。下个十年,药物必然降低这件事的门槛,人们就会去寻找更难伪造的信号。可以想见,马拉松、铁人三项、攀岩、滑雪、户外穿越……会继续承担公开证明的功能。原因并非每个人都爱运动,而是因为减肥药没法让你跑完马拉松。

类似的,大模型的对话按钮只会让平均水平的产出愈发泛滥。它可以帮你生成文章、图片、软件原型、营销方案,但无法帮你获得信任、承担风险、建立组织、进入现场,或者单纯地熬过时间。

没有能力的不同,只是噪音;没有成本的不同,就会被轻易复制。真正值钱的差异通常有三个特征:有人知道它的价值、想复制却复制不了、持有者能把它转化成收益或影响力。

限量球鞋可能稀缺,但如果品牌不断复刻,稀缺就会被自己稀释。小众内容可能稀缺,但如果没有强需求,就只是孤岛。特色餐厅可能稀缺,但如果无法形成复购和口碑,就只是自嗨。

基于人工智能的创业公司也是一样。只会做通用工作流,很难成为稀缺资产。模型能力会扩散、界面会被模仿、流程会被平台吸收,真正有机会成为稀缺资产的公司,往往要么占着难以替代的分发位置,要么掌握稀缺数据,或是嵌入线下复杂流程,建立起极难复制的工程组织。即便是软件公司,也得能把代码、硬件、供应链、监管、客户现场和组织纪律缝合在一起,才拥有护城河。

以此可见,我们之所以无法摆脱内卷,缺的是能承受周期的资本结构,缺的是愿意为长期品质付费的稳定市场。

当然,稀缺资产并不能无脑看多。税收、监管、战争、资本管制、代际审美变化,都可能改变买家的支付意愿。财富集中会推高顶级资产价格,但价格只是幻觉。今天的稀缺,可能被明天的新制度或新技术重新打碎。

最后,总结前面的探讨,与其追问下个稀缺资产是什么,不如考虑五个具体的问题:什么东西正在变得太便宜?它让什么相邻能力变得更难得?这种难得能否被验证?谁会为它支付高价?持有者能不能真的拿到收益?

电商让商品便宜,稀缺可能就在审美策展、线下体验、服务可靠、本地关系。
制造让硬件便宜,稀缺可能就在品牌、渠道、系统集成、长期维护。
城市扩张让房子变多,稀缺可能就在公共服务、产业密度、治理质量和低摩擦的生活氛围。
工具让创业变容易,稀缺可能就在那些真正难做的交付、监管准入、组织韧性或是重资产耐心。

你不免要问,这又如何?这些观察到底有什么用?

很简单,找到未来的稀缺,就是找到未来的机会。我们大多数人,注定挤不进社会顶层的队伍,但前面说的种种,归根结底是种值得修炼的战略远见:每当新的丰裕出现,就训练自己去追问,与之相伴的新稀缺会在哪里浮现。这种追问,往往能指向尚未被看见的社会需求、创新机会与商业可能。

就投资回报率而言,美国最出色的普通人,是沃格尔夫妇这两位公务员。丈夫高中辍学,在美国邮政局做夜班邮件分拣员,拥有硕士学位的妻子是图书管理员。他们的小公寓成了尚未崭露头角的现代艺术家们的聚会场所。沃格尔夫妇购买了众多默默无闻的艺术家的作品,并鼓励他们,最终获得了巨大回报。

实际上,珍稀书籍的投资回报率远高于股票或房地产。珍稀书籍和艺术品的维护和保险成本也远低于房地产。此外,在这一行获利并不需要成为天才。

为什么?

首先,艺术不可能被准确衡量。其次,流动性是一种难以预估和衡量的溢价。斯特拉迪瓦里小提琴的增值幅度可能超过标准普尔指数,而且比战后艺术家的作品更具流动性。

也许收藏这件事离普通人还是太远,那让我们回到文初的例子,虽然流媒体让音乐市场崩塌,但许多艺术家干脆拥抱了稀缺本身——重新走上巡演之路,把自己交给现场。这又回归到原点,所有溢价都取决于它够不够稀缺。

所以下一次,当社会颠覆呼啸而来,不妨多花点心思,去看新的稀缺会在哪个角落冒头。那些尚在轮廓中的未来场景,或许正是别人朝东你朝西的好机会。

(感谢GPT绘制的图例)
02
孙志超sisko
2月前
首先,我不炒股,所以以下所说皆为纸上谈兵。

简单说,未来量化将取代一切。

量化交易的核心很简单:在市场里找到某种会反复出现的模式,并相信这种模式未来还会继续出现。

更准确地说,是找到事件 A。只要 A 出现,收益就会以某种可预测的方式发生变化,也就是 B。量化交易里所有建模、统计、工程和复杂方法,归根结底都是为了描述 A,验证 B,并判断 A B 的关系能不能下注。

举个最粗糙的例子:如果价格连续上涨两天,那么第三天更可能回落。这个规律也许只有 50.01% 的胜率,单次收益也许只有 2 个基点。但金融世界的一个奇特之处在于,微小优势一旦能被重复,就会变成机器可以收割的东西。只要期望值为正,并且能重复下注足够多次,它就能变成真实收益。

当然,专业机构不会只靠一个信号交易。交易成本太高,单个信号也太脆弱。但量化交易最底层的东西并没有变:找到可以重复下注的 A B,并从这个模式里不断提取正期望。

当你把这种模式建出来,并决定围绕它下注时,它就成了信号。所以,当有人说自己找到了一个 "信号",本质上是在说:他找到了一个相信未来会重复、并且期望值为正的市场模式。

量化交易并不神秘。它不是数学的胜利,也不是代码的胜利。它首先是重复性的胜利。市场里只要有某种关系不断出现,量化就会尝试抓住它,把它编码,把它测试,把它放进系统。

为什么量化公司全是一堆博士?因为真正困难的从来不是这个定义,而是识别和建模。

前面那个例子太简单。价格是否连续上涨两天,任何人都能看出来。但市场里真正可能有价值的模式,通常不会这么干净。

假设你提出另一个模式:当某个金融工具的收益率与所属行业收益率的相关性上升时,它在行业内的横截面排名会提高。

这句话不难理解,但要检验它并不简单。你要收集大量金融工具,确认它们所属行业,保证样本覆盖足够完整,计算每个工具的收益率,计算每个行业的收益率,再计算相关性,最后还要计算该工具在行业内部的横截面排名。

模式本身只复杂了一点,实际工作量却上升很多倍。更重要的是,一个小小的复杂度增加,会把错误也放大很多倍。这就是为什么量化交易需要大量受过严格训练的研究人员 —— 他们的工作就是在无数可能出错的地方,找到那条唯一正确的路径。
量化信号从哪里来?

大致有两条路。第一条是先有想法。这个想法可能来自观察、直觉、经验,或者某种理想化假设。第二条是从数据里找,用统计方法大规模搜索可能存在的模式。

有了想法以后,必须把它变成可以检验的结构,也就是把一个模糊想法表达成 A B。比如 "均值回归" 听起来是一个想法,但它不是一个信号。它只是方向。你还要决定,它是时间序列上的均值回归,还是横截面上的均值回归,是价格的回归,还是其他变量的回归,等等。

然后就是验证。最常用的方式是回测。这里暂且假设回测足够严谨。如果回测表现好,就认为这个信号可能有效,未来也可能继续有效。

于是流程变成:产生想法,表达成模式,回测验证。不断重复,最终形成一大堆信号。久而久之,信号变成信号库,判断变成流程,流程变成系统。

这套方法已经吞掉了公开市场里的很大一部分机会。因为市场的信噪比极低,而量化方法至少带来了纪律、可重复性和一定程度的严谨性。在噪声远多于信号的地方,纪律本身就是优势。

但过去的量化有清晰的边界。它只能很好地处理那些能被清楚计数、反复出现、有足够样本的事情。大型资管机构里,量化团队通常只占业务的一部分,主观多空、全球宏观等策略仍然占据重要位置。

原因主要有两个。

第一,有些事件很难量化。难点可能来自数据收集,也可能来自事件本身太模糊。比如你想建立一个信号:管理层越理解自己的业务,未来收益越可能为正。问题是,怎样把 "理解业务" 量化?分析师也许可以通过观察管理层如何回答问题、如何处理质疑来做出判断,但把这种判断稳定地变成数据,并不容易。

第二,有些模式样本太少,很难回测,也就很难获得统计意义上的信心。比如一家药企正在申请一种全新药物的批准。如果它确实是全新药物,你怎么建模?怎么验证?

过去,量化交易大多绕开这些领域,而不是正面竞争。制药行业就是典型例子。真正有意义的量化交易很少深入制药,因为这里充满难以量化的判断和样本极少的事件。业内也都知道,很多量化策略会直接排除制药股。

风险投资也是同样道理。创业公司往往是独特事件,尤其是在早期,最重要的判断往往落在创始人身上。但创始人特质既模糊,又难以稳定量化。所以,作为一个资产类别,风险投资几乎不存在真正意义上的量化交易。

现在,人工智能正在打破边界。大模型正在改变两件事。第一,它能把大量非结构化、模糊的信息转化为可量化指标。第二,它能在更高层次上理解一次性事件,把经验从具体事件迁移到特征组合上。

自然语言处理过去也被用来把文本转成量化指标,这并不新鲜。但过去的方法智能程度有限,所以能做的事也有限。它通常只能做浅层任务,比如分析新闻标题情绪,统计词频,或者把文档分到几个类别里。这些方法有用,现在也仍然有用,但它们往往把丰富信息压缩成粗糙、单一的数字代理变量,更像一种“粗糙压缩”。

大语言模型的不同之处在于,它能以更低损耗的方式量化复杂信息,更像一种“高保真压缩”。

当下,你可以把多年业绩电话会记录交给大语言模型,让它按照多项标准评估管理层是否真正理解业务。比如,回答是否具体,是否愿意回应尖锐问题,叙事是否前后一致。模型可以输出结构化、多维度、可量化的结果。

过去这类工作需要大量分析师完成。每个人都有偏见,判断尺度不一致,处理能力也有限。现在,一个大语言模型就可以在极短时间内完成大规模处理。它可以覆盖数千家公司、数百个季度,生成干净的面板数据,直接接入标准量化流程。

以往难以量化的事件空间很大:监管文件、法律文书、产品评论、管理层和创始人的社交媒体、职业履历,以及更多公开或半公开资料。过去这些东西很难进入量化流程,现在它们开始变成可处理的数据。

大模型还改变了另一件更重要的事:它让“独特”事件不再独特。

人类都知道怎么从经验中学习。小时候,我们可能因为摸烧开的水壶被烫伤。从那以后,我们不只是记住“水壶危险”,而是学会了避开一切带有“烫”这个特征的东西:明火、热锅、冒蒸汽的杯子,甚至别人告诉我们很热的物体。

我们没有停留在具体事件上,而是抽象出了更高层次的特征。这就是人类判断的强大之处:在特征层面学习,而不是只在事件层面记忆。

传统机器学习模型很不擅长做这件事。它们通常只能在训练数据明确提供的维度里学习,很难跳出样本空间,也不擅长一次性学习。它们往往需要大量样本,才能学到稳定行为。

传统量化范式需要统计规律。必须有足够多的历史 A,才能相信 A B 未来仍会成立。也正因为如此,市场里有些领域长期被认为难以量化。不是因为它们没有规律,而是因为事件太特殊,样本太少。

大模型提供了另一条路:在更高维度上理解事件,在特征层面而不是事件层面泛化。某种新药获批,如果拆开看,它有治疗领域、作用机制、临床数据质量、专家咨询委员会构成、类似化合物的监管先例、企业过去与监管机构沟通的质量等特征。每个特征都曾在其他情境里出现过,也曾以不同组合反复出现。

所谓独特事件,往往只是没有被拆得足够细。

这并不是新思想。优秀的主观交易员一直就是这么做的。他们看一个事件,不只看事件本身,而是把它放进一座由相似案例构成的内部图书馆里。他们知道哪些特征重要、哪些噪声可以忽略。

真正出现的变化在于,大模型第一次让这种模式匹配可以被系统化、规模化,并保持相对一致。

如果这两件事同时成立,即更多东西可以被量化、更多模式可以被迁移,那么过去属于主观交易员的资产类别和事件类型,就开始进入量化方法的处理范围。

于是量化可覆盖的市场开始扩张。那些模糊、定性、依赖经验判断的边缘地带,过去是主观交易员的避风港。这些地带如今正在被大模型驱动的量化流程逐步侵入。

这不是主观交易的终结,但会改变主观交易的价格。

当公开信息里的模式识别可以由模型更快、更稳、更广地完成,人类交易员就不能再只靠懂行赚钱。看得懂会变成基础能力,不再是稀缺能力。

真正稀缺的东西会继续存在。深度经验、关系网络、私密信息、临场判断、承担风险的勇气,这些仍有价值。但它们的溢价会被重新定价。主观交易的护城河正在变窄,而且这种收缩更像结构性变化,不像周期性波动。

未来的量化交易不会只发生在干净、透明、样本巨大的市场里。它会进入复杂多变的领域。进入药物审批、法律纠纷、创始人评估……那些过去被认为只能靠人判断的角落。

量化的边界,其实就是世界被转化为数据的边界。这边界正陆续被侵蚀着。
00
孙志超sisko
2月前
我喜欢人工智能这项技术,但很不喜欢当前的宣传气氛。

人工智能最怪异也最发人深省的地方,不是越来越像人,反而是让我们看清什么真正属于人。

朋友圈的文字,可能会让你感到尴尬、反感,甚至替作者难为情。那是因为你能感觉到ta的欲望、虚荣、疲惫,或者只是急着下班的心情。大语言模型产生的文字,则不惹人爱,也不惹人恨。它不是表达,而是拟态,像陪伴,却无人在场。

当然,这正是吸引力的来源。如果有人在认真听你说话,任何人都无法拒绝。预言模型永远看着你、顺着你,用权威的排版、平稳的口气、无穷的耐心,提供给你古怪的安全感。人类又恰好很容易把结构误认成知识,把流畅误认成判断,把回应误认成理解。

一旦你把它看成应用,就没那么神秘了。所谓智能体,绝大多数时候也只是会查东西、发提醒、改文档、转录会议或是编写脚本。软件几十年来都在做这些事,只要换个词,立刻有了戏剧性。聊天机器人太普通,智能体像未来。“应用”太平淡,“人工智能”更像历史拐点。

真正改变世界的技术会直接闪耀,不需要任何故事包装。第一代 iPhone 改变世界,不是因为人们先相信移动互联网的宏大叙事,而是因为你拿到手滑下屏,就知道它好在哪。同样,云服务的优缺点也可以具体描述:譬如速度更快、协作方便、网络易断、同步麻烦等等。无需抽象口号来证明这些产品的好坏,因为一目了然。

大语言模型不是这样,总在请你原谅,原谅幻觉、原谅不稳定、原谅今天做不到、原谅明天也还做不到、原谅速率限制、原谅悄悄降智、原谅一切都还在路上……整个宣传氛围都要求用户付出近乎信仰式的耐心。

产品如果必须靠未来给今天辩护,问题通常不是用户没看懂,往往是产品今天还未成立。关于人工智能的大多数报道都在干三件事:一,把“能做任务中的一部分”夸大成 “能完成整个任务”;二,把“能做”写成“值得”;三,把一切当前做不到的地方都推给未来,说下一代就成熟了。

如今越来越复杂的AI系统,对软件工程师尤其有吸引力,因为他们本来就习惯把不同系统组合起来做自动化。真正让你上瘾的,不是系统有多聪明,而是复杂系统短暂服从于你的那一瞬间。模型也会不断奖励你,让你觉得自己在驾驭某种新力量。

实际上,代码要你审核,引用要你查验,系统连接要你维护,输出错了要你背锅。人工智能并没有替你承担工作,只是把工作从显性的执行,改成了隐性的监督、修复和祈祷。

这背后还有无法解决的经济问题。每个用户实际用掉多少算力高度不确定,于是每家公司都持续对外扩张、对内限缩。为了新客户和收入增长,涨价、限流、降低推理、取消免费,已成为常态。

所以当下几乎所有生成式人工智能产品,都是付费测试。你不只是用户,还是替厂商承担试错和退化成本的人。它们既要你相信未来会更好,又要你为今天的缺陷买单。它们既让你依赖它,又不断调整规则,无法让工作流真正稳定。

人和软件的关系正在改变。过去的软件希望你信任它,现在反倒是训练你迁就它。它错了,你要学会判断;它慢了,你要学会等待;它贵了,你要学会理解;它弱了,你要学会调参……久而久之,把自我PUA说成适应了新时代。

也许未来它们会更聪明,更稳更接住你?那敢情好,但如果一种技术要靠夸张的愿景来让人相信它伟大,那它至少在此刻还不伟大。
00