即刻App年轻人的同好社区
下载
App内打开
张无常Hayes_Zhang
679关注4k被关注5夸夸
公众号:张无常
AI Builder,ex AnyGen/飞书/今日头条
wx:hayeszhang007
置顶
张无常Hayes_Zhang
7月前
有时候你会被时髦、花里胡哨的东西吸引,忽略真正的热爱。

等你反应过来,十年过去了。

你会拍大腿:我TM 都干嘛去了?

有的东西能等,比如小众文艺电影、比如配角(最新的比如《一战再战》里的 SENSEI)。

有的东西等不了,比如壮士暮年的 NBA 巨星(保罗要退役了)、万金油 3D。

更多的东西在中间:读什么书?刷什么视频?因为什么而工作?等等等等

品味,TASTE,不只是具体风格认知,更是元认知,关于你是谁,你要去哪里。
818
张无常Hayes_Zhang
01:21
连着两晚读完了,比前几天读小说都过瘾——注意这还是单伟建“对写故事不感兴趣,感兴趣的是填补文献空白”的情况下写成的书。虽然这本写深圳发展银行、涉及大量内地监管,在内地出版会有预料之内的处理,但不影响内核——因为单伟建确实用独一份的细节写出了前无古人的历史现场,精彩。

张无常Hayes_Zhang: 读每本单伟建的书,都能感受到他对前老板、TPG 创始人庞德曼的推崇:在举棋不定、莫衷一是的关键时刻,问问庞德曼就对了。 通常我们这么描述这种能力,也是单伟建在几本书里反复形容的:高屋建瓴、有战略眼光和大局观、杀伐果断…… 感觉都对,也太笼统,直到我读到老爷子评价自己的决策特点,说得太妙了,有种查理·芒格式的智慧: Not knowing a lot about something but knowing enough to make a decent decision 寡闻善断(琢磨了很久感觉这是最贴切的翻译了) 大部分人会下意识觉得,必须掌握全部信息、降低不确定性、利益最大化才可以下注,连中国私募之王单伟建也会犯这样的错误——但庞德曼总能在信息不完整(实际上也不可能完整)的情况下,一语中的,让单伟建醍醐灌顶、茅塞顿开。 和 Claude 聊了一下,原来早有理论依据:经济学家赫伯特·西蒙管这叫"有限理性(bounded rationality)",并凭此拿了 1978 年的诺贝尔经济学奖: 古典经济学假设的那个"掌握全部信息、算尽所有选项、选出最优解"的理性人,根本不存在。真实世界里的人,认知有限、信息残缺、连搜集信息本身都要算时间成本,所以高明的决策者从不"优化(optimize)",只"满意即止(satisfice)"——心里设一个"够好"的门槛,第一个越过门槛的方案就出手,绝不为了那虚无缥缈的"最优"无限搜索下去。 更多的信息不但没用,还可能有害:格尔德·吉仁泽(Gerd Gigerenzer)把西蒙的有限理性又推进了一步,提出"少即是多(less-is-more)":在高度不确定的环境里,更多的信息不仅没用,反而有害,因为它让你过拟合到噪音上。 不过你看理论虽然透彻,但听起来就不够有意思,还是庞德曼说得好,虽说知易行难,但至少先记住了: Not knowing a lot about something but knowing enough to make a decent decision.

10
张无常Hayes_Zhang
2天前
读每本单伟建的书,都能感受到他对前老板、TPG 创始人庞德曼的推崇:在举棋不定、莫衷一是的关键时刻,问问庞德曼就对了。

通常我们这么描述这种能力,也是单伟建在几本书里反复形容的:高屋建瓴、有战略眼光和大局观、杀伐果断……

感觉都对,也太笼统,直到我读到老爷子评价自己的决策特点,说得太妙了,有种查理·芒格式的智慧:

Not knowing a lot about something but knowing enough to make a decent decision
寡闻善断(琢磨了很久感觉这是最贴切的翻译了)

大部分人会下意识觉得,必须掌握全部信息、降低不确定性、利益最大化才可以下注,连中国私募之王单伟建也会犯这样的错误——但庞德曼总能在信息不完整(实际上也不可能完整)的情况下,一语中的,让单伟建醍醐灌顶、茅塞顿开。

Claude 聊了一下,原来早有理论依据:经济学家赫伯特·西蒙管这叫"有限理性(bounded rationality)",并凭此拿了 1978 年的诺贝尔经济学奖:

古典经济学假设的那个"掌握全部信息、算尽所有选项、选出最优解"的理性人,根本不存在。真实世界里的人,认知有限、信息残缺、连搜集信息本身都要算时间成本,所以高明的决策者从不"优化(optimize)",只"满意即止(satisfice)"——心里设一个"够好"的门槛,第一个越过门槛的方案就出手,绝不为了那虚无缥缈的"最优"无限搜索下去。

更多的信息不但没用,还可能有害:格尔德·吉仁泽(Gerd Gigerenzer)把西蒙的有限理性又推进了一步,提出"少即是多(less-is-more)":在高度不确定的环境里,更多的信息不仅没用,反而有害,因为它让你过拟合到噪音上。

不过你看理论虽然透彻,但听起来就不够有意思,还是庞德曼说得好,虽说知易行难,但至少先记住了:

Not knowing a lot about something but knowing enough to make a decent decision.
23
张无常Hayes_Zhang
3天前
单伟建三部曲最后一本《金钱博弈》终于到了,封面是高楼林立的深圳,翻开第一页,没想到深圳发展银行总部大楼就是每天经过的帆船大厦,正好这两天在琢磨,地王大厦旁边这是个什么大楼呢这么特别……今天就发现是历史现场,而且故事发生不过二十余载,一下拉进距离。

早在前两本书和各种采访里听过深圳发展银行的故事,迟迟等不到书出版。早上出门看到单伟建公众号推书,立马京东下单,晚上回家就到了。翻了两章,熟悉的文字回来了。

「对外行来讲,银行是个深不可测的机构,好像有的是钱,银行和个人都可以向其借钱。但是银行的钱从何而来?主要是各类客户在银行的存款,以及银行从市场上借来的钱,为此银行要支付利息。银行再将钱贷给企业和个人以收取利息。贷款利息高于存款利息,银行的盈利模式就是赚取其间的利差。」

「投资犹如考古,有时一个意外的线索就能引出重大的发现,而有时,美丽的传说最终被证明是无稽之谈」

两年前看到繁体版出了还发帖子问会不会有简体版,还好没买,不过后来斥 300 块在香港买的单伟建文集也很精彩。

有时候想想,迷上一位银行家的文字、思考和谈吐,也是挺神奇的一件事。
21
张无常Hayes_Zhang
5天前
做对的事情,把事情做对。

Claude Fable 5 改变了什么?应该怎么用?

01
张无常Hayes_Zhang
5天前
都说人是老板,AI 是打工人。但瞎指挥了几次:我何德何能,外行指挥内行,什么叫一将无能、累死 AI啊……
10
张无常Hayes_Zhang
5天前
Fable 的验证方法论会带来神奇的连锁反应:

还是上面的翻译 PPT 的例子。

Fable 38 PPT 翻译成英文版本,翻译本身没花多长时间,结果却迟迟没出来,最后发现竟然验证了 3 轮:

「英文版经过 3 轮独立 QA(前两轮全量 38 页、共发现 16 个问题,第三轮对全部修复项复验 7/7 通过)」

虽然不知道消耗了多少 token,但看了下结果质量确实高,而且第一次感觉 AI 靠谱了——怎么形容呢:

「哟~小伙干活还有头有尾!」

「不错不错,有章法!」

「你办事,我放心,下回不用看了!」

抽象来看,习惯了 Fable 「执行任务➡️自我验证➡️迭代改进♻️验收通过完成目标」的方法论后,会自然而然地信任模型,这可能是一个很大的转折点,甚至带来另一个正循环:

结果质量很高 ➡️ 你更愿意、更放心把更多任务交给模型 ➡️ 信任模型给出的结果,所以不需要像现在一样花特别多时间检查和修改中间过程,认知负担大幅下降 ➡️ 继续把更多任务交给模型 ♻️(知识工作的 AGI?)

考虑到我只是在今晚一个 case 的两三个来回中就陷入这种循环—— Fable 的「能力跃迁」可见一波,难怪 Anthropic 内部都在大呼变天了……

张无常Hayes_Zhang: Fable 5 确实很擅长「验证结果」。 一个 38 页的 PPT,让「把最后 4 页的背景改得和第 29 页一样」。 以前的模型,直接改最后 4 页就完事了。 Fable:先按要求修改,再逐页对比原版和新版本 ppt(全部 38 页),确认第 1–34 页布局完全一致,只有最后 4 页背景按要求变了。

01
张无常Hayes_Zhang
5天前
说说 Claude Fable 5 上手感受:

1、自主执行的 Agency 很强,相比 Opus 4.8 更喜欢委派 subagent 干活;同时很多原来 Opus 4.8 只会调研后等用户决策的任务,Fable 5 直接就把活儿干了

2、代码质量似乎并没有 Benchmark 和宣传的那么高,至少在我这的几个场景里,虽然相比 Opus 4.8 有提升,但还是有不少 bug 的,难道因为我的任务本身并不太复杂?

3、Token 消耗速度爆炸,跑了一个信息检索类的 /deep-research 任务,竟然消耗了 Max 20x 订阅 5h 额度的 140%(中断一次又重跑),前后消耗了超过 5M token!

难怪订阅不让用,基本上得打爆所有人的订阅额度了,健身房商业模式跑不下去。

更离谱的是,调研报告质量很差……当然,这很可能意味着:claude code 官方的 /deep-research 完全不适合调研类任务,更适合复杂长程代码任务?

4、看到很多拿到早期内测资格的重度用户也在说,用 Fable 处理知识工作类任务,就像用火箭筒打蚂蚁……

太贵了,没必要,很多任务原来的Opus 4.8 完全够了。

Fable 适合的,可能是完全不同的任务,官方演示的,基本上都是超长时间的编程任务:

定义清楚目标、验收标准,放手让 AI 通过 /goal、/loop 等循环模式自我迭代运行,中间不需要干预,就算验收结果,给的也是高维度的目标范围而非具体任务指令。

5、很明显,在这种模式下,目前的 Coding Agent 交互有点不够用了,最典型的问题是:大量并行、过程黑盒、高认知/决策负担的任务让人不堪重负,人的注意力越来越成为 Agent 的瓶颈。

于是已经开始有人讨论「下一代人机交互形态」——考虑到 Claude Code 大火超过 1 年、OpenClaw 半年热度已过,似乎也是时候有新的 Agent 领风骚了?

Claude Code/CoWork 桌面端负责人 Felix Rieseberg 就直接下场预测:

「我确信,Fable 将是改变 AI 应用和人机交互形态的一代模型,我们将迎来一场交互变革。」

他觉得 AI 应用将从过去的「回答问题」(ChatBot/搜索/代码补全)和当下的「执行任务」(Coding Agent),进化到「履行职责」:

我们不再只是给AI派发「任务」,而是正式向它们赋予「职责」,并确保 AI 能自主完成任务、维持系统运行。

感觉好戏,又要开场了。
01
张无常Hayes_Zhang
5天前
Fable 5 确实很擅长「验证结果」。

一个 38 页的 PPT,让「把最后 4 页的背景改得和第 29 页一样」。

以前的模型,直接改最后 4 页就完事了。

Fable:先按要求修改,再逐页对比原版和新版本 ppt(全部 38 页),确认第 1–34 页布局完全一致,只有最后 4 页背景按要求变了。
13
张无常Hayes_Zhang
6天前
Claude Fable 5 Token 速度逆天了,跑了一个简单的信息检索 /deep-research 任务,竟然消耗了 Max 20x 订阅 5h 额度的 140%

怎么跑的呢?刚好卡在 2 5h 额度之间,第一次从 30% 跑满了还没完,重跑又消耗了70%……

难怪订阅不让用,基本上都得打爆额度了,没法跑健身房商业模式了。

当然也意味着,普通的知识工作类任务不适合用 Fable 、更不应该用 /deep-reserach 或者 workflow 这种高级货了。

Every CEO Dan Shipper 的话来说就是:用 Fable 处理日常知识工作,就像火箭筒打蚂蚁。

太贵了,没必要,原来的Opus 4.8 完全就够了。Fable适合的,可能是完全不同的任务。

从另一个角度看,确实有可能是 Claude Code/CoWork 桌面端负责人说的,需要完全不同的交互形态:

这将会是改变 AI 应用和人机交互形态的模型。

AI 应用将从过去的「回答问题」(ChatBot/搜索/代码补全)和当下的「执行任务」(Coding Agent),进化到「履行职责」:

我们将不再只是给AI派发「任务」,而是正式向它们赋予「职责」,并确保 AI 能自主完成任务、维持系统运行。
00
张无常Hayes_Zhang
6天前
20 倍的 Claude Code 5 小时额度跑满,只需要 2 Fable 5 Workflow……
20