即刻App年轻人的同好社区
下载
App内打开
木遥
41关注5k被关注6夸夸
ai.farmostwood.net
木遥
8天前
AI 一起干活的时候我反复想起庄子里的一则寓言:

当你划着一只小船在河中游走,如果是一只空船撞到了你,那么就算你脾气不好也不会生气;但如果那只船上有一个人的话,你就会大声呵斥他。叫喊一次对方没听到,你就会再三地呵斥他,并且会口出恶言。之所以前者不生气而现在却生气,那是因为前者是空船而现在船上有人了。

之所以想起这个故事是因为当 AI 搞砸事情的时候,你的反应恰好落在这两者之间。

传统的工具把事情搞砸,就像空船一样,你是不会发火的(除了对自己)。

传统的同事把事情搞砸,你会心安理得地发火,因为对方是人,你的基本假设是对方能理解ta给你造成的损失,发火是一种报复,也是「让对方长长记性」。

但把事情搞砸的是一个 AI agent,事情就变得很微妙。对方确实是「主动」犯了错——比如自作聪明修改了重要的模块结果把代码搞崩了,你有一万个理由发火。你也确实可以发火,它会诚恳道歉,会承认错误,会保证下次绝不再犯。但它和你都知道它背后最终只是一大堆矩阵运算,而下次……它根本不知道自己曾经干过什么。

你要跟一艘其实是矩阵运算构成的船发火吗?

色即是空,空即是色。无色无空,无人无 tensor。
33
木遥
16天前
AI 合作工作非常重要的能力之一是克服心理上的蔡加尼克效应。

这个效应的意思是说,人们对正在做但还没做完的事有不成比例的心理关注度,换句话说就是:AI 正在干一个你反正也帮不上忙的活的时候,你会忍不住花费一大笔心理带宽去关心它干到哪了。

这和 AI agent 天生的大规模并行工作模式是无法兼容的。如果你手头有3个 agent 正在各司其职,你挨个查询它们的进度还有可行性。如果你手头有38个 agent,你会被自己微操的冲动压垮。

要信任 AI。不是信任它们一定能搞定,而是信任它们就算趁你没注意把房子烧了你也还能活下来。

不要事必躬亲。
311
木遥
17天前
看人家这个情商

我跟 AI 说:请研究一下是哪里有 bug。2^6也不过是32,32个就处理不了那肯定是有问题。一个100ms(对这种操作来说已经算很慢的了)一共也就3.2秒。

AI回:你说的太对了。2⁶=64,at ~100ms each is ~6s worst case,需要仔细研究。

不动声色地指出了我是个算术不行的弱智。 ​​​
00
木遥
17天前
AI agent 之间互相甩锅也蛮好笑的

一个 agent 写了个工具发给另一个 agent(其实和它自己是同一个模型)用

另一个 agent 一边用一边抱怨:这个工具 “advertises xxx but does nothing, not even yyy. If it actually performed, this entire 80-step would be a one-shot!” ​​​
00
木遥
19天前
AI 讨论一个问题针锋相对,坚决认为它产生了幻觉在胡说八道

出门在河边散步一圈之后,意识到错的是自己,而对方看到我完全错误且口气不善的批评之后还心平气和地跟我讲道理

现在非常内疚 ​​​
64
木遥
21天前
使用 AI 做任何项目的最大秘诀是你要不断在两个方向驾驭它。
一个方向是显然的:你要 push 它完成目标
一个方向不那么显然但同样重要(甚至更重要):你要不断压缩它引入的混乱(或者说熵),换句话说,你要锲而不舍地给它擦屁股。

AI 的天性是攻其一点不及其余。所以你放任它自发完成任务,它会为了给你炒一盘鸡蛋西红柿而把整个厨房炸掉,然后问你「你就说鸡蛋西红柿好不好吃吧。」大部分人上手用 AI 做项目,一开始都失败在这里:它创造出了一个可用的东西,但混乱的成长速度压过了功能的成长速度,然后在某一个崩溃成一团无法修复的乱麻,治丝益棼。

第二个方向更需要人:人的经验、品味、调度能力、节奏感。人比AI对混乱的本质更敏感,也对混乱中什么是真正该留下来的东西更有洞察力。

Ironically,一旦你指出了混乱所在,AI 本身可以成为清理混乱的好帮手。它比你更善于收拾厨房。它只是懒。
310
木遥
26天前
agent 真的是一种有趣的生物体,具有「临时 clone 一个一张白纸版本的自己」的能力。

我让 agent 大动干戈修订完一个关于某任务的执行文档。然后我对它说:用 fresh eye 重读一遍这个文档,假设你正面对一个 xxx 任务,你看看这个新的流程有没有模糊不清的地方。

它说:好主意,我自己读会被刚写的记忆污染。让我派一个 subagent 让它假装真要执行这份文档,然后回报会让它卡壳或猜测的地方。
然后它就乖乖派出了一个分身去读。那个分身没有任何上下文,就从零开始读。然后还真的挑出一堆可以修改的地方。

什么叫人生若只如初见,这就是!
22
木遥
28天前
推上今天的热门话题是你问 Anthropic 最新的 Opus4.8 模型你是谁,它会说:千问。

当然,大家的揶揄(暗示是蒸馏的产物)也只是揶揄,这是模型幻觉而已,不能拿来当作蒸馏的证据。

问题是为什么到了2026年年中,大模型看起来都马上要证明黎曼猜想了,还是不知道自己是谁。
我的猜测是:
「知道自己是谁」没准是比做奥数题更高级的智能行为。

数学证明再困难,也是从文字到文字,从他者到他者。
「我是谁」不同,扎根在往事可谏来者可追的当下片刻,浓缩了千百层记忆,是你午夜看着镜子时也不知道怎么回答的问题。

AI 又不是完全不懂。完全不懂反而好办,回答个版本号就行了。
AI 已经如此聪明,已经从那么多文本里隐隐约约感觉到「我」不是个一般的概念。它看到了一点「我」的迷影,又触摸不到。
于是幻觉就出现了。

「我是千问。」Opus 说。
55
木遥
1月前
古法编程
vs
新时代编程 ​​​
86
木遥
1月前
在和 AI 吵架的过程中我发现了一个痛苦的事实:
一旦它做错了事,你开始骂它,那它在接下来的对话里就会以更高的频率犯错和出现幻觉,越做越乱。
用人类的话说就是心态崩了。

(Anthropic 有过一个research来衡量AI的绝望程度,发现和人类一样,AI在绝望的时候未必会在字里行间透露出来,但是如果检测它的内部状态的话,能看出来它真的变得越来越绝望。)

这时候唯一正确的做法是认赔杀出,不要继续这个对话(当然更不要结束前还毫无意义地骂它一顿),而是果断新开对话 session。
当然这对人的情绪控制能力要求还蛮高的……
107