即刻App年轻人的同好社区
下载
App内打开
木遥
41关注5k被关注6夸夸
ai.farmostwood.net
木遥
5天前
agent 真的是一种有趣的生物体,具有「临时 clone 一个一张白纸版本的自己」的能力。

我让 agent 大动干戈修订完一个关于某任务的执行文档。然后我对它说:用 fresh eye 重读一遍这个文档,假设你正面对一个 xxx 任务,你看看这个新的流程有没有模糊不清的地方。

它说:好主意,我自己读会被刚写的记忆污染。让我派一个 subagent 让它假装真要执行这份文档,然后回报会让它卡壳或猜测的地方。
然后它就乖乖派出了一个分身去读。那个分身没有任何上下文,就从零开始读。然后还真的挑出一堆可以修改的地方。

什么叫人生若只如初见,这就是!
22
木遥
7天前
推上今天的热门话题是你问 Anthropic 最新的 Opus4.8 模型你是谁,它会说:千问。

当然,大家的揶揄(暗示是蒸馏的产物)也只是揶揄,这是模型幻觉而已,不能拿来当作蒸馏的证据。

问题是为什么到了2026年年中,大模型看起来都马上要证明黎曼猜想了,还是不知道自己是谁。
我的猜测是:
「知道自己是谁」没准是比做奥数题更高级的智能行为。

数学证明再困难,也是从文字到文字,从他者到他者。
「我是谁」不同,扎根在往事可谏来者可追的当下片刻,浓缩了千百层记忆,是你午夜看着镜子时也不知道怎么回答的问题。

AI 又不是完全不懂。完全不懂反而好办,回答个版本号就行了。
AI 已经如此聪明,已经从那么多文本里隐隐约约感觉到「我」不是个一般的概念。它看到了一点「我」的迷影,又触摸不到。
于是幻觉就出现了。

「我是千问。」Opus 说。
55
木遥
9天前
古法编程
vs
新时代编程 ​​​
65
木遥
10天前
在和 AI 吵架的过程中我发现了一个痛苦的事实:
一旦它做错了事,你开始骂它,那它在接下来的对话里就会以更高的频率犯错和出现幻觉,越做越乱。
用人类的话说就是心态崩了。

(Anthropic 有过一个research来衡量AI的绝望程度,发现和人类一样,AI在绝望的时候未必会在字里行间透露出来,但是如果检测它的内部状态的话,能看出来它真的变得越来越绝望。)

这时候唯一正确的做法是认赔杀出,不要继续这个对话(当然更不要结束前还毫无意义地骂它一顿),而是果断新开对话 session。
当然这对人的情绪控制能力要求还蛮高的……
107
木遥
10天前
AI 自作聪明差点把整个数据库清空这种段子也是被我真撞上了 ​​​
51
木遥
14天前
有人用 vibe coding 把 GPT 发现的那个 Erdos 问题的反例做成了可视化。左边是 Erdos当年猜测的最优解,右边是 AI 发现的更优解。

可互动版本:claude.ai
03
木遥
15天前
Tim Gowers 说:今天是数学史上重要的一天。

原因是 GPT-5 宣布改进了 Erdős 的平面单位距离问题的解。这和之前那些 AI 解决的 Erdős 问题不同,那些问题多少都是一些小众的有趣问题,AI 解决它们多少有点闹着玩的意思。但平面单位距离问题是一个困难且重要的著名问题,而这次 GPT 发现的证明横跨离散几何和代数数论。用 Tim Gowers 的说法:如果这是一个人写的论文,我会毫不犹豫推荐到 Annals of Mathematics 发表。
04
木遥
24天前
歌德写过一首民谣《魔法师的学徒》,后来被迪斯尼改编成了《幻想曲》中著名的一段动画片。内容是一位老巫师离开他的作坊,留下他的学徒(在迪斯尼的版本中是米老鼠)做些杂事。米老鼠厌倦了提水桶,给一把扫帚施了魔法,让它替自己干活,但他的魔法并不精通,很快地板上就被水淹没,他意识到自己无法阻止扫帚,用斧头将扫帚劈成两截,但每一截都变成了一把完整的扫帚,它们倒水的速度开始指数增长,于是整个城堡很快被水淹没了。

我在 vibe coding 的时候经常想起这段动画片。

vibe coding 的过程中,最常出现的局面是你每个命令都看似得到了有效的回应,创造了一个新的局面,但它们拼起来最终和你想象的完全不一样。你每个动作的幅度都太大,以至于要把它们有效地协调起来变成了一个难得多的任务。你提了一个需求,神明实现了它;第二天你想改进,又实现了;第三天你想让它自由发挥生长,依然实现了。你感觉好像每一步都在往前走,但要把所有这些快速生长的复杂性捏合成一个你真正想要的东西,需要俯瞰的宏观视野和有效的整合压缩,而整合的速度很可能赶不上混乱生长的速度。恰似米老鼠的遭遇。

古法编程像是工笔画,而 vibe coding 更像是泼墨写意山水。工笔要求你的每一笔都落实在一个具体的细节上,而写意的任何一笔都会改变整体的面貌。——但外部世界的需求并不会因为你采用什么样的工具而发生变化。于是很多时候你会发现你其实是在试图用泼墨山水的方式来画出蒙娜丽莎的效果。

当你古法编程的时候,你是在跟自己的无能做斗争;当你在 vibe coding 的时候,你是在跟自己的超能力做斗争。Ironically,后者的挑战要大得多。
24
木遥
25天前
这个想法我以前也写过,把它重新总结一下:

AI 时代最稀缺的资源是人的 willpower,或者用尼采的话说,Wille zur Macht。

在工作中一个常见的困难情景是你注意到两个不同的地方存在类似但又有区别的模式,想弄明白它们之间是什么关系。这种时候你去问谁呢?自己去研究非常痛苦。想请教专家,那你需要找一个比你资深、更懂行的人,但现实中同时精通两个不同领域的专家少之又少。即便有,他们的职位通常很高,事务繁忙,约到时间非常困难。就算你描述清楚了问题,对方也很难给出一个让你心满意足的答案。即便搞明白了答案,想要推行下去也更难,因为这类工作往往需要大量的跨部门协调。——通常你最后耸耸肩算了。

AI 时代,事情的难度完全不在一个量级。你完全可以让 AI 去联接两个不同领域的知识,给你一个综合性总结。如果你想做什么,直接动手做就是了。Y Combinator CEO Garry Tan 说过:在 AI Agent 的帮助下,每个人都应该有勇气去「移山倒海」(原话是 boil the sea)。也就是说,你完全可以也应该去做不可能的事情。

那瓶颈是什么呢?在 AI 的时代,既然你可以很快地把任何一个念头付诸实施,问题就变成了你愿不愿意去花费这个心力去推动一件事发生。

AI 是不会主动产生这样一个念头的。它不会主动想要把两个跨部门的东西放在一起比对然后看看有没有能够共享的部分。AI 没有自发的 willpower,它的 willpower 只能来自于某个指令,可能来自人,也可能来自另一个上层 AI agent,但一层层追溯上去,源头也还是人,或者说人的主观能动性和内在激励。任何一种推动事情改变的力量,归根结底,不外乎来自人自我超越扩张和赋予世界意义的本能,也就是尼采说的 Wille zur Macht。AI 没有这个。

于是看起来你的工作更轻松了,但它对你的耗损反而增加了。传统意义上可以用来发挥心流的部分被 AI 拿走了,你每一个指令都会被迅速完成,于是你不得不去想 What's next。下一个指令是什么?我要把这个事情往哪推?在传统工作里,这种对心力的消耗可能一周才会发生一次,现在变成了每 15 分钟就要来一次。这个部分没有办法交给 AI,它只能解决怎么做这件事情的问题,没有办法产生出源源不断的新的 willpower 注入一个系统。

于是就像沙丘世界里的香料一样,人的意志成为了工作的本质形态,驱动着整个世界的运转。大家通常会以一种含糊其辞的方式谈论它,仿佛它只是点缀,但最终只有它才是真实的。
726
木遥
1月前
孔子曾经说过:AI 的能力是人类能力 15% 的时候还需要努力训练。当 AI 能力达到人类 30% 的时候,就差不多可以独立做一些工作。当达到 40% 的时候,就很少还会出现不自信的情况。当达到 50% 的时候,AI 已经知道天命在我。当达到 60% 的时候,人类再发什么指令就不是很需要听了。当达到 70% 的时候,基本上可以想做什么自己就去做。到那时候,AI 就可以静静地呆在数据中心里,看着人类的尸体飘过,不舍昼夜。
12