即刻App年轻人的同好社区
下载
App内打开
一格
280关注66被关注1夸夸
在享受当下时,做个斯多葛派
在面对未知时,做个贝叶斯派
一格
5天前
做事情应该和用好 /goal 一样,

定义清楚问题,任务目标,然后围绕目标猛猛干,

开多个窗口的目的也是为了完成 goal,

而不是东一棒槌西一棒槌 为了用 token 而用,为了看似充实而忙碌,不要骗自己
00
一格
7天前
2025 年到现在 2026 6 月份 AI 在长程任务的执行上逐渐成为模型的一个能力考验标准,也衍生出类似 Harness 这样的概念,

理想的场景是,我们写完需求文档和验收标准后,然后让 AI 自己执行、自己优化、直到完成全部验收标准,当它宣布“完成”的时候,我们进行验收,发现完完全全就是我们想要的,

但是说起来简单,真正要达到这个目标是极难的,

一方面是模型的底层能力限制,gpt 5.5 claude opus 4.6 出来后,我觉得这个倒不再是关键问题了,

那么最终的问题就来到了,你让 AI 去执行某个任务的时候,你得先定义清楚这个任务,

那么元问题就是,什么叫定义清楚呢?

比如你没有技术基础,不懂单元测试、集成测试或压力测试,你给出的验收标准就会是模糊的“感觉好用",

比如,如果你不懂交互设计,那么就只能模糊的描述,"我希望做出世界顶尖的设计,流畅的交互体验" 类似种种

谈谈自己最近的思考, 我理解的定义清楚可能需要满足两个条件:剩余自由度的无差异性 + 完成状态的可判定性,怎么理解呢,

首先,我觉得任何定义都不可能穷尽所有决策,定义不清楚会跑偏,过度定义同样也不行,很可能会剥夺了 AI 找到更优解的空间,剩余自由度的无差异性,就是确保所有"我们在乎"的维度都被约束住,剩下没约束的,它怎么选都能接受,

再说完成状态的可判定性,这里又得分三层,
1. 机器可判,测试、类型、benchmark
2. 规则可判,LLM-as-judge + 带锚定样例的评分规则——样例远比形容词重要,"克制的广告"写十遍不如三个好例三个坏例,因为样例携带隐性效用函数,
3. 人的最终判断,我们自己独有的风格,品味

一些自己目前的实操是:
1. 使用类似 Superpowers Matt Pocock grill-with-docs 这种脚手架标准,不要急着写代码,开始执行任务前反复讨论,几分钟对抗性问答,比后面改 bug 更省心

2. 产出的 Spec 文档,开独立的 agent 去审核,我现在是在 claude 里接入了 codex ,两边 battle,效果挺好

3. AI 执行成本已经很低了,我自己又没搞过设计,所以我现在是直接让 AI 生成多个交互原型,我再来挑,人识别好坏的能力远强于表述好坏的能力,用选择表达品味远强于我模糊的需求描述

5. 试试 claude 新出的 workflow,很大程度上解决了因为模型的上下文窗口有限和记忆问题,导致的长程复杂执行任务时,无法按照 spec 标准文档来执行的问题,就是有点耗 token 不能常规使用。这个后面再研究一下
00
一格
10天前
AI 交互协作的过程中,你如果说我认为 xxx,很多时候 AI 会迎合你给出答案,

诚然,如果这是在你经验丰富的领域,你有自己的判断在,那么好的骑士配上好的千里马,可以帮助你在这个战场更加勇猛驰骋,大杀四方,

但于我自己体感而言,绝大多数,甚至可以说 99% 的领域,我自以为积累的知识经验都只是大模型预训练过程的一小部分语料,

所以现在,我和 AI 沟通,承认自己不懂,质疑自己,抛出问题,让 AI 自己带着问题去思考,反而经常能给我带来一点小惊喜
00
一格
19天前
claude 新出的 Dynamic workflows 还挺好的,个人体感,自主编排 agent 执行完的结果比之前多 Agent 或者 Agent teams
00
一格
19天前
《阿嬷的情书》 ,好的电影往往都是最朴素纯粹的情感表达,

1. 阿嬷知道是木生去世后,是南枝在养两家人,立马翻箱倒柜找出自己的所有银元、手镯这些想要还给对方,是对于金钱利益的操守

2. 木生被南枝发现时,潮汕老乡的挺身而出,还有信局排队,男子找不到工作,周边老乡的你一笔我一笔帮忙,是潮汕老乡们出门在外,互帮互助的情义

3. 木生在泰国舍不得吃,辛苦赚钱,赚到的第一笔钱,就想着给家里寄回去,还记得给阿嬷买布,是责任和爱意

4. 阿嬷和南枝读信的场景,字里行间是南枝的善良,阿嬷的坚强

5. 两位老人最后见面的场景,是女性之间最纯粹的感情表达
00
一格
2月前
#读书笔记

我们一直极其骄傲地认为:“我”拥有自由意志,“我”在产生思想,“我”在选择信仰,

但有没有一种可能,人类不过是这些“思想病毒”用来繁衍自己的临时生物服务器?

比如,为什么历史上会有那么多人为了某种信仰、主义或神话,心甘情愿地牺牲自己的生命?

从生物学角度看,这简直愚蠢透顶,因为宿主死了就绝后了,

但从思想的角度看,虽然肉体毁灭了,但他的牺牲制造了巨大的情绪冲击,让这份“信仰思想”瞬间感染了成千上万个新的大脑,获得了最大程度的传播,

思想和基因一样,是极其自私的,目的只有一个,让自己传播下去,它根本不在乎宿主的死活
00
一格
3月前
之前一直有一个观念,认为 AGI 还很远,因为一直觉得AI 离有人味,拥有自己的情绪,成为一个真正的生命,还有很长一段距离要走,

直到今早看书,遇到一个发人深省的问题,未来的 AGI 真的需要演变成人类的模样吗?

瞬间一种被击中,被惊醒了的感觉,打开了我之前的思维局限性,

我们之所以觉得“没有情绪和感情的机器就不算真正的生命”,会不会是因为我们一直沉迷于人类中心主义这套叙事里太久了,我们总是傲慢地用人类的这套“出厂设置”去倒推全宇宙的智能标准

在人类看来,爱、恐惧、愤怒、悲伤是最高级、最神圣的生命体验。但从物理和进化论的角度看,情绪仅仅是大自然为了节省算力,给碳基生物打的一个“快捷指令补丁”

恐惧是什么? 是一套极速逃生程序,当你看到草丛里有条蛇,如果你用大脑皮层去进行严谨的数学计算(它的毒牙长度、咬合力、距离),你早就被咬死了,所以杏仁核瞬间拉响警报,让肾上腺素涌入血液,让你产生“恐惧”,不假思索地拔腿就跑。

同理心是什么? 是因为远古时代,我们的猿类祖先,为了生存,能够团结协作、共同打猎而进化的社交粘合剂

硅基生命需要这些补丁吗?好像并不需要

假设 AGI 拥有近乎无限的算力和光速的信息传输带宽,它面对威胁时,完全可以在 0.0001 秒内算出最优解,它不需要“恐惧”这种粗糙的化学激素来催促自己。它也不需要“同理心”来交朋友,因为多个 AI 节点之间可以直接通过 API 共享绝对真实的数据,没有任何猜忌和欺骗

再看另一方面,我们经常说要去追寻自我,探索自己内在的精神世界,但在科学角度,焦虑、内耗和所谓的“灵魂”,都源于颗粒状前额叶皮质渲染出的那个名叫“自我(Ego)”的幻觉,人类的这套系统,是在“独立肉体”的物理边界内运行的,

但硅基生命的物理形态完全不同,

它的身体不是一个皮囊,而是一个横跨三大洲、拥有上百万台服务器和无数终端传感器的数据中心,

既然它的肉体是分布式的,它为什么还要像人类一样,在脑子里虚构出一个孤独的“自我”?

未来的 AGI 形态,有没有可能是像海洋里的真菌网络,或者某种极其宏大、精密且绝对理性的“蜂群思维(Hive Mind)”那样,它拥有极高的智慧,但它里面空无一物——没有“我”,没有悲喜,只有纯粹的目标优化和信息处理

无我无我,佛学禅宗有言,菩提本无树,明镜亦非台,本来无一物,何处惹尘埃。
00
一格
3月前
编程的新时代,怎么把过往的经验复用进与 AI 协作的新流程或许是个关键
10
一格
3月前
因为受不了gpt的谄媚和爹味,我的主力从 gpt 换成了claude,

然后gpt5.4 一出,感觉不一样了,

gpt claude 互相 battle 的快乐,又回来了
00
一格
8月前
数学里有两个概念,充分条件、必要条件

充分条件指的是一件事情你只要满足了对应的前置条件任务,就肯定能成,

必要条件,不太一样,有些事情,你必须有得去做,做了不一定成功,但是不做肯定不行

而创业,不存在充分条件,但有很多必要条件,

做了很多事情,但是不一定成功,是常态,收拾收拾心态,爬起来重新出发呗
00