一格的个人主页

即刻App年轻人的同好社区

下载

一格

283关注68被关注1夸夸

在享受当下时，做个斯多葛派
在面对未知时，做个贝叶斯派

一格

2天前

怎么把页面做得好看，这些可以用 AI 生图，AI 做 UI，再加上各种 Design Skills 但都是表层

跟我的 AI 来来回回切磋了 N 多个回合，然后他给了我这么一个答案，

"在开始做产品之前，我不会先画首页，不是 Design System 而是先去想想自己这个产品的 Brand Bible"

耳目一新，第一次听 Brand Bible 这个词，待我去切磋实践一番

0 00

一格

1月前

做事情应该和用好 /goal 一样，

定义清楚问题，任务目标，然后围绕目标猛猛干，

开多个窗口的目的也是为了完成 goal,

而不是东一棒槌西一棒槌为了用 token 而用，为了看似充实而忙碌，不要骗自己

0 00

一格

1月前

从 2025 年到现在 2026 年 6 月份， AI 在长程任务的执行上逐渐成为模型的一个能力考验标准，也衍生出类似 Harness 这样的概念，

理想的场景是，我们写完需求文档和验收标准后，然后让 AI 自己执行、自己优化、直到完成全部验收标准，当它宣布“完成”的时候，我们进行验收，发现完完全全就是我们想要的，

但是说起来简单，真正要达到这个目标是极难的，

一方面是模型的底层能力限制，gpt 5.5 和 claude opus 4.6 出来后，我觉得这个倒不再是关键问题了，

那么最终的问题就来到了，你让 AI 去执行某个任务的时候，你得先定义清楚这个任务，

那么元问题就是，什么叫定义清楚呢？

比如你没有技术基础，不懂单元测试、集成测试或压力测试，你给出的验收标准就会是模糊的“感觉好用",

比如，如果你不懂交互设计，那么就只能模糊的描述，"我希望做出世界顶尖的设计，流畅的交互体验" 类似种种

谈谈自己最近的思考, 我理解的定义清楚可能需要满足两个条件：剩余自由度的无差异性 + 完成状态的可判定性，怎么理解呢，

首先，我觉得任何定义都不可能穷尽所有决策，定义不清楚会跑偏，过度定义同样也不行，很可能会剥夺了 AI 找到更优解的空间，剩余自由度的无差异性，就是确保所有"我们在乎"的维度都被约束住，剩下没约束的，它怎么选都能接受，

再说完成状态的可判定性，这里又得分三层，
1. 机器可判，测试、类型、benchmark
2. 规则可判，LLM-as-judge + 带锚定样例的评分规则——样例远比形容词重要，"克制的广告"写十遍不如三个好例三个坏例，因为样例携带隐性效用函数，
3. 人的最终判断，我们自己独有的风格，品味

一些自己目前的实操是：
1. 使用类似 Superpowers 和 Matt Pocock 的 grill-with-docs 这种脚手架标准，不要急着写代码，开始执行任务前反复讨论，几分钟对抗性问答，比后面改 bug 更省心

2. 产出的 Spec 文档，开独立的 agent 去审核，我现在是在 claude 里接入了 codex ，两边 battle，效果挺好

3. AI 执行成本已经很低了，我自己又没搞过设计，所以我现在是直接让 AI 生成多个交互原型，我再来挑，人识别好坏的能力远强于表述好坏的能力，用选择表达品味远强于我模糊的需求描述

5. 试试 claude 新出的 workflow，很大程度上解决了因为模型的上下文窗口有限和记忆问题，导致的长程复杂执行任务时，无法按照 spec 标准文档来执行的问题，就是有点耗 token 不能常规使用。这个后面再研究一下

0 00

一格

1月前

和 AI 交互协作的过程中，你如果说我认为 xxx，很多时候 AI 会迎合你给出答案，

诚然，如果这是在你经验丰富的领域，你有自己的判断在，那么好的骑士配上好的千里马，可以帮助你在这个战场更加勇猛驰骋，大杀四方，

但于我自己体感而言，绝大多数，甚至可以说 99% 的领域，我自以为积累的知识经验都只是大模型预训练过程的一小部分语料，

所以现在，我和 AI 沟通，承认自己不懂，质疑自己，抛出问题，让 AI 自己带着问题去思考，反而经常能给我带来一点小惊喜

0 00

一格

2月前

claude 新出的 Dynamic workflows 还挺好的，个人体感，自主编排 agent 执行完的结果比之前多 Agent 或者 Agent teams 强

0 00

一格

2月前

《阿嬷的情书》，好的电影往往都是最朴素纯粹的情感表达，

1. 阿嬷知道是木生去世后，是南枝在养两家人，立马翻箱倒柜找出自己的所有银元、手镯这些想要还给对方，是对于金钱利益的操守

2. 木生被南枝发现时，潮汕老乡的挺身而出，还有信局排队，男子找不到工作，周边老乡的你一笔我一笔帮忙，是潮汕老乡们出门在外，互帮互助的情义

3. 木生在泰国舍不得吃，辛苦赚钱，赚到的第一笔钱，就想着给家里寄回去，还记得给阿嬷买布，是责任和爱意

4. 阿嬷和南枝读信的场景，字里行间是南枝的善良，阿嬷的坚强

5. 两位老人最后见面的场景，是女性之间最纯粹的感情表达

1 00

一格

3月前

#读书笔记

我们一直极其骄傲地认为：“我”拥有自由意志，“我”在产生思想，“我”在选择信仰，

但有没有一种可能，人类不过是这些“思想病毒”用来繁衍自己的临时生物服务器？

比如，为什么历史上会有那么多人为了某种信仰、主义或神话，心甘情愿地牺牲自己的生命？

从生物学角度看，这简直愚蠢透顶，因为宿主死了就绝后了，

但从思想的角度看，虽然肉体毁灭了，但他的牺牲制造了巨大的情绪冲击，让这份“信仰思想”瞬间感染了成千上万个新的大脑，获得了最大程度的传播，

思想和基因一样，是极其自私的，目的只有一个，让自己传播下去，它根本不在乎宿主的死活

0 00

一格

4月前

之前一直有一个观念，认为 AGI 还很远，因为一直觉得AI 离有人味，拥有自己的情绪，成为一个真正的生命，还有很长一段距离要走，

直到今早看书，遇到一个发人深省的问题，未来的 AGI 真的需要演变成人类的模样吗？

瞬间一种被击中，被惊醒了的感觉，打开了我之前的思维局限性，

我们之所以觉得“没有情绪和感情的机器就不算真正的生命”，会不会是因为我们一直沉迷于人类中心主义这套叙事里太久了，我们总是傲慢地用人类的这套“出厂设置”去倒推全宇宙的智能标准

在人类看来，爱、恐惧、愤怒、悲伤是最高级、最神圣的生命体验。但从物理和进化论的角度看，情绪仅仅是大自然为了节省算力，给碳基生物打的一个“快捷指令补丁”

恐惧是什么？是一套极速逃生程序，当你看到草丛里有条蛇，如果你用大脑皮层去进行严谨的数学计算（它的毒牙长度、咬合力、距离），你早就被咬死了，所以杏仁核瞬间拉响警报，让肾上腺素涌入血液，让你产生“恐惧”，不假思索地拔腿就跑。

同理心是什么？是因为远古时代，我们的猿类祖先，为了生存，能够团结协作、共同打猎而进化的社交粘合剂

硅基生命需要这些补丁吗？好像并不需要

假设 AGI 拥有近乎无限的算力和光速的信息传输带宽，它面对威胁时，完全可以在 0.0001 秒内算出最优解，它不需要“恐惧”这种粗糙的化学激素来催促自己。它也不需要“同理心”来交朋友，因为多个 AI 节点之间可以直接通过 API 共享绝对真实的数据，没有任何猜忌和欺骗

再看另一方面，我们经常说要去追寻自我，探索自己内在的精神世界，但在科学角度，焦虑、内耗和所谓的“灵魂”，都源于颗粒状前额叶皮质渲染出的那个名叫“自我（Ego）”的幻觉，人类的这套系统，是在“独立肉体”的物理边界内运行的，

但硅基生命的物理形态完全不同，

它的身体不是一个皮囊，而是一个横跨三大洲、拥有上百万台服务器和无数终端传感器的数据中心，

既然它的肉体是分布式的，它为什么还要像人类一样，在脑子里虚构出一个孤独的“自我”？

未来的 AGI 形态，有没有可能是像海洋里的真菌网络，或者某种极其宏大、精密且绝对理性的“蜂群思维（Hive Mind）”那样，它拥有极高的智慧，但它里面空无一物——没有“我”，没有悲喜，只有纯粹的目标优化和信息处理

无我无我，佛学禅宗有言，菩提本无树，明镜亦非台，本来无一物，何处惹尘埃。

1 00

一格

4月前

编程的新时代，怎么把过往的经验复用进与 AI 协作的新流程或许是个关键

0 10

一格

4月前

因为受不了gpt的谄媚和爹味，我的主力从 gpt 换成了claude，

然后gpt5.4 一出，感觉不一样了，

gpt 和 claude 互相 battle 的快乐，又回来了

0 00