即刻App年轻人的同好社区
下载
App内打开
图蜥
165关注212被关注1夸夸
I make stuff. Mostly software, occasionally, trouble
-
全是一手经验
@即刻
置顶
图蜥
1月前
"For quality of life, it is better to err on the side of being an optimist and wrong, rather than a pessimist and right"

-
P.S. check out my stuff: tuxi.dev
00
图蜥
2天前
hermes 确实是一个更好的 claw 产品。

- 使用 cronjob 而不是 heartbeat 来实现主动任务/周期性任务更细致,也更务实。使用 openclaw 的时候每天什么都不干就能跑出相当于$30 左右的用量,换成 cronjob 则完全是丰俭由人。
- 重复任务自动创建 skill 效果很明显,我平时常问的就那么几件事,openclaw 每次都是从零开始,hermes 做成 skill 来跑后续任务确实快很多。
- 当然也不是没缺点,很明显地,默认情况下 hermes web search 和web fetch 必须是同一个 provider... 而且还不包含我喜欢的 brave search api(当然如果你愿意倒是也可以直接改代码来支持,这点相比 openclaw 也是 huge win)

目前主要的感受就是这样,already liking it.
至于长期记忆表现如何还不知道,刚迁过来,有待观察。
00
图蜥
3天前
连段永平都开始买泡泡玛特了,而我依然看不懂这玩意儿到底有啥好的。
00
图蜥
5天前
30
图蜥
8天前
分享另一个角度。感官上cc的记忆介入深度/频率也比较恰到好处,你觉得他没忘记重要的东西,也不会老是「显摆」自己记得你说过做过啥。现在网页版御三家都有点这个倾向。像cc这样略显粗糙的记忆系统反而体感是好的。

Barret李靖: 看了一晚上 Claude Code 泄露的代码,结合常见的记忆管理框架,把记忆模块做了一些分析。 Tulving 老爷子在 1972 年提出了记忆系统的框架设计,至今仍在广泛使用,他把记忆分为三类:1)情境记忆(episodic memory),我干了啥,用来记录过去;2)语义记忆(semantic memory),我知道啥,用来提炼规律;3)以及程序化记忆(procedural memory),我会做啥,用来决定行动。 这些记忆之间是存在相关性的,例如我经历的事情(情景记忆)会慢慢遗忘细节,储存在脑海中的是提炼后的规律和知识,也就是压缩成了语义记忆;而我知道的东西又会逐渐内化为行动的指引,变成一种“知道怎么做”的能力,这就是程序化记忆;程序化记忆反过来又会指导行动,从而产生新的经历。三者构成了一个不断循环的过程:经历 → 知识 → 技能 → 新的经历。 Claude Code Memory 在这几块都有对应的实践,例如每轮次的对话它会以 jsonl 格式做储存,这是情境记忆;同时在对话过程中还会有 SessionMemory 做实时蒸馏,相当于一边发生一边做初步整理。 每轮次结束后,它会 fork 出一个子 Agent(extractMemories)去提取值得持久化的内容,写入带 YAML 头的 MD 文件,这一层对应语义记忆,把零散对话压缩成可复用的知识。更有意思的是它还有一个 autoDream 机制,会在后台做整合和修剪,把碎片化的内容重新组织、合并、更新,这一步很像记忆的巩固过程。 很多框架都没有实现程序化记忆,而 Claude Code 做了。它有一个 feedback 的记忆类型,不仅记录了不要做什么(用户的纠正),还会记录哪些做法是对的(用户的确认),这些都是经验化的技能记录。多数系统只考虑负反馈,Claude Code 兼顾了正向确认,让 Agent 不至于越学越保守,这一点非常关键。 相比 LangMem/Mem0/Zep/EverMemOS/MemOS 这些框架,Claude Code 肯定弱的像个菜鸡😄。它有很多能力是明显不足的,例如:不支持语义化召回(用 LLM 扫 metadata 代替向量检索,上限 200 个文件)、遗忘策略比较粗(24 小时 or 5 轮对话触发整合)、无关联网络(记忆是孤立文件),等等。 真要像 EverMemOS/MemOS 那样追求全量记忆,工程和架构复杂度会直线上升,就拿 EverMemOS 来说,光基础设施就包含了 MongoDB/Elasticsearch/Milvus/Redis,更别说其他的附带依赖了。这类框架更适合做个人长期记忆管理。 另外也去对比了下 OpenClaw,它的记忆实现也非常有意思。它不追求全量记忆,而是优先解决“记忆什么时候该被用”。它把记忆拆成了三层:全局层、工作区层、任务层,逐层收敛,只在必要的时候才把上下文拉进来。 在 OpenClaw 眼里,记忆不是资产,正确使用记忆的能力才是。所以它的设计更侧重于重建临时的记忆网络。 放在这个视角下再去看 Claude Code,就会发现它其实选了一条更偏执行的路径。 对它来说,看清问题全貌也没那么重要。它解决问题的方式,更像人类工程师 debug,一边看、一边改、一边跑、一边修正,在行动中逐步逼近答案。 在这个过程中,Memory 的作用就是一个“防遗忘机制”,保证关键上下文不会在多轮试错中丢失。

00
图蜥
9天前
你们量子位的编辑年轻的时候全都用的UC浏览器吗
00
图蜥
9天前
昨天 cc 源码被扒出来,有人发现一个隐藏功能是你可以在 cc 里面养电子宠物。今天发布的 cc 版本(v2.1.89)直接把这个功能开放了,使用 /buddy 触发
20
图蜥
10天前
现在可能是布局网络安全股的好时候。
cloudflare 停摆,AWS 宕机,供应链投毒,claude code 源码意外泄露以及未来必然还会发生的更多更严重的安全事件会慢慢让多数人意识到网安的价值。

当然网安板块本身弹性也很大,也很难说现在 price in 了多少预期。我个人准备用 ETF + LEAPS Call option 的方式入场。
01
图蜥
13天前
地铁上一个奶奶在教孙子背九九乘法口诀。小孩看起来还没上幼儿园的年纪。

要不我们中国人数学好呢。。
10
图蜥
14天前
harness 这个词的讨厌之处在于它和 agent 刚出来的时候一样,大家在用同一个词描述复杂度天差地别的东西。

但这不代表 harness 不重要。

最弱的 harness 只是打包几个简单的 bash command & skills。that's fucking useless & should NOT use the word 'harness'.
我们说的 harness 是要能提供给 agent 一整套观察环境的工具,并能自动修复问题。最终要达到的目的是可以在无人监守的情况下构建高质量的应用。我心里的 harness 就是 openai.com 描述的那样。

我定义了问题,接下来是结论:
harness IS important
00