即刻App年轻人的同好社区
下载
App内打开
DemoChen
435关注1k被关注9夸夸
+v: iDemoChen
🌍保持好奇,持续 Build
🧠在日记中复盘,在写作中思考
🐒正在探索人与 AI 新的协作方式
DemoChen
2天前
养虾 openclaw 笔记(一)

我们日常在使用一个产品和软件的时候,大多数情况下都会去安装。openclaw 也不例外,它的安装其实不复杂,按照官网或者文档的教程,其实就是把一条命令复制到命令行,回车就开始装了。

但它默认会有一些前置环境需要你配置好:Python、Node 环境。如果是 Mac 电脑,只要系统比较新,版本通常是足够的。但如果你是 Windows 电脑,可能就会遇到这样那样的问题。对我来说,安装不是特别大的问题,我对命令行的操作和理解相对有经验,所以这些事情很顺利就装好了。

最开始是装在阿里云上,但我发现服务器的配置体验不是很好,而且早期版本的更新也不是很快。

后来又在腾讯云上进行了安装。配置好之后,发现体验依然不够好,原因是服务器上没有任何我的数据。它不像在本地电脑上操作那么方便,特别是跟已有数据的连接(比如我的文章、上传文件图片等)很不方便,而且它缺乏很多 App 集成的能力,所以我也放弃了。

最后我把家里的一台电脑腾空,把重要文件处理好之后,又重新安装了一次。这也是我现在开始折腾的版本。安装完成并配置好相关内容(比如模型)开始使用,这个时候对我来说,才算是比较正式地开始“养虾”了。

实际用起来,其实我会发现有很多不满意的地方,或者说需要你自己去完善的地方。

从逻辑上来说,OpenClaw 是一个技术框架或者是一个程序。它不是一个大模型,也不是一种超能力。它需要你给它配一个大模型(也就是一个大脑),然后再给它组装各种各样的技能(Skills)之后它才算是有初步的雏形可以去帮你干活。

也就是说,它能够发挥 Agent 的一些能力,具有帮你干活的能力。对比 CodeX 或者 Claude Code 这些编码工具来说,表面上差异好像不是那么大,但实际对比用下来之后,你会发现区别非常大。这也是我们去使用 OpenClaw 的核心原因:就是让它能够充分发挥自主能力,帮我们去处理一些事情。

安装和配置相对弄完之后,就算是跟 openclaw 建立起了联系。接下来遇到了一个特别奇葩的事情,也是我没有理解的地方。

我发现它突然变傻了。当我给它下一个指令之后,它需要我每一次追问结果,它才告诉我上一步的情况。甚至有时候会出现它说正在处理,而当我下一句问它处理结果的时候,它其实根本没有处理,只是回复我在处理。我把这个过程称之为“行动幻觉”或者“Agent 幻觉”,可以说这是一种欺骗行为。

这个问题困扰了我大概有一天半的时间。我在 Gemini、ChatGPT、Claude 各种去搜索和尝试都没有解决,改各种配置文件、重启、插件等等,我开始以为是我的 agent.md 文件修改导致的,但恢复出厂设置之后仍然如此。

今天晚上我实在想不通,就用 Claude Code 去帮我打开我的 ~/.claude 文件夹。在这个文件夹下我问它,为什么我现在的指令变得问一句才回一句,甚至有时候会出现并不回复我的情况?它帮我读了该文件夹下所有的文件,然后给了我解决方案,并且帮我解决掉了。

这个问题我也在网络搜索或者各种论坛上找了一些别人遇到的情况。他们大多是通过强化提示词解决的,当然每个人的情况可能不一样,有些人着重强调提示词是可以成功的,但也有些可能并不成功。比如我就没有成功,最后还是我的 Claude Code 帮我解决的。

到这一刻我就彻底顿悟了。

我们以前 debug 的过程,其实就是把错误信息给到 AI,或者在搜索引擎里面搜索,试图找到答案获取结果。但每做一次这样的行动,就会带来很强的挫败感。这种挫败感让我非常难接受,因为你找了很多资料,问了很多人的信息,却发现都有问题。

但今天 Claude Code 帮我解决这个问题之后,我突然意识到,我们要想解决一个问题,最根本的就是上下文、你的配置以及实际的现状是什么。

无论我们去网上找错误,还是去问 AI,这种 Chat 对话的形式,带来的结果其实就是:你的输入是片面的、不完整的,又试图得到一个解决方案,除非这个问题别人也遇到过,或者说问题本身一模一样、非常单一,才可能有结果,反之,就很难获取正确答案。

ClaudeCode 直接读取我这个配置下的所有文件,然后帮我逐一排查,一步到位给出解决方案。就是因为它充分理解了我的上下文,读取了我当前所有的情况(包括日志),所以它才能够给我一个很好的解决方案。

这个是在实际应用过程中的一点小插曲。

当然,我们现在从互联网上收到的信息,对这件事情的评价主要集中在两点:
1. 成本高:因为需要使用模型来帮我们处理任务。正如我之前所说,Token 其实是一个非常伟大的发明,它导致我们的输入和输出都是有成本的。那么我们就要去思考,为什么要进行这样的输入去执行任务,这就是经营意识。
2. 风险大:有人说它会删除你的文件、电脑数据等等,网络上甚至还有一些谣言说它可以发微信红包。但如果你实际上手去尝试,会发现并没有想象中那么夸张。只有当我们希望放大任务规模或者放宽限制条件时,才会产生实质性的影响。

基于此,很多人并不推荐在自己的主要生产机器上直接使用,而是选择通过备用机或者云服务器的方式来快速体验。

基于此,我的想法大概是在确保自己不焦虑的情况下,与之建立起联系。

首先,我们不能焦虑,因为这件事情对社会来说肯定是有利的。虽然有人觉得今天流行这个、明天流行那个,热度可能很快就过去了,但从技术的发展周期来看,现在的大模型版本无论是多模态能力还是推理能力,都远远优于以前。

Agent 这样的发展趋势下,它给我们的启发是:Agent 的能力会变得越来越强。可能现阶段我们还在探索有哪些场景和实际的业务流程可以被优化,但从大方向和趋势上来说,它一定会带来利好,并给我们提供极大的想象空间。

在这个过程中,我不能因为成本或风险就与之脱节,因为成本是可以控制的,风险是可以规避的,所以这些都不能成为我不去使用它的理由。因此,我需要主动地去拥抱、尝试并了解它。

这是目前在实践和尝试的一些方向。

在接触这个事情的过程中,我对 Claude Agent SDK 框架产生了更大的兴趣。我也在试图借助“小龙虾”或者去帮我做一些我想做的事情,比如家庭资料管理系统。目前方案正在与 AI 沟通探讨中。

>本文采用 Typeless 完成,一字未改。
22
DemoChen
29天前
哈哈,因为 iOS 系统的权限限制,获取录音权限需用户授权;

早期微信输入法每次都跳转授权,豆包做了改进,可以设置一定时间持续录音,比如5分钟,现在微信输入法也跟进了这个功能的;同理,typeless 也是有的。

曾曾曾曾曾俊: 豆包输入法确实很好用,但是吧,在我没使用豆包输入法的时候,它依然在使用我的麦克风权限,也就意味着它理论上可以随时收集我所有的音频内容。 这样的输入法你敢用吗

20
DemoChen
29天前
我有一台 vivo 手机,有超过5天没有使用,现在解不开了,除非刷机。

这台手机我设置了指纹、人脸和图案三种密码,系统有一个保护机制是72h 需要用图案解锁一下,解锁成功之后才能用人脸 or 指纹解锁手机。

联系客服,客服说需要刷机清除锁屏密码才能继续使用;意味着我无法查看里面的资料,因为是备用机,我没有对里面的内容进行备份,也是失误。

我不理解的地方,这个安全保护机制是意义是什么?
1,手机是我的;
2,里面的人脸、指纹也是我的;
>>>我无法用我的人脸和指纹打开我的手机。

就好比家里的门支持钥匙和指纹打开,现在我没带钥匙,就不能用指纹打开,必须要把门砸了才能重新配一把钥匙。

> 我将此内容也同步问了下 ChatGPT 🤣
190
DemoChen
1月前
微信公众号这设计是不理解。

想找回一个企业主体认证的服务号,之前我记得是对公验证就可以重置管理员,不知道什么时候开始加了一个【原管理员验证】的前置条件,意味着所有的操作都需要原来的管理员先扫码确认。

可,如果我知道原管理员是谁,或者我能联系上是谁,就不需要找回账号了呀。于是,我搜索下发现,在微信开放社区有很多这样的帖子(我放评论区),官方回复是在微信上联系【腾讯客服】,有人反馈联系也不行。

这个设计是希望找不回 还是找回呢?
11
DemoChen
1月前
《Claude Code in Action》在 Coursera 上居然要49刀,好在我们有 B 站,免费就能学,甚至都不需要注册。

想起来 Coursera Udemy 在12月的时候达成合并协议,由 Coursera 以全股票形式收购 Udemy,Udemy 成为其全资子公司,之后 Coursera Plus 就降价了,五折(199刀/年),哪怕100刀,我现在也不会买了啊👀
04
DemoChen
2月前
在野卡(bewildcrd )的 74 刀提现失败

之前因为被迫关停,我当天申请提现,没有成功。

最近上了余额兑换,可以把之前余额兑换 ChatGPT ,但是我没有看到余额,上周联系客服,终于经过四天时间,在今天找回了 74 刀。

由于 1.13 日我已经买了三个月,而余额兑换只有 45 天时间,账号目前还在有效期内,被告知没办法叠加兑换,且暂时不能提现,也就是说在 45 天内我如果不兑换 74 刀,就又没了。

让我意外的是,我几乎踩中了他们每一个节点,然后进了一个死胡同,现在出不来了。
52
DemoChen
2月前
@大华Dahua 好即友
02
DemoChen
2月前
Token 真是个伟大的「发明」,它明确告诉我们:输入和输出都应该有成本。哪怕是一句简单的问候,都应该有消耗。

以前加微信,喜欢说“在吗?”但是在 AI 世界里,它正在变成这个时代最贵的一句话。

以前我从没认真想过,说话到底值不值钱。

发一句“在吗?”,对方不回也没损失;
发一句“帮我看下”,大不了再解释几句。
我们早就习惯了:不想清楚也能开口,表达混乱也有人兜底。😂

但是在 AI 的世界里,每一次表达都是有成本,都是消耗。每打一段字,背后都在消耗算力。你问得越模糊,模型为了搞懂你在说什么,就要跑越多轮推理。你越随意,系统付出的成本就越高。

更讽刺的是:想得越少的人,其实花得越多。

如果只说一句“帮我想想”,看起来省事,其实是把所有思考成本一股脑甩给了对方;再比如不讲背景、不说边界、不提目标,最后只能靠一轮轮补充把问题补全。

在人与人的沟通里,这种成本是隐形的。浪费的是别人的时间、耐心和专注力,但没人给开账单。而 Token 的出现,就能把这张账单打出来了。

看起来比较冷酷,好像世界突然变得只讲效率不讲人情。在 Token 的世界里,“在吗?”真的很贵。
不是因为这句话字数多,而是因为它几乎没有任何信息量,却要求对方为你打开完整的思考流程。

于是我开始意识到:真正节省 Token 的方式,从来不是少说话,而是想清楚再说。

当你能一次性讲明白:你要什么、为什么要、有什么限制、期待什么结果——这不是对系统的讨好,而是对任何接收者的尊重。

Token 并没有发明成本,它只是第一次让“胡说八道”变得明码标价。

前两天和人交流~为什么 AI 泛泛而谈,答案不满意?我说,从我的经验看,有两个方面原因。

1,上下文不完整。
以述职报告为例,这里的上下文至少应该包含:
述职的目的是什么?如升职?加薪?加多少?市场多少?
参与述职的人是哪些?对目的的影响有多大?平时对接的特点是什么?
完整的项目完成情况,工作内容、去的结果等分贝是什么?
述职的形式是什么?时长?等

AI 根据这些上面的信息帮整理大纲,确认无误后整理成文字稿,再整理成 PPT 或者需要的格式。

2,大模型太差,或者没选对。

用豆包和 Gemini 是有区别,哪怕是 Gemini 用2和3也是有区别的;ChatGPT 亦如此。大模型厂家不一样、模型版本不一样都会影响其结果。

这里延伸开来是需要建立对模型能力边界的认知,推理能力、搜索能力、文本能力、声音音色、画图能力等等。都是利器,看怎么握刀了。
01
DemoChen
2月前
终于,我还是用回了 Inoreader。

21年的时候用 Readwise Reader 替代了 Inoreader,后面因为其体验确实一般,再用 NetNewsWire 替代了 Readwise Reader,在后面就是 folo;在21年之前一直是 Inoreader。

上月甚至还是尝试用 Docker 部署了几个服务,体验下来都很一般,设计上就很不好看,体验就更难了。关键是自部署也费时间,维护成本高。

这两天重新捡起来 Inoreader,还是经典的产品更适合我;对比21年的时候,在设计和交互上有了很大的改观。

昨天发邮件试着申请一个五折优惠码,早上收到回复暂时不行,可用现在的7折优惠活动,算下来400元/年,也能接受。 @千古壹号 让我坚持看下去,哈哈。

Tips:直接访问官网(www.inoreader.com )打开速度略慢,特别是加载列表和文章内容;后面尝试用 www.innoreader.com 还是有丢丢慢;最后在 @404KIDSSEEGHOSTS 的推荐下,采用「jp.inoreader.com」几乎秒开。(均是🇺🇸节点)

开始享受阅读的乐趣了。
00