即刻App年轻人的同好社区
下载
App内打开
Rog3r
555关注55被关注0夸夸
🦾 On-device AI
👨‍💻 有个公众号 Rog3r
Rog3r
3天前
Claude Code 编译源码中提取的所有硬编码提示词、指令、系统消息和模板字符串。

claude-code-internals/ALL_PROMPTS.md at main · roger2ai/claude-code-internals

01
Rog3r
4天前
本项目对 Claude Code 的内部架构进行了深度拆解,同时针对不同领域的方向进行了更加系统的分析。

你能学到:

- Agent 循环如何工作(状态机、7 transition 原因、pre-API pipeline)
- 上下文管理如何防止窗口溢出(6 层防线、autocompact、microcompact)
- 工具系统如何构建(40+ 工具、Zod schema、流式执行)
- Bash 命令如何被安全保护(23K 行解析器 + 安全引擎)
- Agent 协调如何实现(leader-worker、4 backend、权限同步)
- 插件如何扩展系统(marketplace、MCPB、生命周期管理)
- 记忆如何跨会话持久化(3 层架构、forked agent 提取)

推荐阅读顺序:

构建 Agent 框架:
架构 上下文管理 工具系统

关注安全:
安全 Bash 解析器 + 安全引擎

构建插件系统:
插件系统 加载器 + 市场

做多 Agent:
Agent 系统 swarm + backend + 权限

调试 Claude Code:
支撑系统 记忆 + 技能

GitHub - roger2ai/claude-code-internals: Claude Code Deep Dive

00
Rog3r
4天前
基于构建的 Claude Code 能够干的事太多了,Chrome Control, Computer use 都可以基于当前的框架自实现。

有了 AI,反而觉得自己的时间更不够了,因为想做的事太多了。人为什么要睡觉,AI 都不用睡觉。

持续修复 Claude Code 中...
00
Rog3r
5天前
昨天泄露的 Claude Code 源码是没法直接编译的,因为缺乏依赖文件。

于是修复了所有缺失文件、断裂引用和运行时错误,使其可以正常编译运行。

经测试,主力工具(Bash、文件读写、搜索、WebFetch)都正常。

GitHub - roger2ai/Claude-Code-Compiled: Compiled version of Leaked Claude Code

01
Rog3r
5天前
又实现了一个播客转录的 Skill,输入小宇宙播客链接,然后 OpenClaw 会调用本地的 ASR 模型进行转录。同时会提取小宇宙链接里的 Shownotes,然后由 Subagent 基于 Shownotes 进行审核校验,并进行格式化的分段,去掉时间戳,最终返回,效果也是非常满意的。
00
Rog3r
9天前
苹果可能会在 iOS 27 Siri 重构里,引入一套类似 “Extensions” 的机制,让第三方 AI 助手接入 Siri。现在 Siri 已经能把部分请求转给 ChatGPT;这次的变化在于,ChatGPT 不再是唯一的外部选项,Claude、Gemini 这类服务也可能进入同一条系统级入口。

苹果又重新定义了 Siri 的角色:Siri 不一定要亲自变成最强的那个,它可以变成一个更像系统层的分发与调度点。用户把问题抛给 Siri,Siri 决定交给谁处理;第三方 AI 想拿到 iOS 流量,就得通过这套机制进入。

背后的商业逻辑和 App Store 一样,当第三方 AI 通过 Siri 获得稳定的触达,订阅、增值服务、安装入口很自然会和 App Store 体系绑在一起。苹果不需要押注某个模型长期领先,它作为中台,完成 AI 的分发,自己负责入口、规则和结算。

对第三方 AI 服务商来说,这是分发机会:少走很多获客弯路,直接摸到系统入口。对原本占据“默认/独家叙事”的合作方来说,位置会更难坐稳:一旦选择被制度化,可替代性上来,议价空间就会被压缩。对开发者生态来说,既像新入口,也像新不确定性:入口越靠近系统层,流量分配就越容易变成平台规则问题。

后续还有一些值得关注的点:

第一,默认怎么做。用户需不需要选服务?不选时 Siri 把请求交给谁?这决定了“开放”到底是完全公开的市场,还是只是多了几个选择。

第二,权限怎么给。第三方接入到什么程度——只是回答问题,还是能做系统级动作?权限颗粒度会直接决定生态能长多大,也决定隐私争议会有多大。

第三,结算怎么走。订阅是不是必须走 App Store,抽成与推荐位怎么设计,这会决定第三方进来是赚钱,还是再次“给苹果打工”。

不论怎样,苹果将再一次获取系统级 AI 入口,Siri 将变成 iPhone 上一个新的平台层。
00
Rog3r
10天前
Token 自由等于赛博永生。拥有无限量的 Token 才能创造更完美的数字分身。
00
Rog3r
11天前
OpenClaw 操作手机和豆包手机 GUI 操作手机的方式,哪一种会是最终的赢家?
00
Rog3r
11天前
“哥,再给我来点 token 吧。”
02:53
00
Rog3r
12天前
Cursor 发布的 Composer 2 技术报告里特别提到了开源评测榜单的失效。

前几天小米发布的 MiMo-V2-Pro 跑分很高,我也第一时间冲了 API,但是…一用一个不吱声。

榜单分数和用户测试实际体验有差距的第一个主要原因是,公开榜单提示词都很长,往往能得到更好的结果,但是用户使用时提示词很短,也更加模糊,对模型能力要求更高。

同时这些榜单的测试修改代码往往都比较短,真实场景中修改涉及多个文件,代码长度更长,也造成不匹配。

随着模型基座训练数据增大,大部分的基础 bug 也早就被模型背下来了,所以公开榜单的分数参考意义不大了。

所以看到最近越来越多的厂商开始构建自己的测试集,有自己的榜单打分标准。

后面对模型的评估,越来越难了,只能自己上手测试看符不符合自己的场景需求。甚至,可能还需要构建自己的评测集,来测试模型的能力,来找到最合适自己场景的模型。

cursor.com

https://cursor.com/resources/Composer2.pdf

00