最近流量不太好,那我只能送点东西给大家了
如果我告诉你,能帮你的ai24小时干活,并且产出你满意的效果
这种方案你要不要?
(注意⚠️:别拿我的方案和市面上的玩具比)
就比如:你睡前给AI下了个/goal任务,早上醒来发现它跑了一夜,token花了几十刀,但方向从第3步就歪了
所以我做了Scale,专门解决这个问题
自从/goal 功能出来以后,我发现 AI 最大的问题已经变成了:让 AI 自动长时间运行,最麻烦是它跑偏后你返工那几个钟头。
你盯着它,省时间的意义就没了;你不盯它,等回来发现白干一大半。
所以我做了 Scale skill,专门解决原生/goal 命令出现的跑偏问题,让你的每一分 token 都花在刀刃上!
原生 /goal 的问题很清晰:给个目标 → AI 自动连续执行 → 人不在每一步
省心,但有三个会跑偏的机制级漏洞:
目标模糊,AI 要么说做完了就收工,要么钻牛角尖
路径作弊,你说让所有测试通过,它可能直接把测试删了
无人在场,等你回来它已经在错路上走了八条街
1.Scale 为什么可以帮你解决这个问题?
核心是三道机制:在 AI 开跑前,先把做什么(计划)、怎么做(预演)、算不算完(验收)全部敲定
最关键的设计是:双 AI 视角对抗,替代人盯
这块啰嗦一下,想和大家阐述一下我的工程理念:
人能纠偏,是因为人有立场,想让 AI 能自动纠偏,那就给两个 AI 各装一个立场,让它们替你互相挑刺
Claude 站产品经理/架构师视角,Codex 站资深工程师视角
两个 AI 背靠背互相审,不直接对话防止它俩互相点头,吵起来的分歧点,就是最容易翻车的地方
我们只需要在正式开始执行前,两个关键点拍板:审计划的大方向、审最终的验收标准
中间可以放心的让它放飞跑任务
所有你在正式执行前全部的决策,将会被记录为一个检查脚本(
checks.sh),不靠 AI 记在脑子里
能交给脚本的,一律不留给 AI
2。连监督者都被监督
很多类似工具的漏洞是:管干活的 AI 很严,但管编排的 AI 自己偷懒跳步全靠自觉
Scale 本身使用状态机闸机硬性拦:没有审核材料不许标已通过、关卡没过不许进下一步、不许跳步
监督者,也得被监督
3。长任务分段 + 每段全量回归
长活切成小段,每段干完立刻把前面所有成果一起重新验一遍
所以改 A 弄坏 B 会在下一步就被逮住,不会等全做完才发现满盘皆崩
段与段之间写摘要落盘传递,中途断了还能接着续
适用场景
多步骤、你不想全程盯的长任务
容易被 AI 蒙混的活(修 bug、让测试通过、重构)
多文件/多模块、怕改一处坏一片的
作为一个天天跟 AI 协同的实践者,我深知 AI 长任务最大的成本不是算力,是信任成本
Scale 就是我给自己做的一个答案:让 AI 自动干长活,你不盯着,它也偏不到哪去
目前我实测,自动化任务效果整体提升10倍以上,可以说不是一个量级
这么好的东西怎么获取?
点赞收藏评论这条帖子,加我领取哈