很多人以为 agent 做不好的问题是 skill 不够多。
我觉得不是。
真正麻烦的是,skill 都能单独干活,但它们接不上。
比如做一次数据分析:
飞书 skill 取信息。
分析 skill 看数据。
飞书 skill 再把结果发到群里。
每一步都不难。
难的是中间都得我盯着。
上一步跑出来的东西对不对?
对了,继续。
不对,停下来改。
这就很蠢。
AI 明明已经能做事了,结果我还坐在旁边,当一个负责点下一步的人。
所以我做了这个 pi 插件,也顺手开源了:
github.com一开始我以为,把 skill 串起来就行了。
后来发现不行。
如果第一步结果就是错的,后面只会错得更完整。
分析 skill 会拿着错的数据继续分析。
飞书 skill 会把一份看起来很完整、其实已经坏掉的东西发到群里。
这不是自动化。
这是自动把垃圾发出去。
所以我加了检查。
每一步跑完之后,先看它有没有达标。
达标,再继续。
没达标,就重试,或者停下来。
最终成果非常稳定,而且这种方式是真正能让 agent 当成一个功能的方式。
我已经运行了一个多月,每周都需要,现在只是个开始,下一步要做的是如何集成到 Codex 和 Claude 这种通用 agent 中去。