“为了一点醋,包了一顿饺子,醋还不一定好吃”
为agent提供的一个cli,有点类似于rtk,不过更偏向于收集上下文。虽然cc中的bash与单独的grep、glob完全够了,何况gpt很善于用python抓context,但还是扛不住重复造轮子。
rust与agent first,需要评测吧?于是引入eval测量,也是简单基于llm多源对比;
有了eval如何改进呢?引入evolve,基于agent cli(就是非交互式的cc与codex)自动改进,这样下去两个cli完全烧不起;
恰巧windsurf提供又快又好用的swe-1.6,又逆向把windsurf runtime包起来暴露出成cli(
github.com)给evolve harness用...
兜来兜去,最开始的cli还需要优化,周边又长出好多其他的...