Agent 模式下的想和做分离
Chatbot 架构是线性结构,工具调用是既定会发生的事情,充分利用 AI 的生成能力来处理特定环节。Agent 架构是自主循环ReAct 结构,拥有自主纠错能力、支持插入任务。虽然被人扒出来发现 Plan 阶段也不过是硬编码了“no code”,但我觉得依然是做到了想和做的分离,或者说是充分利用了想的大脑。
ReAct 结构使用的场景是:1. 多个问题有相互依赖;2. (因为有问题依赖)动态纠错;3. 根据语义进行工具路由(动态的,非硬编码的)。
这个架构和 workflow 式核心的区别是,原来在 workflow 中被定义成 bug 的事情在 agent 中就会被认为是一种优势,因为有了灵活性所以激发了破圈的可能。
如何在提高大脑智力的激发的同时降低失智的可能性:1. 设置围栏;2. 调参;3. 多智能体辩论/监督,争取让 agent 卷起来给到一个更好的答案。
目前很多的业务问题其实都没有充分利用大模型的“想”,因为都在执着于解决 low hanging fruit 的确定性事情,感觉还是要放开更大的想象力&降低对于过程的管控(少执念)。