想从任务分层去看这个事
1. 任务有长链路任务和短链路任务,有需要决策选择的任务和不需要选择的任务
2. 过去的模型能力不成熟,大多只能做 copilot,即大多交付用户的任务结果有不稳定性,或是提供信息做决策辅助
3. 今天大模型推理能力提升,并且 rft 这套范式可能会带动模型在这块的能力继续进步,且有泛化的可能。这个带来了:
1)当前的纯执行的长短链路任务,都有明显的进步,可以是 agent。当前也能在部分简单决策,和一些特定领域里的较复杂的决策(oai 的 dr) 里,做的好了
2)未来的任务稳定性、更广泛领域里也有机会在新范式下进步