一个有意思的观察,大家都在降级使用 Sonnet 4.0
Augument code 最近发布了一个blog,里面揭示了一个观察,大家有往从 Sonnet 4.5 到 Sonnet 4.0 降级使用的趋势。图1.
这个挺有意思的,理论上 Sonnet 4.5 的能力肯定是比 Sonnet 4.0 要强的,但是大家并没有一边倒的都在使用 Sonnet 4.5, 而是有选择性的还在使用 Sonnet 4.0。 这让我想要了解一下到时它们是什么差异导致了这个现象。
第一反应是价格吗?但是查了下发现 Sonnet 4.5 和 Sonnet 4.0 的价格其实都是一样的,都是 $3 百万输入, $15 百万输出。那就是它们能力上或者对不同任务的处理上的差异了。augument 继续给出了几个对比,其实就是一个结论。
Sonnet 4.5 重推理,少操作。而 Sonnet 4.0 则是推理没有那么深入,但是倾向于先执行。这里的操作执行指的都是调用工具。所以 4.5 消耗的 token 比 4.0 要多25%。 但是由于深思熟虑了,也导致了执行的工具次数平均比4.0 少。
所以由于这个特性,业内也是倾向于,使用 Sonnet 4.5 来做架构设计、长上下文(包括多文件)的理解和编辑,最好是拆分成很多子任务后,直接让 Sonnet 4.0 完成,4.0 执行的更加高效和输出更加稳定(它尽量不思考)