GPT-5.4 虽然在很多复杂的场景下,真的具有逻辑思维和业务理解能力,但同时却在另一些需要常识的任务中翻车。
如果任务指令不够明确,而是暗含了一些常识性原则,它只会按照指令字面的意思去执行,却不会同时考虑到一些未指明的常识,从而得到本本主义的结果。
在这一点上,Opus 4.6 比 GPT 5.4 要好不少。
但另一方面,Opus 4.6 的执行太多是基于常识与预训练的语料,基于这个世界已有的行为模式,而并不理解一个真正创新、独特场景下的一个新的模式。
它很难得到严密逻辑推理下的结果,在 debug 方面也会出现诸多的幻觉与漏洞。
简而言之: GPT 5.4 有逻辑、没常识; 而 Opus 4.6 有常识、没逻辑。
做日常、文科、或商业类非严密逻辑推理的任务时,用 Opus 4.6 更加轻松。而在处理理工科、编程等需要严密逻辑推理的任务时,用 GPT-5.4 更准确。