GPT-5.4 虽然在很多复杂的场景下，真的具有逻辑思维和业务理解能力，但同时却在另一些需要常识的任务中翻车。

如果任务指令不够明确，而是暗含了一些常识性原则，它只会按照指令字面的意思去执行，却不会同时考虑到一些未指明的常识，从而得到本本主义的结果。

在这一点上，Opus 4.6 比 GPT 5.4 要好不少。

但另一方面，Opus 4.6 的执行太多是基于常识与预训练的语料，基于这个世界已有的行为模式，而并不理解一个真正创新、独特场景下的一个新的模式。

它很难得到严密逻辑推理下的结果，在 debug 方面也会出现诸多的幻觉与漏洞。

简而言之：  GPT 5.4 有逻辑、没常识；  而 Opus 4.6 有常识、没逻辑。

做日常、文科、或商业类非严密逻辑推理的任务时，用 Opus 4.6 更加轻松。而在处理理工科、编程等需要严密逻辑推理的任务时，用 GPT-5.4 更准确。

和 GPT-5.4 合作的过程中，第一次感受到大模型真的能“理解”了。也就是在一个创新的、互联网上没有相同设计的业务场景/规则系统下，真的能进行严格的逻辑推理，问题比我想得清楚和严谨了。

阿晓Ocean: 和 GPT-5.4 合作的过程中，第一次感受到大模型真的能“理解”了。也就是在一个创新的、互联网上没有相同设计的业务场景/规则系统下，真的能进行严格的逻辑推理，问题比我想得清楚和严谨了。