即刻App年轻人的同好社区
下载
App内打开
阿晓Ocean
7天前
GPT-5.4 虽然在很多复杂的场景下,真的具有逻辑思维和业务理解能力,但同时却在另一些需要常识的任务中翻车。

如果任务指令不够明确,而是暗含了一些常识性原则,它只会按照指令字面的意思去执行,却不会同时考虑到一些未指明的常识,从而得到本本主义的结果。

在这一点上,Opus 4.6 GPT 5.4 要好不少。

但另一方面,Opus 4.6 的执行太多是基于常识与预训练的语料,基于这个世界已有的行为模式,而并不理解一个真正创新、独特场景下的一个新的模式。

它很难得到严密逻辑推理下的结果,在 debug 方面也会出现诸多的幻觉与漏洞。

简而言之: GPT 5.4 有逻辑、没常识; Opus 4.6 有常识、没逻辑。

做日常、文科、或商业类非严密逻辑推理的任务时,用 Opus 4.6 更加轻松。而在处理理工科、编程等需要严密逻辑推理的任务时,用 GPT-5.4 更准确。

阿晓Ocean: 和 GPT-5.4 合作的过程中,第一次感受到大模型真的能“理解”了。也就是在一个创新的、互联网上没有相同设计的业务场景/规则系统下,真的能进行严格的逻辑推理,问题比我想得清楚和严谨了。

00