谁是我的新王!
11月18日,Google发了Gemini 3 Pro。
11月19日,OpenAI发了GPT-5.1-Codex-Max。
11月24日,Anthropic发了Claude Opus 4.5。
三家公司像约好了一样。
排着队往我脸上扇巴掌。
每一巴掌都在说:你以为你懂AI了?
天真。
有粉丝问我怎么看。
我怎么看?
我用眼睛看。
如果你赶时间,记住一句话就行:
Claude Opus 4.5是目前最强的。
但也是最贵的。
就像兰博基尼是最快的。
但你买得起吗?
综合编程能力排个序:
Claude Opus 4.5 > GPT-5.1-Codex-Max > Gemini 3 Pro >> Claude Sonnet 4.5
但这个排序有个问题。
它假设你只在乎"综合能力"。
问题是,谁在乎综合能力?反正我在乎性价比。
其实,你需要的是:这个具体的活儿,谁干得最好。
前端/设计类任务:Gemini 3 Pro。这货的审美不知道怎么训练的。
反正比我强。
指令遵循差点意思,但创造力可以。
就像那种不太听话但有才华的实习生。
其他所有编程任务:Claude Opus 4.5。
没什么好说的。
就是强。
SWE-bench跑到80.9%。
人类历史上第一个超过80%的模型。
当然,人类历史也就这几年有这玩意儿。
预算有限但又想要强模型:GPT-5.1-Codex-Max。
便宜量又足。
它有个"compaction"技术,能在超长任务里保持不犯糊涂。
适合那种一干就是几个小时的大活儿。
Claude Sonnet 4.5:没钱但用想要用 ClaudeCode 的。
能力被其他模型全面碾压,但好在遵循指令能力还行,ClaudeCode 生态配合起来也不错(比国产模型都要好)。
就像你买了iPhone 16之后,iPhone 15就只能拿来垫桌角。