虽然 Karpathy 认为 2025 最革命性的图像模型是 Nano Banana,但从我的深度实践和开发,以及他自己年初演讲中提出的 3.0 理论来说,我认为今年最革命性的图像模型依旧是年初的 GPT-Img(GPT-4o)
GPT-Img 原生多模态的智能水平完全开创新时代 且 在年初代表原本不被看好的自回归阵营在图像模型领域的碾压式优势和掀起的腥风血雨,是图像模型 3.0 的开端
Nano Banana 及 Pro 的后来居上确实令人惊艳,代表扩散模型扳回一城,但回顾一年的发展,荣誉应该给予开创者:GPT-Img/GPT-4o