当你在开始做一个任务之前,可以先简单想一下,这是文字、代码还是结构整理?因为每个模型都有自己擅长的地方:
软件工程与代码生成:GPT-5.3 codex
代码理解、推理与质量:GPT-5.3 codex
测试、测试与维护:GPT-5.3 codex
数据工程与后端服务:Claude Opus 4.6
前端与产品工程:Claude Opus 4.6
Agent工具调用:Claude Opus 4.6
Web与桌面自动化(静态):Claude Opus 4.6
研究与知识工作Agent(静态):GPT-5.2 Pro
数学与形式推理:Gemini 3.1 Pro
逻辑与规划:Gemini 3.1 Pro
知识深度与事实经验:Gemini DeepThink
阅读理解与信息抽取:GPT-5.2 Thinking
长上下文记忆与多轮一致性:GPT-5.2 Thinking
指令遵循与对齐:Claude Opus 4.6
多模态理解与视觉推理:GPT-5.2 Thinking
情商与协作沟通:GPT-4.5
创作表达与审查:Claude Opus 4.6
你有时候你并不需要知道如何选择,只要把你正常的输入和上面这份对应关系随便问一个模型,就能获知自己业务场景下面最合适的模型了。
幻想通过一个模型去处理所有问题,是笼统且无知的,在合适的地方要用合适的模型。