顺便分享一下最近的“迁徙”心得。我们尝试把部分流量从 GLM 4.6 切到千问 (Qwen3-Max/Plus) 和豆包 (Doubao-Seed),虽然没做全量压测,但有几个明显的体感差异:
1. Function Calling:GLM 4.6 和千问默认都是串行执行(千问可改并行),豆包上来就是默认并行的。
2. Prompt 迁移成本:基于 MCP 协议封装的 API,在 GLM 上跑通的 Prompt 到了千问上会水土不服,偶尔会漏参或传错参,看来 Prompt 还是得针对性微调。
3. 被报错带偏:豆包有个怪癖,全中文语境下,如果工具调用返回了英文报错,它接下来的思考和回复很容易被带偏,直接转成英文输出。
4. 速度:在非思考模式(Non-Reasoning)下,千问的推理速度确实是肉眼可见最快的。