感觉 MiniMax-M2.7 的逻辑推理有点奇怪,老是乱推,感觉是听不懂人话,推理过程也凌乱。(尝试好几次,推理错误概率非常高)
其他主流模型感觉都比它要好一点。
- Gemini 3 Flash Preview 相对最好,简洁,正确,信息也比较获取比较新。
- deepseek-chat 只是站点数据没获取到最新的,也许跟使用客户端有关。
- kimi-k2.5 站点数据也没获取到最新的,中间错了,最后还是修正过来了。
- glm-5 (阿里百炼提供)的推理过程有点奇怪,还长,搜索数据也特别多,也有点类似 kimi-k2.5 中间做了修正。