昨天用小龙虾测试了一下本地部署的qwen3.5 9b这个小模型,大小6.6G,显存需要5G,多模态。测试效能惊人!!!难怪国外不少人都推荐。如果你的任务简单重复,不需要复杂的智能,可以试试这个。
都说它9b能达到其他模型120b的效果,尤其是视觉推理能力,得分高达70.1分,什么概念呢,gpt5.2得分是79.5,最新的gpt5.4这一得分是81.2。
昨天我主要测了下在openclaw里的应用,执行我的半自动和全自动工作流。在半自动工作流的表现非常亮眼,感觉能有我平时使用的付费大模型的七八成效果,看它的推理过程,可以很清楚的看到这个模型没有在瞎说乱造,对提示词的遵循度还行。不过我这个半自动工作流的复杂度一般,也没有让其使用工具和操作电脑。在后面测试全自动工作流skill时,就直接歇菜了,只能完成第一步。但是我在后面单独测试它网络抓取能力时,发现了一个不错的点: 我先用opus执行一遍然后生成详细的sop用于给9b布置任务,它就能稳定的完成任务了。
这意味着,也许只要指令够详细,任务具体,它就能稳定执行。也难怪还有人用它0.8b版本的做类似路由分发的活。