即刻App年轻人的同好社区
下载
App内打开
李太白_shipping
133关注601被关注0夸夸
半桶水程序员,AI辅助师,前广告优化师;出海已达成成就:月UV 1M,月入千刀;出海现阶段目标:月入万刀。
李太白_shipping
3天前
今天突发兴趣测试了一下GLM5.1,还真让我意外,居然通过了我的测试任务,这个测试比较考验通用智能和长上下文下的遵循度,前些日子测试过一些模型,国产除了deepseek官方api,其他都不咋行。感觉可以买GLM的coding plan了。
30
李太白_shipping
5天前
真坑啊,刚等到Claude Code刷新额度,结束遇见登录bug,试了好多次后去x上验证一下,果然大家都出现了这个问题😭
20
李太白_shipping
8天前
太给力了!尝试了下用creem cli操作creem直接解放了双手,跳过自身学习直接口喷以需求驱动。
01
李太白_shipping
19天前
今天gpt5.4在openclaw里执行任务的表现有点惊到我了,任务执行非常高效,主要体现在工具并发执行,不像以前opus、deepseek那样一个一个来,快得离谱!这难道是大佬入驻openai后的特殊优化吗?😂
10
李太白_shipping
22天前
最近玩openclaw跑一些定时任务,比较考验通用智能和长上下文环境下的遵循度,经过一段时间的稳定性验证,除了claude外,非常推荐deepseek官方api,注意是官方api,其他三方的plan不推荐。相比claude,deepseek需要提示词准确详细一些,否则它可能偶尔会理解错意图,或者可能会不顾效率调用一堆工具,虽然能完成任务,但拖慢进度。claude则能非常高效稳定的完成,不会太吃提示词。其他的我通过走openrouter测了一下,都不太符合我的要求,甚至gpt5.4都能犯个别错误,但gpt5.4也是可以用,只是api差不多的价格我干嘛不直接用sonnet 4.6呢。当然官方订阅和中转站啥的就另说了😂
20
李太白_shipping
23天前
今天在openclaw里通过openrouter跑m2.7,测试我弄的一个经典任务,比较考验通用智能和长提示词的遵循度,结果还是一坨,依旧比不上deepseek 官方api😭,更别提Opus了。最近中转站愈发不稳定,急需能替代opus的国产性价比模型,难道只能等v4了吗?
71
李太白_shipping
1月前
openclaw 2.26.3.1以后的版本,内置飞书插件的体验越改越崩,3.1的配置在3.8里头直接丧失了流式输出能力,也不知道咋配置恢复了。
44
李太白_shipping
1月前
昨天用小龙虾测试了一下本地部署的qwen3.5 9b这个小模型,大小6.6G,显存需要5G,多模态。测试效能惊人!!!难怪国外不少人都推荐。如果你的任务简单重复,不需要复杂的智能,可以试试这个。

都说它9b能达到其他模型120b的效果,尤其是视觉推理能力,得分高达70.1分,什么概念呢,gpt5.2得分是79.5,最新的gpt5.4这一得分是81.2。
昨天我主要测了下在openclaw里的应用,执行我的半自动和全自动工作流。在半自动工作流的表现非常亮眼,感觉能有我平时使用的付费大模型的七八成效果,看它的推理过程,可以很清楚的看到这个模型没有在瞎说乱造,对提示词的遵循度还行。不过我这个半自动工作流的复杂度一般,也没有让其使用工具和操作电脑。在后面测试全自动工作流skill时,就直接歇菜了,只能完成第一步。但是我在后面单独测试它网络抓取能力时,发现了一个不错的点: 我先用opus执行一遍然后生成详细的sop用于给9b布置任务,它就能稳定的完成任务了。

这意味着,也许只要指令够详细,任务具体,它就能稳定执行。也难怪还有人用它0.8b版本的做类似路由分发的活。
43
李太白_shipping
1月前
最近一直在用小龙虾,目前它已经可以自己赚钱养自己了(实际上是我把我一个赚钱的项目完全交给它),我发现skill必须自己打磨,这一步最花钱,拿来的还需要自己再裹一层,配合memory.md,给它安排工作,它的表现真的很像一个人了,挺有意思的😂
02
李太白_shipping
2月前
我的小龙虾已经差不多可以全自动上站了😂
40