即刻App年轻人的同好社区
下载
App内打开
行小招
96关注312被关注0夸夸
探索AI在企业的落地应用场景
记录关于大模型的一切闪念、想法、洞察
Nasdaq上市公司|增长技术负责人
前阿里/同程艺龙
置顶
行小招
3月前
prompt 的撰写技巧只是“术”的层面,不能说不重要,但是更底层的东西“道”,“道”是你的认知层级,思维方式,和看穿本质的能力。“问的问题”本身是最重要的,你问出什么问题,远比你怎么问更致命。因为提问本身就暴露了你思考的天花。

相当于武功里面的,招式 vs 内功,张无忌学的太极拳为啥招式都忘记了,打出来,还那么厉害?

举个例子:
1. “帮我写一篇中国咖啡外卖市场的调研报告。”
2.“我想写一篇关于中国咖啡外卖市场的调研报告。请帮我分析一下市场规模、主要玩家(瑞幸、星巴克、Manner)的商业模式和优劣势,并预测一下未来的发展趋势。”
3. 见图
00
行小招
1天前
Anthropic 刚发了篇工程博客,基础设施配置(比如容器的内存、cpu、网络)本身能让 Agent 编程跑分波动 6 个百分点,有时候比榜单上头部模型之间的差距还大。

同一个模型,同一套题,同样的模型参数,容器资源给足和卡着给,跑出来的分可以差 6 个点多,

这解释了:为什么排行榜上分那么高,我自己用体感差很多?因为你的机器不是人家跑分的机器。你的 CPU、内存、网络条件都是随机的,跑分环境是精心调过的。榜单上 2 个点的领先,可能不是模型强,是硬件好。

个人感觉,Anthropic 的评测还是比较克制的,和自己真实使用相差不多,反观我们国内的这些顶级模型们,哎…

原文:www.anthropic.com
00
行小招
1天前
时间才是最贵的 token。

今天搭了个 另外一个 Bot ,龙虾,对接滴答清单,想着把个人的待办事项、日历日程安排都给到他,滴答这个开放接口吧,有是有,但也没现成的 MCP 能直接用,只能自己撸。

先拿 GLM-5 跑的,这也是我们国产顶级模型了,折腾了快一个小时,脚本写出来了,也能运行了,就是不稳定,偶尔就报错,很烦人。

后来换 GPT -5.4 试试,上来就说这个脚本不够稳定,让我改一改,几分钟,完事了,后面的操作的确再也没有报错过。

你说气不气人,跑分大家都差不多,真干活的时候体感差距还是挺大的。

所以啊,别省那点 token 钱了,折腾一小时省下来的那几毛钱,还不如让顶级模型几分钟给你干完。

时间才是最贵的 token。
50
行小招
3天前
养龙虾,不得花 token 钱么。很多人第一反应是充 API,其实各大厂的 coding plan 给量更足,价格比自己充值便宜太多了,不是一个量级。

问题是哪家更值?cc 做了张对比图,一眼看明白。

ps:这张表我没限定对比维度,Opus 4.6 自己决定该比什么、怎么排,出来的东西比我预期的要好,你说它不具备审美这事儿,我不信。
10
行小招
3天前
iOS 上的语音输入方案,对 Typeless 不满意其模型的改动和删减,微信输入法是我手机主力输入法, 3.1 更新后,语音输入好多了,但网络不好的时候容易断,而且还必须重新跳转,中英文混着说处理得也不好。

今天体验了豆包输入法,尼玛,纯语音输入这块确实比微信好太多了。速度快,中英文处理很棒,Opus4.6、Sonnet4.6 这种科技词第一次用就识别得很准。设置里还有个弱网小模型,网不好时自动切换,效果差点但不至于用不了,微信输入法就没做这个,也不得赖我吐槽它。

还有个好的地方,办公室小声说话的场景,豆包识别很不错,另外微信输入法不知道是 bug 还是啥,清空内容总是清不干净,豆包没这问题。

电脑端用"闪电说",底层也是豆包的流式识别,整体不错,偶尔断连不重试,已经给他们提了建议。

语音输入的第一要素就是持续、不断、识别准,把你说的话完整变成字。

后面什么语气词过滤、语言润色,都是锦上添花。把这件事做到极致,付费我愿意。再看看 Typeless 最近的状态,去看看用户吐槽就懂了,我觉得走偏了
30
行小招
5天前
龙虾(OpenClaw)用了一段时间,一开始想让它联网搜东西,结果远不如ChatGPT和Claude 的效果,还得额外掏API费用,没啥价值,后来换思路,拿自己日常最耗时间的事来试:刷Twitter。

我每天关注的AI英文账号,逐条刷、筛重点、归类,半小时起步,经常一小时就没了。

现在让龙虾在本地Chrome里用它专属的profile,登上我的Twitter账号,每半小时自动刷一次关注列表,按3个层次汇总推送。

先看中文摘要,遇到重要的继续读原文,原文也能直接在 IM 里用我给它的翻译skill转成地道中文,不用再跳去ChatGPT或Claude,整个流程在一个 IM 终端里解决,非常高效,节省了我大量的刷推时间,而且信息密度比我自己更高!

这是我目前用下来效果最好的case,回头想,它能做好这事,恰恰因为跑在我电脑上,用专属浏览器、本地skill、本地工作流,而不是云端的,

突然就理解了”本地Agent”这四个字到底意味着什么!
04
行小招
6天前
gpt-5.4 ≈Opus4.6 一个亿的小目标达成,今日token总消耗量达到了1.5亿 通用模型 gpt-5.4 在我的场景中,基本上替代了 gpt-5.3-codex 这个专门的编码模型,少量问题不如 5.3,但无伤大雅。模型继承了5.3-Codex的细心、深入、逻辑严谨,同时开始有主见、有自己的看法了,这对大多数人 prompt 不够精准来说是非常大的提升!

同时,5.4 + 4.6 = 10,是个非常好的组合,能力互补的“团队成员”!

体感上 gpt-5.4 Opus4.6 半斤八俩,擅长点不同,相互互补,一个问题俩人同时干,取各自的优势综合最终的答案是目前我感觉能达成最好效果的方案,考虑到只有sonnet的价格,那么应该把 gpt-5.4 当做你的主力编程模型,Opus 的性能和 sonnet 的价格,绝对合适!
50
行小招
6天前
gemini 一定不要用官网 gemini.google.com,要去用 aistudio.google.com,搜索质量,回答效果,千差万别,aistudio 在信息检索类问题上绝对强的一批,比 chatgpt(gpt-5.4)、Claude(Opus4.6)强在原始信息量上面。

刘飞Lufy: 现在做内容的工作流里,最离不开的是 Gemini 和 Claude。 涉及资讯和搜索问题,考虑准确性全面性,用 Gemini。涉及文本和思考问题,考虑逻辑性、去 AI 味儿的润色,用 Claude。

22
行小招
8天前
开始刻意去读经典、看经典、接触各个领域里排在 top 的东西。

书籍、电影、建筑、算法、音乐、设计……每个领域都有它公认的”天花板作品”。

不需要去搞懂它怎么写的、怎么拍的、怎么算的。

核心目的只有一个:校准审美,训练判断力。

你见过足够多好的东西,自然知道什么是好的,什么值得追求,什么是在浪费时间。

品味不是天赋,是训练出来的,而这个越来越重要!
01
行小招
11天前
与美国政府的对抗,没想到这么多人支持 Anthropic,从来没有的位置,现在第一了!

Anthropic 被特朗普封杀、被五角大楼列为”供应链风险”。

70万用户取消 ChatGPT 订阅,Katy Perry 公开领头,取消趋势还在扩大!

Sam Altman 的鸡贼,没想到偷鸡不成蚀把米,不得不深夜发文解释自己”比 Anthropic 更安全”,可是会有人信吗?

2026年了,toC 产品的护城河可能不是功能的强大,而是立场,是价值观,是人相信的叙事故事。
00
行小招
13天前
儿子5岁,最近迷上了星空宇宙,我用AI给他搭了一套太阳系系统:行星的知识探索,相关汉字认读和10以内的加减法。培训班里死活不肯学的内容,放进”他的宇宙”里,他自己就追着学了。

今天他看完银河系的真实样子后,觉得现在页面的太假、不够真,也不转动,于是拿起话筒对着电脑说了几句话,改了几个版本后,开心了,是他自己想要的了。

不认字,不懂代码,5岁,但想要的落地了,这就是 AI 带来的便利。

我越来越确信:
AI对教育的真正价值,在于让”因材施教”这四个字第一次有了可执行的方案,过去个性化教育是奢侈品,需要极高的师生比和教育资源。现在一个父亲加个AI,就能给孩子造一个围绕他热爱的星球运转的学习世界。

兴趣驱动 × AI定制,这才是教育该有的样子。
00:11
11