即刻App
年轻人的同好社区
下载
App内打开
也树
410
关注
536
被关注
2
夸夸
公众号「一颗小树」作者。
希望让自己拥有更多选择的权利。
也树
23天前
我的直觉是 skill 很像软件工程里的 module,可复用的单元,只是在 LLM 场景下更拟人化了,所以会有相似的局限性
许涵之: 一开始觉得 Claude 的 Skills 并不是一个特别神奇或能惊艳到我的东西,后来也逐渐感受到它的一些厉害之处。 它的本质其实是一个(由AI agentic 地)按需加载系统提示词(含可用工具及其描述)的范式,这种范式很多产品可能都在同步探索,只是没有公布出来(比如 ChatGPT、Gemini 都一定是有做的)。 很多产品在用户选择不同开关(如“快速回复”或“深度思考”)时,其系统提示词是不一样的。LangChain 的 RouterChain 也依赖外部的分类模型(Classifier)或 Embedding 检索来决定加载哪个 Prompt。但这些都并非按需加载,而是“隐式工程路由”。 随着模型能力的提升和用户需求复杂度的提高,之前为了提高模型智能上限而采用的工程方法,反而开始制约模型的智能,为了更好发挥模型 Agentic 的能力,由 AI 按需加载提示词的理念其实迟早会被提出来成为共识和落地实践。 比如 Manus 和 Langchain 在 9 月份分享的上下文工程五大策略中其实就已经隐含了这种理念。 Manus 后来升级到 1.5 版本之后,把 Ask、Agent 和 Auto 模式以及对质量、速度的选择都取消了。这些模式背后可能涉及不同的模型、系统提示词、AI 可用工具和行动空间,任务的首次选择与后续切换,背后必然有一套 Agentic 的路由方式,这实际上就是“按需加载”理念的实践。 回到 Claude,观察之前 Claude 3.5 和 3.7 被公开泄露的提示词可以发现,其中大量关于 Artifacts 的内容是常驻在提示词里的,当时还并没有做按需加载。 再后来,Claude 推出编辑文档、PPT 和 Excel 的能力时,我发现AI每次做这些操作都得先读几个文档学习一下。当时我觉得很奇怪,甚至觉得这种处理方式有点丑陋。为什么要这么搞?这些知识不应该直接预置在提示词之内吗?为什么每次都要重新学习一下,不是显得很愚蠢、很多余吗? 那时候我不明白,现在才理解,其实他们在那个时间点可能就在做 Skills 的原型。 这说明他们也有一个演进的过程。 因为我也处于这样的认知演变过程之中,所以并没有觉得惊艳。 我觉得真正厉害的是,Claude 作为一个模型厂商,拥有一个更通盘的视角,把这件事情做成了一个生态。 Skills 本身是有许多缺陷的,比如它只能增加提示词但不能卸载提示词,随着任务复杂度和 Skills 加载量的提升,模型能力还是会下降,比如它没有增加可调用工具的空间,更多是领域知识的指导(这部分 MCP 其实可以补足一些)。但这种复杂度的牺牲换来的是可拓展性的提高。 Manus 更多是在做自己的事情,虽然有相关的技术分享,但没有将其做成一个所有用户和开发者都可以复用和传播的生态。而 Claude 不一样,他们做的 Skills 是一种非常简洁、通用、易于理解的能力,同时具有极大的拓展性,并且大概率在模型层面上做了优化,让模型能更好地理解和调用 Skills,将一种内部的工程最佳实践转化为行业的互操作标准 看到很多人都在宣传和传播这种使用方式,我觉得这才是它真正厉害的地方。
2
0
0
也树
23天前
flomo 里真实的想法最多,回顾就更有价值。
如果能更方便地导出内容就更好了,现在为了自己的一些 AI 洞察尝试,还要自己写插件导出 markdown 数据🥹
6
2
0
也树
1月前
一个普通人充满变化的 2025 年。
小树的 2025 年终总结
2
0
0
也树
1月前
世界不能没有正经叭叭
3
0
0
也树
2月前
燕云十六声不羡仙剧情过完的时候真的非常意难平,还是第一次在手游上获得这么强的代入感。
1
0
0
也树
2月前
尝试了一下灵光,排版效果、响应速度、图表增量加载+可交互体验很好,加上可以想象的背靠蚂蚁的语料积累,在金融问答上是目前接触到综合体验最好的AI 产品了。
如果将来能支持更长时间的深度研究任务就好了
1
0
0
也树
3月前
地坛的海
3
0
0
也树
3月前
真正的突破,往往不是来自对旧问题的更优解,而是来自对新问题的勇敢定义。
https://mp.weixin.qq.com/s/QYBv-GdSsbgl7-4rUSJF1g
1
0
0
也树
3月前
没有这么悲观,只要能意识到标准化context 的重要性的团队,基本都在尝试解决了
南壹: 发现企业内想推AI Coding是很难的,一个团队内,每个人对AI的认知、使用的工具、使用的模型都是不同的,他们对接的设计、产品的输出也各不相同,业务本身也很难能让AI完全理解,这些问题在一人项目里基本都是不存在的。 企业内部一个运转了十年的项目想要通过vibe coding去让AI做牛马干活很难,你搭建的文件系统来帮助AI更好的了解项目也基本不可能,因为10个人的团队,每个月代码变动量极大,你的文档更新是跟不上的,如果不能整个团队一起维护这套文档系统,那靠一个人是维护不过来的。 所以这个时代的AI Coding红利,就是更倾向于个人或者小团队的快速发展,在企业内推vibe coding还得再等几年,或者永远也等不到。
0
0
0
也树
5月前
有点泪目了,决赛日冲!
3
0
0