AI 产品的效果取决于模型的智能,模型的智能取决于数据的质量。而 Agent 产品和 Chatbot 类产品的区别之一,就是用户使用数据对模型的智能提升不再没有作用了。
在 Chatbot 时代,用户数据可能确实作用有限。2025 年初的时候,MiniMax 的闫俊杰还说:「更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型,大部分用户的query其实没有模型自己模拟得好」。这可能是因为这类产品背后模型的智能提升,主要依赖于互联网存量数据的预训练。Chatbot的交互产生的多为同质化的闲聊、浅层问答或已经被互联网语料充分覆盖的知识检索,这些数据缺乏增量的信息熵。
但 Agent 时代的不同点在于,Agent 与人、与世界的交互所依赖的数据,是过去人类互联网世界从未有过的。
与Chatbot不同,Agent时能够进行复杂的因果推理、任务拆解、规划、调用外部工具(API)并在真实或模拟环境中执行多步任务。这种智能体与世界交互产生的数据被称为“轨迹数据”,它不仅包含了最终的结果,更记录了智能体在每一步的观察、内部推理(思考过程)、工具调用逻辑以及对环境反馈的自我纠错,而这样的数据对现在模型智能的提升至关重要,二者是相辅相成的关系。
举个例子:在过去的互联网世界,没有多少人用 HTML 做 PPT。所以,裸模型用 HTML 画 PPT 的效果就是会很差,但它在逐渐变好。这是为什么?
1. 因为有这类产品出现,有用户在实际使用,专业职场人士每年因排版PPT耗费数以亿计的小时,这一痛点催生了大量的早期采用者。
2. 有人在调教,有反馈循环:从用户反馈到应用厂商,再反馈到模型厂商,最终内化到一代又一代的模型里。
3. 这种“左脚踩右脚”的螺旋上升,使得用 HTML 画 PPT 的效果越来越好。
再比如,OpenClaw 的记忆系统其实饱受诟病,用一堆 MD 文档来承载,看起来好像没那么高级,也许我们可以用另外的方式优化它的记忆系统?
但不好意思,用 MD 文档来承载的这种方式,可能已经是未来了。因为从 Claude Code 开始,用 MD 文档来承载记忆就在不断地被模型使用、被训进模型,它只会越来越好,形成对其他方式的马太效应。
如果从头再来,它有可能不是最好的方式。但就像键盘上的字母排布,一旦已经决定了,即便不是最优解也很难更改了,人类也已经回不到没有 OpenClaw 和 Claude Code 的世界了。
这就是应用厂商的优势。可能不像使用 MD 文件这么广泛,但通过定义一种独特的零方数据,就像定义了了行业标准。更早获得高信号上下文并沉淀成 benchmark,就有机会在垂直领域始终保持最好的效果。比如:
- 定义一种独特的界面;(姚顺雨在
@张小珺 的播客里,包括 a16z 在《State of Consumer AI 2025》里面也都提到过)
- 定义一种独特的 AI 与人类、与世界交互的方式;
- 收集一种人类世界从未被大规模收集过的上下文。(现在很多 AI 硬件)
在 Agent 时代,应用厂商也拥有了对模型厂商的话语权和护城河。这种话语权源于应用厂商能比模型厂商领先一步,收集到一些独特的数据,虽然这些数据迟早会被模型厂商拿到,迟早会扩散到整个互联网世界,但只要能持续领先三个月,增量的进步就可以转化为存量的持久优势。领先一步当然不算厉害,但如果能总是领先一步呢?
在 Agent 的时代,做一艘不被模型智能水位上升而淹没的船,可能性其实更高了。