陈锴杰KJ的个人主页

即刻App年轻人的同好社区

下载

App内打开

陈锴杰KJ

40关注1k被关注2夸夸

AI 不是生产力革命，是关系革命 | building Macaron...

置顶

陈锴杰KJ

5月前

一个站在产品和技术十字路口的 AI 创业者

曾经创立 midreal.ai，一个百万用户的互动内容平台
也玩过 b 站，space.bilibili.com

目前正在做一场关于【关系】的实验
AI 与人的关系

希望能在这里记录实验的小小进展
以及过程中有趣的感悟～

54 2214

陈锴杰KJ

15天前

v3.2 真的好强啊
Deepseek 是不是又要创造奇迹了？
可能是给 ChatGPT 最好的生日礼物 🎁

15 20

陈锴杰KJ

19天前

听了 Ilya 的新采访，很多感触

2012 - 2020 是 Research 的时代
但是 2020 - 2025 是 Scaling 的时代

因为大家发现，只要不停扩大规模，就有更好的效果，这对公司来说是一个特别有确定性的投资，所以大家比拼的就是如何加数据、加算力，做更大规模的模型

但 Ilya 说，这条路差不多走到头了

Pre-train 模型越来越趋同
如果我们想要更强的智能，就需要 RL
而且是在不同的测试环境中的 RL

这就是他说的：different people come up with different RL training

产品公司自己拥有 RL 模型的时代，或许真的来了

11 10

陈锴杰KJ

27天前

新的时代，界面开始流动，应用变得短暂
Gemini 3 这次发布，其实真正让我震撼的不是模型能力，而是 AI 终于摆脱了“只能输出文字”这件事。

大家都看到了这次前端生成的改进有多快，有多好。

过去几年，我们和大模型的交互方式，几乎一直被困在一个小小的文字窗口里，问问题，给一段话，再问，再给一段话，总有一种管中窥豹的不畅感。

很多事情，文字真的不是最好的界面，比如你不会用聊天的方式来记体重，或者点外卖。

我们第一次看到了动态 UI 的可能，就是在你等待的几秒钟内，根据你的意图，把 UI 生成出来。

我们正在从聊天时代，进入新的体验时代。

界面开始流动
应用变得短暂
AI 变成一个操作系统

这是 Gemini 3 最大的启发

15 51

陈锴杰KJ

27天前

Gemini 3 Pro 还挺帅的

00:09

9 10

陈锴杰KJ

1月前

大模型时代，技术型团队最容易踩的 6 个陷阱
1️⃣ 过度迷恋自动化，其实模板就能解决问题
很多团队觉得“能自动化就必须自动化”，但大多数生成类需求只要几十个高质量模板就能覆盖。自动化不是价值本身，稳定和可控才是。

2️⃣ 误以为技术最优解就是产品最优解
技术方案越漂亮，往往越远离用户真正的路径。用户只要“最快达到结果”，不是“最复杂的算法”。

3️⃣ 忽视用户选择的价值
有些问题模型永远猜不准，但给用户一个两秒钟的简单选择就能解决。用户并不排斥选择，只排斥复杂和麻烦的选择。

4️⃣ 把能做的当成值得做的
AI 能力边界太宽，于是团队容易把各种可能性都做一遍。但产品价值来自用户高频需求，而不是技术可行性。

5️⃣ 用更好的模型解决更差的产品逻辑
体验不稳定，很多团队第一反应是“换更大的模型”。但真正的问题往往是输入没结构、步骤没拆清、约束不够。

6️⃣ 过分相信“智能会解决一切”，忽视用户的控制欲
端到端的 Agent 看起来很酷，但用户往往需要自己的输入来建立“成果归属感”。AI 可以自动，但用户必须被“参与”。

11 00

陈锴杰KJ

1月前

最近在思考 AI 产品的意图识别
一个新的感受是：用户的所有操作（包括不操作），其实都可以是 AI 判断意图的输入

最明显的是点赞、点踩
但其实用户在聊天里输入的每一个词，也都带着意图信号，虽然逐词判断意图很贵，但在某些场景（比如 youware 的自动补全），这是合理的设计

再比如，上传一张图片和拍一张照片，其实是两种完全不同的意图：拍照意味着你在现场，更可能是想问「这是什么」或翻译内容。上传则更像是想 P 图

在马卡龙里，我们有很多小应用
用户每次选择什么、怎么用，其实都在告诉我们他的意图

在我看来，一个 AI 产品的本质就是：不断用用户的每一次操作去判断意图，再通过 tool call，匹配最合适的解决方案，满足需求

意图判断，是所有 AI 产品的底层逻辑

7 12

陈锴杰KJ

1月前

Cursor 是一家被严重低估的公司
目前估值 100 亿，但年收入已经 5 亿，最近还推出了自己的模型 Composer。
因为能在真实产品中自己做强化学习，我相信 Cursor 一定会在写代码的任务上超过世界上所有模型，而且不会太久。
大家都意识到了，有真实用户的生产环境，才是提升模型智能最关键的要素。
Cursor 甚至已经成了硅谷最难进的公司，比 OpenAI 和 Anthropic 还要难。
当 AI 泡沫破裂之后，Cursor 不会是裸泳的那个，反而是能穿越周期的。
因为人们永远要写代码（至少这十年吧），而 Cursor 会是最好的写代码工具。

14 12

陈锴杰KJ

1月前

AI 解放的想象力是无上限的
参加即梦 AI 的青年导演计划，看了 7 支短片，很震撼。很多人看哭了。
想到早年人类没有车、船、飞机，移动非常困难，进京赶考的时间以月度量，人类的社会经济活动都受到移动能力的限制，但当移动变得非常容易，24 小时就能环球一圈的时候，人类便开始繁荣。
想法的表达，也曾经是如此苦难，特别是视频。好的故事，仍然需要巨大资源才能产生，直到 AI 的诞生，这就像人类第一次有“坐飞机”的便捷，这种前所未有的简单，或许会带来故事的新一轮繁荣。
期待未来更多更精彩的故事。

15 00

陈锴杰KJ

1月前

RL 有三个关键点，看谁能赢吧
1. Reasoning（推理）：AI 决定「下一步怎么做」的能力，目前 OpenAI 最强，方法基本定型。

2. Tool Use（工具调用）：AI 调用外部工具增强自己的能力，Anthropic表现最好，已有初步范式。

3. Memory（持续记忆）：AI 持续学习、更新自己的经验，目前业界无人攻下，最有想象空间。

不知道谁能三个都做到，谁能赢？应用公司有机会吗？

4 00

陈锴杰KJ

1月前

Anthropic 可能是最懂 tool call 的公司
最近看到 Anthropic 在 Tool Call 上的新思考，很受启发

Anthropic 一直被公认为大模型公司里，把「Tool Call」做得最好的。最近他们又提出了一个重要概念：MCP with Code Execution

其实他们说的是 Code Execution with MCP，但我觉得反过来更对，因为过去的 Tool Call 有两个典型痛点：

1. 工具定义越来越多，一次性加载占用大量上下文，成本直线上升
2. 大量中间数据在模型间反复传递，极其低效且浪费资源

Anthropic 提出的解决方案，核心思想是 Progressive Disclosure。工具和数据不是一次性全部加载，而是用代码动态、按需逐层加载。模型用多少就加载多少，避免上下文浪费，能效率提升。

其实这也是我们平时一直在用的 context management 思路。上下文不是越多越好，而是要精准，渐进式释放。Anthropic 通过「代码执行」的形式，把这种上下文优化思路做得更通用了。

值得在产品里，再思考和实践一下

10 03