即刻App年轻人的同好社区
下载
App内打开
陈锴杰KJ
40关注1k被关注2夸夸
AI 不是生产力革命,是关系革命 | building Macaron...
置顶
陈锴杰KJ
5月前
一个站在产品和技术十字路口的 AI 创业者

曾经创立 midreal.ai,一个百万用户的互动内容平台
也玩过 b 站,space.bilibili.com

目前正在做一场关于【关系】的实验
AI 与人的关系

希望能在这里记录实验的小小进展
以及过程中有趣的感悟~
2214
陈锴杰KJ
15天前
v3.2 真的好强啊
Deepseek 是不是又要创造奇迹了?
可能是给 ChatGPT 最好的生日礼物 🎁
20
陈锴杰KJ
19天前
听了 Ilya 的新采访,很多感触

2012 - 2020 Research 的时代
但是 2020 - 2025 Scaling 的时代

因为大家发现,只要不停扩大规模,就有更好的效果,这对公司来说是一个特别有确定性的投资,所以大家比拼的就是如何加数据、加算力,做更大规模的模型

Ilya 说,这条路差不多走到头了

Pre-train 模型越来越趋同
如果我们想要更强的智能,就需要 RL
而且是在不同的测试环境中的 RL

这就是他说的:different people come up with different RL training

产品公司自己拥有 RL 模型的时代,或许真的来了
10
陈锴杰KJ
27天前
新的时代,界面开始流动,应用变得短暂
Gemini 3 这次发布,其实真正让我震撼的不是模型能力,而是 AI 终于摆脱了“只能输出文字”这件事。

大家都看到了这次前端生成的改进有多快,有多好。

过去几年,我们和大模型的交互方式,几乎一直被困在一个小小的文字窗口里,问问题,给一段话,再问,再给一段话,总有一种管中窥豹的不畅感。

很多事情,文字真的不是最好的界面,比如你不会用聊天的方式来记体重,或者点外卖。

我们第一次看到了动态 UI 的可能,就是在你等待的几秒钟内,根据你的意图,把 UI 生成出来。

我们正在从聊天时代,进入新的体验时代。

界面开始流动
应用变得短暂
AI 变成一个操作系统

这是 Gemini 3 最大的启发
51
陈锴杰KJ
27天前
Gemini 3 Pro 还挺帅的
00:09
10
陈锴杰KJ
1月前
大模型时代,技术型团队最容易踩的 6 个陷阱
1️⃣ 过度迷恋自动化,其实模板就能解决问题
很多团队觉得“能自动化就必须自动化”,但大多数生成类需求只要几十个高质量模板就能覆盖。自动化不是价值本身,稳定和可控才是。

2️⃣ 误以为技术最优解就是产品最优解
技术方案越漂亮,往往越远离用户真正的路径。用户只要“最快达到结果”,不是“最复杂的算法”。

3️⃣ 忽视用户选择的价值
有些问题模型永远猜不准,但给用户一个两秒钟的简单选择就能解决。用户并不排斥选择,只排斥复杂和麻烦的选择。

4️⃣ 把能做的当成值得做的
AI 能力边界太宽,于是团队容易把各种可能性都做一遍。但产品价值来自用户高频需求,而不是技术可行性。

5️⃣ 用更好的模型解决更差的产品逻辑
体验不稳定,很多团队第一反应是“换更大的模型”。但真正的问题往往是输入没结构、步骤没拆清、约束不够。

6️⃣ 过分相信“智能会解决一切”,忽视用户的控制欲
端到端的 Agent 看起来很酷,但用户往往需要自己的输入来建立“成果归属感”。AI 可以自动,但用户必须被“参与”。
00
陈锴杰KJ
1月前
最近在思考 AI 产品的意图识别
一个新的感受是:用户的所有操作(包括不操作),其实都可以是 AI 判断意图的输入

最明显的是点赞、点踩
但其实用户在聊天里输入的每一个词,也都带着意图信号,虽然逐词判断意图很贵,但在某些场景(比如 youware 的自动补全),这是合理的设计

再比如,上传一张图片和拍一张照片,其实是两种完全不同的意图:拍照意味着你在现场,更可能是想问「这是什么」或翻译内容。上传则更像是想 P

在马卡龙里,我们有很多小应用
用户每次选择什么、怎么用,其实都在告诉我们他的意图

在我看来,一个 AI 产品的本质就是:不断用用户的每一次操作去判断意图,再通过 tool call,匹配最合适的解决方案,满足需求

意图判断,是所有 AI 产品的底层逻辑
12
陈锴杰KJ
1月前
Cursor 是一家被严重低估的公司
目前估值 100 亿,但年收入已经 5 亿,最近还推出了自己的模型 Composer。
因为能在真实产品中自己做强化学习,我相信 Cursor 一定会在写代码的任务上超过世界上所有模型,而且不会太久。
大家都意识到了,有真实用户的生产环境,才是提升模型智能最关键的要素。
Cursor 甚至已经成了硅谷最难进的公司,比 OpenAI Anthropic 还要难。
AI 泡沫破裂之后,Cursor 不会是裸泳的那个,反而是能穿越周期的。
因为人们永远要写代码(至少这十年吧),而 Cursor 会是最好的写代码工具。
12
陈锴杰KJ
1月前
AI 解放的想象力是无上限的
参加即梦 AI 的青年导演计划,看了 7 支短片,很震撼。很多人看哭了。
想到早年人类没有车、船、飞机,移动非常困难,进京赶考的时间以月度量,人类的社会经济活动都受到移动能力的限制,但当移动变得非常容易,24 小时就能环球一圈的时候,人类便开始繁荣。
想法的表达,也曾经是如此苦难,特别是视频。好的故事,仍然需要巨大资源才能产生,直到 AI 的诞生,这就像人类第一次有“坐飞机”的便捷,这种前所未有的简单,或许会带来故事的新一轮繁荣。
期待未来更多更精彩的故事。
00
陈锴杰KJ
1月前
RL 有三个关键点,看谁能赢吧
1. Reasoning(推理):AI 决定「下一步怎么做」的能力,目前 OpenAI 最强,方法基本定型。

2. Tool Use(工具调用):AI 调用外部工具增强自己的能力,Anthropic表现最好,已有初步范式。

3. Memory(持续记忆):AI 持续学习、更新自己的经验,目前业界无人攻下,最有想象空间。

不知道谁能三个都做到,谁能赢?应用公司有机会吗?
00
陈锴杰KJ
1月前
Anthropic 可能是最懂 tool call 的公司
最近看到 Anthropic Tool Call 上的新思考,很受启发

Anthropic 一直被公认为大模型公司里,把「Tool Call」做得最好的。最近他们又提出了一个重要概念:MCP with Code Execution

其实他们说的是 Code Execution with MCP,但我觉得反过来更对,因为过去的 Tool Call 有两个典型痛点:

1. 工具定义越来越多,一次性加载占用大量上下文,成本直线上升
2. 大量中间数据在模型间反复传递,极其低效且浪费资源

Anthropic 提出的解决方案,核心思想是 Progressive Disclosure。工具和数据不是一次性全部加载,而是用代码动态、按需逐层加载。模型用多少就加载多少,避免上下文浪费,能效率提升。

其实这也是我们平时一直在用的 context management 思路。上下文不是越多越好,而是要精准,渐进式释放。Anthropic 通过「代码执行」的形式,把这种上下文优化思路做得更通用了。

值得在产品里,再思考和实践一下
03