即刻App年轻人的同好社区
下载
App内打开
benn
518关注8k被关注17夸夸
Make good new things.
前腾讯高级工程师,独立作品:Chatbox[被收购]
benn
12:20
数不清现在有多少种 Claude Code/Codex 套壳应用,各有各的特色哈哈哈👾🎃
32
benn
1天前
总是会很期待DeepSeek的每一次更新

于冬琪: 看到DeepSeek团队最新的论文,才理解DeepSeek为什么强大。 因为DeepSeek可能找到了一条AI进化的坐标轴。 只要自己不断沿着坐标轴前进,就能实现不断的成功。 有个意外的发现。 豆包过去几个月,又拿回了AI应用日活第一的位置。 然而,我最近问了不少内容人,我如果要用AI辅助长文写作,哪个AI工具会更好?内容人们最经常给出的答案是: 首选Claude、其次GPT,国产模型则首推DeepSeek。 绝不能用豆包。 为什么会这样呢? 我自己直观的感受是:长文写作,更需要保障对信息输入的高质量理解、和逻辑能力。这两点正好是DeepSeek的特长。 回想我第一次用到DeepSeek时,惊艳到我的,估计和经验到很多人的点类似,是DeepSeek的“深度思考”。 此前用AI产品,一直困扰我的问题是,AI有幻觉,我不知道结果能不能信,也就不能放心使用。但是,当DeepSeek展示出模型的思考逻辑后,不仅这个逻辑对人会有启发,更让我有了检查模型结果的方式,容易检查、就使得模型有了更可被相信的基础。 展示逻辑,是AI对话体验上的突破。 DeepSeek也靠着推理模块的加入,实现了更强的逻辑和信息理解能力。 这是技术创新的力量。 不过,我此前一直也有个朴素的观点: 科技创新是偶然的,一个企业可能有一次选对了技术路线、实现了突破。 但是,谁都不能保证其他技术路线的判断上,他也能赌对。 对于一个规模不大的公司来说,技术突破注定是需要看运气的、偶然才能出现的现象。 直到这几天,看到了DeepSeek团队发布的新论文,和对这个新论文的解读,我才意识到,有可能DeepSeek还真能实现持续不断的突破,因为他们很可能是找到了一个AI进化的坐标轴。 他们在最新的论文中,为大模型增加了一个新的要素——“概念”。 什么意思呢? 最早的大模型,其实是在基于语言的上下文,不断推演下一个字应该是什么。 这个时候,比如“英国女王伊丽莎白”,在人类的理解中,是一个完整的概念,我们因为知道这个概念,直接调用就好,但是在大模型眼中,这8个字需要被重新产出一遍。 对人类大量概念的一遍遍重新理解和推演,极大的浪费了大模型的能量和效率,也难免使得大模型的产出更容易出问题。 于是,DeepSeek决定为大模型建立一个概念库:在库里面的概念,可以作为整体,直接被调用。 我忽然发现, 这个概念的引入,与25年初,DeepSeek在大模型中,引入了“逻辑推理”模块,本质上是同一个思路。 此前的大模型,更像是对人类对话的暴力破解——ChatGPT证明了只要算力够大、数据量够大,人类的对话是可以被暴力破解的。 如果我们将在一次对话中找到高质量回答的过程,类比于走迷宫,那么此前的暴力破解大模型,解题的思路是:我只要能穷尽所有可能性,总能找到对的路。 随着走迷宫经验增加,大模型也能学习出一些走迷宫的套路,效率也能渐渐提升。 但是, 其实从来就不必尝试所有的道路的。 这些走迷宫的套路,也无需大模型自己慢慢摸索。 在人类的思考中,其实早就有一些规则,能够直接告诉我们“哪些路肯定不靠谱、根本不用考虑,只有几个大概率正确的方向,只需要尝试这几个方向”。 “逻辑推理”和“建立概念”,就是排除错误方向、使得模型可以效率更高、也可以走得更远的工具。 而这两个工具、或者说概念的发现,是来自于对人脑理解世界、思考问题过程的还原和研究。 人脑有一个独特的优势: 人脑每秒钟接触到的信息是10G,但是,人脑会识别和保留的只有其中的10bit。 因为需要长期储存和处理的信息量被大大简化,人脑的能量消耗才得以大大降低、很多关联起更多概念和维度的深度思考也才能变为现实。 可以说: DeepSeek团队,是在拆解人脑的思考和理解世界的过程,将其中有价值的工具和模式,赋予大模型。 如果这条路是成立的,那么DeepSeek就找到了一个支持继续持续迭代的坐标轴,就很有可能实现持续不断的技术突破。 每一个不断实现技术突破的企业,在那段时间,都找到了自己的坐标轴。 比如: 苹果,找到的坐标轴,是让交互更符合人的直觉,用更接近自然动作的交互方式、替代需要学习的更机械的交互方式。 因此,苹果从鼠标、到iPhone、再到VR,推出了一代代划时代的产品。 华为,找到的坐标轴,是让通信频率更高、能够有更大的带宽传输信息,过程中主要面临的难题,就是信号干扰带来的数学问题。 因此,从3G、到4G再到5G。 这个坐标轴,成为了驱动DeepSeek前进的主要方向。 对比之下,豆包更多时间是在追求数据。 当然,在堆积数据量的逻辑里,豆包也在讲一个故事:如果有更多的人使用豆包,豆包拥有的数据量更大,更大数据量会带来更强的服务能力。 这个故事,乍一看符合逻辑。 因此,豆包在很长时间里,一直有着行业最高的投放预算。 靠着大投放预算,豆包实现了最高的下载、和很长时间里最高的日活。 可是,这些日活和数据,真的能够转化成服务能力吗? 未必。 因为最容易获取的、最容易留住的,很多是那些要求更低的用户。 我没有统计数据, 不过,在体感中,我会遇到很多下沉市场的用户更爱用豆包。 残酷的说,服务他们、留住他们,比起服务那些更需要AI完成复杂任务的白领,是更简单的。 我也会遇到很多小朋友爱用豆包, 因为豆包会不断的称赞他们、捧臭脚。 很多小朋友就被夸夸得无法自拔。 但是,更有自主意识的人,反而会因此反感豆包,觉得“豆包总在试图讨好我”。 低要求的用户,总是更容易获取、也更容易满足的。 但是,低要求的用户,不会驱动产品,形成能满足复杂需求的能力。 这是追求数据增长,常常会掉进去的坑。 对比之下,DeepSeek的团队,主要驱动力则不是数据。 更像是大家有一个共同的信仰:让AGI变成现实。 基于此,团队找到了一个前进的方向:从人脑的思考、理解世界的模式中,寻找宝藏,嫁接到AI上。 他们精力有限,因此将主要的精力,几乎全部投向了这个方向。 于是, 当豆包在加功能时,DeepSeek在研究新技术。 当豆包看到自己不再是日活和下载量第一时,豆包会努力做增长。 当DeepSeek不再是日活和下载量第一时,DeepSeek好像对此毫不在意,还是在研究新技术。 像这次DeepSeek发布的论文, 在我的观感中,为大模型增加“概念”,在使用时的感受,远不像增加“逻辑”那么强烈。 这个更新,并不足以让DeepSeek重新拿回日活第一的位置。 但是,我相信DeepSeek并不在乎。 在他们眼中,改进技术、提高大模型的理解能力和数据处理能力,是更重要的事儿。 实话说,在这一轮的大模型竞赛中,我也不知道最终谁会胜出。 但是,如果有最终的胜利者。 比起豆包,情感上,我会更希望胜利者是DeepSeek。

00
benn
2天前
我真实体验 claude cowork 之后,觉得它当前体验还不太好,整体上和 antigravity agent manager 差不多,但非常期待它的后续更新。

1. 整个使用流程里有非常多的界面 bug 和阻断
2. 产品定位上对非技术背景的用户还不够友好,比如暴露了太多的技术细节、产品整体还不够简单易用
3. 似乎还没有 workspace 隔离的概念,多个任务是混在同一个工作路径的,任务并发执行时容易造成互相干扰
4. 它内置的 sanbox 虚拟环境虽然提供了安全性,但严重增加了用户理解成本,也阻止了很多用户自然想到的用法(例如修系统)

整体上我认为当前 claude cowork 不是一个非常友好的 to C 软件,对于非技术背景的用户来说无法开箱即用,有非常多需要改进的地方,但我非常期待它的后续版本更新。

另一个有趣的启发是它内置了 sanbox(技术选型符合我的预期),但同时也让我觉得 sanbox 在早期阶段可能不是必须的。比如我现在最想关闭的功能就是这个 sanbox,因为它的存在反而阻碍了大量本地任务场景。
14
benn
3天前
我也很喜欢manus,一直都觉得产品很棒。但总觉得相比claude code少了很多“可玩性”,例如我没有办法像skills+mcp的方式来改变manus的行为。

我觉得真正通用工具应该有两个特征:简单易上手,可以被不同背景的人“折腾”成最合适的样子。

一个例子是电子表格:初中生一打开就会用(简单上手),同时企业里采购部门和财务部门用他们自己积累的表格资产开展更复杂的工作(“可玩性”)

OrangeCLK: Claude Cowork 用的是用户自己的电脑,感觉 Manus 团队说得有道理,用用户自己的电脑可能有一些问题,比如安全性、是否影响用户使用自己电脑的体验、要运行任务还得开机等等,不如用云端的沙盒。如果这样的话,形态其实就是 Manus 了。

20
benn
3天前
一直都觉得claude code更接近我心中真正通用 agent 的样子。
所以这是新的chatgpt时刻吗?
34
benn
3天前
其实和 claude code 最搭配的工具是 cron,这样你就获得了一个在服务器上长时间运行、智能处理某类事务的 agent。
这是一种非常有趣的复利:某天你一时兴起交给cc一件事情,然后它会在之后的日子不断给你带来惊喜。
42
benn
9天前
如果大家要备份 ~/.claude,可以使用这个 .gitignore 来白名单选择需要同步到 git 的文件
00
benn
12天前
我对咖啡豆的唯一判断标准是:喝完后我的肚子会难受多久?
我不懂也不喝咖啡,但我发现越贵的咖啡肚子难受的时间越久,但最便宜的雀巢速溶咖啡却没啥反应。
60
benn
17天前
Manus 总是给我很多信心:一家没有自己模型的 AI 应用公司,他们的功能就是比 OpenAI、Gemini、Claude 原厂功能都更好用,而且一直好用,甚至还有种越来越好用、差距拉大的感觉……

benn: 我的浏览器有4个固定的tabs,每个问题/任务都给所有AI发一遍,manus总是经常给我惊喜。

00
benn
18天前
记得要备份 ~/.claude 哦,不然会哭泣
20