即刻App年轻人的同好社区
下载
App内打开
池建强
36关注8k被关注9夸夸
「MacTalk」出品人
墨问西东创始人,极客时间创始人,目前创业。做产品、写作、拍照片、做播客。 产品:https://mowen.cn
池建强
2天前
以前有人不写代码 Vibe 出一个有点意思的产品/App/Web,那可是一件 big thing,不仅人牛,AI 也让人赞叹。

现在呢,打完招呼后 A 有点腼腆的说,我这里有个 App,你用用呗,提提建议啥的。B 说好的,扭捏了一会说,我这有个网站你也试试,这几天闲着没事随手搓的,有啥问题随时告诉我啊。

产品太多用户太少。介么个情况。
77
池建强
4天前
Codex + GPT 5.5 Magic Moment

在老家用 CC + Opus 4.6 调一个 import 订阅源里文章更新日期不对的问题,将近 200 个源,只有两个源不对,问题多多少少有点复杂,让 CC 改了两遍,告诉我改对了,其实根本没对。昨天回到北京,CC 额度快没了,Codex 额度 5 5 号满血恢复,于是让 Codex 修复,人家一次搞定了,还顺手把旧数据都给我修了……

昨天晚上又新开了一个项目,尝试一种新的笔记记录方式,让 Codex 做了个界面,感觉就是无设计的那种风格。于是我让 Claude Code 给优化了一下设计,一下变得现代了。

目前就我自己的使用体感,Codex bug 的能力、处理深度逻辑的能力,似乎比 Claude Code 强(GPT 5.5 VC Opus4.6,4.7 烧太快木法用)。但 CC 自家模型的设计能力吊打 Codex,不知道咋回事,可能是 Opus 做了太多编程的工作,养成了良好的设计品味。

目前这俩工具是互补的,都得花钱……
00
池建强
5天前
Codex + GPT 5.5 Magic Moment

在老家用 CC + Opus 4.6 调一个 import 订阅源里文章更新日期不对的问题,将近 200 个源,只有两个源不对,问题多多少少有点复杂,让 CC 改了两遍,告诉我改对了,其实根本没对。昨天回到北京,CC 额度快没了,Codex 额度 5 5 号满血恢复,于是让 Codex 修复,人家一次搞定了,还顺手把旧数据都给我修了……

昨天晚上又新开了一个项目,尝试一种新的笔记记录方式,让 Codex 做了个界面,感觉就是无设计的那种风格。于是我让 Claude Code 给优化了一下设计,一下变得现代了。

目前就我自己的使用体感,Codex bug 的能力、处理深度逻辑的能力,似乎比 Claude Code 强(GPT 5.5 VC Opus4.6,4.7 烧太快木法用)。但 CC 自家模型的设计能力吊打 Codex,不知道咋回事,可能是 Opus 做了太多编程的工作,养成了良好的设计品味。

目前这俩工具是互补的,都得花钱……

132 | Codex 正在经历 ChatGPT 时刻,双强...

2026年5月6日
00
池建强
9天前
看起来 Karpathy 给出了通向 AI 未来的三条线索

今天看了 Andrej Karpathy 的一篇文章,写的是他的一次炉边谈话的要点。我觉得他给出了三条线索,还挺有启发的。

以下是我整理的中文版,分享给读者:

我想强调的第一个线索是,LLM 的意义远不止加速已有事物(比如编程)。这是三个新领域的例子:

1、menugen(应该是 AK 之前做的一个 App):一个可以被 LLM 完全吞没的应用,不需要任何经典代码:输入一张图片,输出也是一张图片,LLM 可以原生完成这件事,根本不需要 App。

2、用 .md 技能代替 .sh 脚本:为什么还要写一个复杂的 Software 1.0 bash 脚本来安装某个软件?直接用文字描述安装过程,告诉你的 LLM "把这个给它看"就行了。LLM 是一个高级的英语解释器,可以智能地适配你的安装环境、即时调试一切等等。

3、LLM 知识库:这是一个用经典代码不可能实现的例子,因为它是针对非结构化数据(知识)——来自任意来源、任意格式,包括纯文本文章等——的计算。(之前 AK 基于 md + 图片 + wiki + llm 构建知识库的理论和实践)

我之所以强调这些,是因为在每一次新的范式变革中显而易见的东西往往都是在加速或改进已有的事物,但实际上我们看到了上面这些例子,你会发现,有些东西根本不该存在了(1、2),有些在以前则根本不可能实现(3)。

第二个(持续进行中的)线索是试图解释 LLM 能力"参差不齐"(jaggedness)的模式。为什么同一个产物可以一边连贯地重构一个 10 万行代码库,一边又让你走去洗车行洗车(被人类嘲笑的步行洗车问题)?

我之前写过这源于领域的可验证性,这里我进一步补充说这还与经济因素有关,因为收入/TAM 决定了前沿实验室选择在 RL 阶段打包进训练数据分布中的内容。你要么在数据分布中(在 RL 电路的轨道上)飞速前进,要么在丛林里用砍刀开路。相对而言,还是那句话。

我对目前这个解释还不完全满意,但这是一个持续的挑战——如果你想实际利用 LLM 的力量同时避开它们的陷阱,就需要建立一个对 LLM 能力的准确心智模型。这也引出了……

最后一个线索是 Agent 原生经济。产品和服务如何分解为传感器、执行器和逻辑(分散在 1.0/2.0/3.0 计算范式中),我们如何让信息对 LLM 最大化地清晰可读,快速兴起的 Agent 工程及其技能组合,一些相关的招聘实践等等,甚至可能涉及完全由神经网络处理大部分计算、而由(经典)CPU 作为协处理器辅助的梦想/暗示。

原文链接:x.com

2026年5月1日
20
池建强
26天前
3 月份过完,2026 年的一季度结束了。回看这三个月,我感觉大模型的发展,尤其是 Coding Agent 领域的进展,几乎超过了 2025 年的全年。

Coding Agent 毫无疑问是最大的 AI 明星。AI Chat 起步,到 Coding Agent 开始大踏步发展,因为这些都有强回路反馈,并且是 AI 最擅长的能力。

Coding Agent 同时是 Token 消耗大户,成果直接帮助个人和企业提升效率和能力,甚至,很多 AI 开始自己开发自己,也就是自我进化,TRAE SOLO,基本上自己开发出了 SOLO 独立端。Anthropic 一个月发版几十次,这在非 AI 时代是不可能的。A 厂现在太嚣张了。

如果我是国内互联大厂,2026 需下重注,大力加强基模的 Coding 能力。
00
池建强
2月前
最近大厂的 AI 产品进展真是挺快的,开发节奏颇为疯狂。就我知道的,一个大厂开始以半天计发布产品新功能,另一个大厂为了发布新产品,估计彻夜都在修 bug。有大厂上周夜里 12 点还在解决我提的一个 bug 😂,罪过啊。

这三个厂就是 BAT,字节阿里腾讯,也是中国互联网前三了。

想一想我们这创业公司也太不努力了啊……但再一想,好像努力也没啥用,还是慢慢做吧,享受时间和大厂带来的成果。
02
池建强
3月前
春节长假里两个成果 (˶╹ꇴ╹˶)🧨
20
池建强
3月前
听零零后的劝,用这款 AI 工具做攻略

春节出游,最怕的不是人山人海,而是“攻略过载”。我们在社交媒体上刷过上百篇“必打卡”与“避雷针”,拼凑一份能真正落地的行程依然艰难:几点出发最顺路?哪家好吃的馆子不排队?晚上回酒店歇脚还是去逛夜市?这些琐碎的决策细节,往往比旅行本身更消耗人的精力。

作为一名长期创造和观察 AI 产品的创业者加产品经理,却在今年春节被零零后的女儿教育了。她向我安利了小红书推出的独立 AI 应用——“点点”。在深度体验了其新上线的“攻略模式”后,我发现这不仅仅是一个简单的聊天机器人,它更像是一个专门针对生活场景的“深度研究员(Deep Research)”。

它最核心的价值,在于将小红书里那些散落、感性、甚至充满情绪的真人经验,通过 AI 的逻辑进行压缩与对齐,最终生成一份图文并茂、可导航、可执行的“行程稿”。在这篇文章中,我将分享这款工具如何通过“真人经验密度”找到产品突破口,以及它如何把信息从单纯的“内容”转化为真正的“行动”。
02
池建强
3月前
今天还看到了一个非常激进的观点,来自 Yuchen Jin。他说,任何没有尝试过使用人工智能进行编程的科技公司 CEO 都错过了机会。谷歌的谢尔盖在编程,Meta 的扎克伯格也在编程,Shopify 的托比在编程。如果你没有亲身感受到人工智能发展的速度,你就无法预见未来。你很可能会被那些预见到未来的人颠覆。

对于最近沉迷 vibe 无法自拔的我来说,可太喜欢这句话了。AI 的变化现在是指数级的,人的认知大部分时候是线性的。不亲自下场,就会本能低估这个速度。让 AI 给你改一个老项目、重构代码、写个工具,眼看着从“完全不行”到“不太行”再到干得漂亮,你大概就知道 AI 进步的速度了,你会在方方面面做出完全不一样的判断。
02
池建强
3月前
minimax m2.5,编程真是顶,比 opus 4.6 低一点点,和我的体感一致 😄 而且是真特么便宜啊
45