即刻App年轻人的同好社区
下载
App内打开
程玉
36关注1被关注0夸夸
程玉
3月前

AI产品黄叔: 教了两个月Claude Code 自以为挺懂的 结果发现我就是个弟弟 他叫李默,做AI出海营销 人很腼腆,但一开口全是核弹级认知 先是给我演示了飞书应用 把多维表格当数据库 一键采集、改写、发布到小红书公众号 扫个码就发出去了,还不封号 我说这怎么做到的? 他说官方小程序,合规通道 然后又演示了 Obsidian + Claude Skills 一个斜杠命令下去 自动抓文章、改写、生图、排版 三个风格并行跑,选最好的发 特别丝滑 但真正让我破防的是第三趴 他说:你不用打开终端,也能让 Claude Code 干活 我当时脑子嗡的一下 他演示了 Claude Agent SDK 就是把 Claude Code 包装成 API 可以定时跑、可以放云端、可以无感运行 还可以并行跑十几个任务 我说这不就是带自主判断能力的 N8N 吗? 他说:比 N8N 稳,报错了会自己改代码重跑 我彻底沉默了 说实话,我教 Claude Code 也有一阵子了 一直以为自己还行 Skills、MCP、Sub Agents 都摸过 但昨天才知道 我连 SDK 这层都没碰过 更别说 Tools、Skills、MCP 的组合上限 李默说了一句话: "99.99%的问题,Claude Code + Codex 能解决" "解决不了,说明路走错了,换一条" 这是真正重度使用后才敢说的话 所以我想明白了一件事: Claude Code 的上限,远比我想象的高 而我之前严重低估了它 接下来我要花更多时间 把 SDK、飞书应用这些能力搞出来 搞懂了教给大家 李默也开了个公众号 昨晚在我的威逼下承诺后面会好好更新 大家赶紧关注起来:@李默AI实战 黄叔已经拜师 李默也已经加入咱们的社团! 大家赶紧下单,和默总做群友啊啊啊 不说多的,咱们社团绝对是给普通人讲好Claude Agent最好的课程体系 为啥,有李默的技术加持,有黄叔的喂饭级教程 用最前沿的技术搞定你的工作生活问题! 而且最后3天福利: 下单即可获得1年Monica Pro会员+1月 ListenHub Pro会员 价值小1000元

00
程玉
3月前

AGENT橘: AK 写了一篇播客回顾 2025 年的 AI 发展,它评价 nano banana 是 2025 年最具革命性的模型。 它的意义不止是个卓越的绘图模型,而是一种以图像为媒介的沟通方式。 🍌是图像版的 LLM。 未来还会有的视频版的 LLM。它会是什么? 🍅🥔🌶🍋? AK 原文的翻译: Google Gemini Nano Banana 是 2025 年最令人惊叹、具有范式转移意义的模型之一。 在我的世界观里,大语言模型(LLM)是继 20 世纪 70、80 年代个人电脑之后的又一个重大计算范式。因此,基于本质上相似的逻辑,我们将会见证类似的创新浪潮: 我们将看到个人计算的重生、看到微控制器的等价物(认知核心)、看到互联网的进化(智能体网络)等等。 特别是在用户界面与体验(UI/UX)方面,目前与 LLM 的“对话”模式,其实有点像 80 年代向计算机控制台输入命令行。 文本虽然是计算机(以及 LLM)最原始、最偏好的数据表现形式,但它并不是人类偏好的格式,尤其是在输入端。 事实上,人类并不喜欢阅读长篇累牍的文字——这既缓慢又费神。 相反,人类天生喜欢以视觉和空间的方式来摄取信息,这也是为什么传统计算领域会发明图形用户界面(GUI)。 同理,LLM 也应当以我们偏好的方式与我们交流 通过图像、信息图、幻灯片、白板、动画/视频以及 Web 应用等。 这种趋势的早期雏形当然就是表情符号(emoji)和 Markdown,它们通过标题、加粗、列表和表格等方式对文本进行“装饰”和排版,使其更易于阅读。 但究竟谁能真正构建出 LLM 时代的 GUI? 在这种视角下,Nano Banana 为我们展示了这种未来形态的初步端倪。 更重要的一点是,这种能力的显著之处不在于单纯的图像生成,而在于模型权重中将文本生成、图像生成和世界知识深度交织在一起所产生的“共生能力”。 英文原文地址:https://karpathy.bearblog.dev/year-in-review-2025/ 期待明年的 labnana.com 能成为 nano banana 模型的最佳载体。

00