即刻App年轻人的同好社区
下载
App内打开
Suda_Lulu
690关注144被关注0夸夸
人生非线性,探索即修行。
与AI共处,是实验场🔬,也是镜子🪞。
持续探问人机协作的边界。
正在寻找AI产品经理的机会💼。
Suda_Lulu
2天前
📖 我花了一周时间,把 Context Engineering 的碎片拼成了完整认知框架

Manus 官方博客、LangChain 播客,到 Anthropic 的工程实践,系统梳理了 Agent 开发的底层范式。

为什么你的 Agent 越跑越蠢?
128K 就"智商跳水"
工具超过 30 个就开始犯错
花5美元跑一次,到第45轮就忘了初心

问题不在模型,在 Context Engineering。
KV Cache 优化到 Multi-Agent 隔离,从可逆压缩到工具遮蔽——每个技术决策背后都有深刻的工程哲学。

核心理念:Less Structure, More Intelligence
Context Engineering 才是应用层公司真正的护城河。

https://mp.weixin.qq.com/s/0esJgUxlBQ5ao-Fsv3LFqg

00
Suda_Lulu
3天前
日夜颠倒一个月
难不成得去找医生开安眠药才能调整作息🤔
00
Suda_Lulu
3天前
从知道到理解到行动
每一步要花的时间都很长
很羡慕那种行动力极高的人
00
Suda_Lulu
6天前
很多 PM 读论文就像自虐:
从第一个字开始读 被公式卡住 硬扛 10 分钟 放弃 下次继续从第一个字开始。
你以为在读论文,其实在被论文读。
论文不是小说,不用从头到尾。PM 读论文的目标只有一个:读完能做判断。
有价值就深挖,没价值立刻放弃。

⚠️重要提醒:公式直接跳过
PM 不用推导公式,只要搞清楚四件事:
解决什么问题|核心思路|工程实现|局限在哪。

———
⏱️第一步:5–10 分钟筛选
1)Abstract 最后一句:作者认为的核心贡献是什么?
2)第一张图:通常是架构图,看懂就知道论文在讲啥
3)Introduction 最后一段:作者的 claims 是什么?值不值得你继续花时间?
“这篇论文对我的判断/视野有没有增量?”没有就跳。

———
🔍第二步:抓真正重点
先看 Experiments 📊
看三件事:
1)指标在测什么能力
2)baseline 选得公不公平
3)测试集/数据哪来的

警惕两件事:
堆一堆技巧不可归因
只报最好结果,不讲波动和失败
一句话:PM 不用会做实验,但要会识别“凑出来的提升”。

再看 Limitations / Discussion ⚠️
这是全文最值得看的部分。
作者承认的局限,就是你落地要面对的约束和风险。
如果一篇论文几乎不提局限,要保持警惕。

最后看 Method 第一段 + 配图 🧩
不抠细节,只搞懂四件事:
核心机制是什么|关键假设是什么|工程要改哪些点|失败模式有哪些。
搞懂这四个,你就能复述、质疑,也能迁移到自己的场景里。

———
🤖看不懂就问 AI
建议用 Dia Comet AI 浏览器看论文:
常用 Prompt 可以封装成快捷键,一键提问/翻译,非常方便。
再配合语音输入法直接问,效率更高(推荐我在另一篇帖子里写了)。
你可以直接这样问:
“用产品经理能懂的语言解释这段”

———
✍️读完必须写 3 句话(不写=白读)
1)这篇论文做了什么
2)对我有什么启发
3)下一步行动是什么

真正的阅读效率不是读得多,而是:快速淘汰 90%,把时间留给那 10%。

💬评论区聊聊:你读论文有什么小技巧?
💎想要我的读论文/ 图片翻译 Prompt,评论区说一声。
00
Suda_Lulu
7天前
用GPT-5.2写小红书图文,效果我觉得平平无奇。
Benchmark只有第一次推出的时候才有意义。后面就很容易被hack,做定向的优化,体现不出真实的水平。

要测试真实效果还是得靠大家在实际情况的一个运用,靠人工评测更真实一点。
00
Suda_Lulu
8天前
明天来研究一下 Gemini3 Pro DeepResearch 跟开源的 DeepSearchQA paper。
00
Suda_Lulu
8天前
谷歌账号换成美国地址,语言换成英文 //@Gracyyin: 请问解决了吗?

罗锴: Antigravity 放的挺宽呀,Hongkong IP 都可以登录,这次 Google 的起名不错👍

00
Suda_Lulu
11天前
没想到变 Lenny 铁粉了😂
00
Suda_Lulu
13天前
研究了一周RAG,写了篇长文。

核心结论:RAG做不好,问题往往不在架构,而在两道坎——解析和检索。大多数教程教你"跑通",没人告诉你怎么"做好"。

第一次写这么长的内容,有不对的地方欢迎指正👇

https://mp.weixin.qq.com/s/K9nZJZNignDQAA3nmI28Uw

00
Suda_Lulu
1月前

Dachein大澄: 今天早上的灵光, 今天晚上的AntiGravity 都让我想起了 苹果前设计师的 Bret Victor,他谈到软件一个非常重要缺陷,即 Anti-Social,即:一个程序不能被一个偶然的旁观者立即理解和修改,这个问题终于开始被改变。 其实我们对“软件" 的理解是缺乏想象力的,受限于供给方式的,因为过去一个软件的开发 如果至少 10 个人,维护一年至少300 万 ,于是我们都假设: 一个软件必须很多人使用 一个软件需要被长期使用 其实, 这是一种供给匮乏、低效下的特殊情况,很显然现在 Cursor 一个下午可以完成一个完整的 CRM, Gemini3 一句话可以生成一个 三体运行 交互动画, 也就是说 接下来一个软件供给成本是一个咖啡时间和 一杯咖啡价格 前面两个假设都会不存在,会发生以下事件: 场景 一:一个母亲完全可以根据自己孩子学习进度和理解 ,几句话在手机上创造出一个 交互式的教学 app 演示 方程的意义, 这个产品可以只使用一次 或者一周, 也可以 Save as 一个.app /.skill ,发给班上其他同学 , 场景二:另一位家长完全可以 Fork 修改优化一种交互,比如引入反气球概念表示 负数 引起孩子兴趣, 当人人有这个创作也改编能力的时候 场景三:你可以去通过某种新型 MindHub /Mind Market搜索这么问题场景,Fork 一段实现 ,然后让 LLM 生产 ,或者微信你同事,你把那个处理 那个携程报销 的 那个 Skills 发我下 --- 也就是说一种 可以被快速构建、快速分发、快速修改(Fork)、快速消费 的新媒介 近在咫尺 , 这个也是我每次用 VibeCoding ,构建一个 iOS标准应用/NextJS 项目的时候,内心最大的拧巴 ,也就是用新工具在面向过去 构建静态的软件。 太传统了!!! 在以上场景里 我确定会有新的: - 无感的云设施和 RunTime ,比Excel 更简单的数据库, 像word一样修改 核心代码,相对确定的编译环境, Manus 最新版就是在这个方向上 - 新的github 和market:交换/交易 Mind/Skills - Document 会是未来软件核心构建,Claude Skills 就在做这个 - 所有会使用 PPT/Excel 的人,在三年内 开始传作 App,也就是2B AI adoption 基本路径是coding ,无它。 - 而且这个过程要发生在手机上 “软件生产”本身, 一定程度从,资本项目会转向“消费”,甚至跳过费用项目(这个洞察是 Gemini 看我叨逼叨Vibe Coding 的时候的伟大洞见: "Vibe Coding"是主体追求享乐(Jouissance)的典型路径,也是2025年最重要的症候形成。它精确地体现了拉康的"驱力"(Drive)理论:驱力的满足不在于抵达终点(完成产品),而在于围绕着欲望对象a(Objet petit a)——那个永远不可得的完美造物——周而复始地循环。

00