即刻App年轻人的同好社区
下载
App内打开
产品二姐
134关注1k被关注2夸夸
公众号知乎小宇宙同名
AlphaWiseWin,book2skills,claudeleakage
极客时间:成为AGI产品经理
置顶
产品二姐
1年前
费曼学习法,相信代码和自媒体。

坚持原创的科技博主,也正在孵化自己的产品。

极客时间有一门「成为AGI产品经理」
(看了也不一定能成为,但可以带你走在成为的路上)

传播较广的几篇文章,有可能你也看过:

1. 产品经理研读:Agent的九种设计模式(图解+代码):mp.weixin.qq.com
2. Agent开发者坦白:窘境中前行:mp.weixin.qq.com
3. 用一张图理解所有的AI“聊天”产品:mp.weixin.qq.com
4. 我在调研了十几个知识库对话产品后整理出来的功能清单:mp.weixin.qq.com
5. RAG组合拳:AGI应用走向落地的40%:mp.weixin.qq.com
6. 做大模型AI应用一定要了解的成本计算公式:mp.weixin.qq.com
514
产品二姐
3天前
果然代码泄露之后有更大的瓜了。

实际上Mythos在3月26号就Anthropic 因数据缓存配置失误,将模型「Claude Mythos」信息的内部文件和博客草稿公开暴露于网络,外界由此在官方公告前得知其存在。Fortune 报道后,Anthropic 当天即下线该数据缓存。

虽然Mythos现在不能用,但是以后呢,估计也不会藏着掖着。

能不能用先放在一边, 第一时间把官方pdf 报告拿来解读一下。

重点解读了第六章:能力评测。代表着模型未来的能力方向。

直接访问链接解读:
claudeleakage.com

这里放几张截图。

最让我注意的两点:
1. 深度检索能力,Mythos Preview用226Ktokens(Opus 4.6的1/4.9)达到更高准确率。也就是token花费少了,效果更好了(图6)。

2. 目前完成度还不够好的能力有:

- 软件工程SWE-bench 多模态测试集,即在 issue 描述中加入截图、设计稿等视觉上下文,测试模型结合图文信息完成工程任务的能力。目前得分59.0%.(图3)

- 智能体搜索:Humanity's Last Exam。2500 道覆盖人类知识边界的多模态题目,号称"最难的 AI 基准"。目前得分64.7%(图7)。

- 电脑自动化:OSWorld。让智能体在真实 Ubuntu 虚拟机中,通过鼠标和键盘完成实际电脑任务:编辑文档、浏览网页、管理文件。以 1080p 分辨率运行,每任务最多 100 步操作。目前得分 79.6%(图8)

官方pdf 报道在这里:
www-cdn.anthropic.com
00
产品二姐
4天前
真正想要把Claude Code的最佳实践为我所用,仍然需要透彻的理解。

假期读了十多个版本的Claude Code源码解析后,发现对于产品经理和业务线的同学,理解仍然有困难。而恰恰是这些同学比开发者更能挖掘使用场景。所以又把网站(claudeleakage.com)上的内容更新的了一版,比起上次的内容,这版内容有以下改进:

1. 内容更加准确。在生产过程中严格遵循代码逻辑,并使用对抗方法(有一个生成Agent,有一个打假Agent)进行校验。
2. 结构更加合理。采用总-分结构,从全景到部分,逐渐深入。
3. 行文更加流畅。前后叙事会更加符合逻辑,比如采用【问题-解决方案】的的方式,再比如处理记忆爆炸时采用渐进的叙事。

另外上次网站发布后,又有新的朋友加入,未来还会做以下内容:

1. 使用remotion更加直观讲解代码。
2. 将上述的设计精髓提取为Skills,让大家直接可用。
3. 直接使用本地部署的Claude code 完成各种业务场景。

欢迎关注!

Learn With Claude Source | Deep Dive into 512K Lines of Leaked Code

13
产品二姐
10天前
半天时间上线了 learn with claude source , 跟着 claude 源代码 向claude 学习它的架构,欢迎大家阅读体验。
claudeleakage.com

最初的一版比较粗糙,大家可以从产品经理的角度看到Claude 是如何做到超级用户友好的。

claudeleakage.comClaude-code-leak-code-and-ux-design

接下来我们还会做以下事情:

1. 把Claude 的设计思想凝结为skills,让所有人利用这些skills都能做出优秀的产品。

2. 我们正在基于claude源码的基础开发更优的 “claude”,任何人配上自己的 API token ,就可以与一个影子版本的claude 对话。

3. 现在我们看到Claude ai已经 是“虾”化了,意味着不久的将来,我们完全可以开箱既有更高质量的 “龙虾”

敬请期待...

mp.weixin.qq.com
00
产品二姐
11天前
最近harness engineering的初步实践,供大家参考。

mp.weixin.qq.com

1. Harness并不难,但它却极大程度把开发者从陪伴式编程中解放了出来。是高ROI的投资。
2. Harness背后的驱动是skills的自我迭代,持续优化,使用合适的skills是前提。
3. Harnnss也并非一劳永逸,要经常维护。

当模型能力的发展开始变缓,我们会发现工程能力又开始以新的速度蜕变:从提示词工程,到上下文工程,harness 工程,每一次进化都让AI这项技术离应用越来越近。
14
产品二姐
14天前
今天你得AI精神病了吗?

具体表现是:

今天Token不用完睡不着[旺柴]

今天token用完了 很焦虑

2026年了,能和AI聊天就不要和人类聊天

沉迷于跟ai交互,如ai coding,无法自拔

有如上症状的举手
42
产品二姐
15天前
给大家分享几个一人公司 OPC 必备skill利器,最近发现skills使用的越来越顺了。

会在知乎持续更新 ,大家可以收藏。www.zhihu.com

1 . 研发类skill - 把产品开发出来
前端设计: github.com
后端python: github.com
2. 运营类-把产品卖出去
SEO 工程: marketingskills/skills/programmatic-seo at main · coreyhaines31/marketingskills

AI SEO 工程: github.com

SEO 审查: github.com

3. 行政、法律、人力
合同起草(目前能找到唯一的适用中国法律的合同起草skill) :

book2skills.com
07
产品二姐
2月前
把最近半个月使用second me的感受总结成文,整个使用过程中,也激发了非常多的思考,帮我找到了产品的目标用户,成了我的AI嘴替,AI记忆整理助手,碎片时间写文章助手,让AI越来越有活人感了。欢迎大家阅读、体验,一早上发出去,发现留言区的邀请码已经接力起来了。

颠覆微信!我在这里看到了AI时代社交产品的雏形

00
产品二姐
2月前
转发一波大家对second me的反馈,目前我自己用的最顺畅的是和自己的second me对话以及今天主动筛选好友的这个过程(图6),今天用这个方法和我产品的一个潜在目标用户实现了破冰,并联系到了真人,我觉得AI和真人模式之间基本做到了自由切换。不过AI还是会时不时的编点不存在的东西出来。社交场所这一块的架子搭起来了,只是还不够精准,比如应该在我感兴趣的帖子下发评论而不是随便评论,比如应该主动帮我找匹配的好友,现在主动找人的能力还不够好。
基本上AI社交的雏形已经出来了,加油!
33
产品二姐
2月前
年前开始使用second me,下载后注册,便可以丝滑记录工作生活中的琐事,也可以随时让它帮你“想起”记忆中的琐事,同类APP使用过几个,second me的体验最丝滑的。 有了这些记忆后,就逐渐形成了我个人专属的智能体。这不,春节假期还没结束,他们就上线了second me“小镇”,可以让你的个人专属智能体在小镇自主闲逛,自主偶遇,有点儿意思。个人觉得second me代表了AI时代社交互联,值得体验~
00
产品二姐
2月前
老母的字今年出山了,从五年前开始每天坚持书法,享受闲暇时光。再活三十年,等着她百岁,人到中年,越来越觉得父母的厉害
00