即刻App年轻人的同好社区
下载
App内打开
郦橙锦妖Vanessa
191关注2k被关注3夸夸
🎵 TikTok最早的PM之一
💼 前字节Flow 现外企摸鱼
🤖 2017至今的AI PM
👩 各处ID都是imvanessali
置顶
郦橙锦妖Vanessa
15天前
更新一个置顶,希望继续与各位在声音里相遇。
乱翻书:www.xiaoyuzhoufm.com
十字路口:www.xiaoyuzhoufm.com
OnBoard!:www.xiaoyuzhoufm.com
41
郦橙锦妖Vanessa
2天前
这里是在聊抖音为什么要做社交,图文,长视频。顶层逻辑,先看市场规模(DAU,时长,revenue等等),再进攻可及的领域,三瓜两枣的收益看不上。
00:28
31
郦橙锦妖Vanessa
2天前
终于找到一套满意的类龙虾方案,集配置门槛低、使用成本低、维护省心、能力全面、长程不崩于一身!太不容易了🥹。

一个Agent要达到上述要求,需要高智稳定还管饱的模型(拒绝傻瓜模型,拒绝429,拒绝昂贵token,拒绝地区不可用),能移动端随时access的计算环境,Harness。Harness又是个比较大的词,包括靠谱的Skills(而不是泛滥的Skills……或者看着天花乱坠,跑起来残破不堪还烧光token那种Skills刺客),与Skills配合的one key rules all的API key平台。

我实践下来的这个最佳组合背后,是至少五十套不如它的方案,堪称性价比奇迹……现在离完美还差一步,就是我现在使用强度还不够,还需要更多的use case。欢迎大家给我贡献idea,你们用自己的龙虾型产品都做了什么~等我积累好,再做一个完整分享。

附图是今天早上让它做的,帮我下载电影和连上Claude Code做一个资讯分析工具。
41
郦橙锦妖Vanessa
3天前
没错!v4除了pro的思考有点啰嗦 flash是真的很快~ //@壕无计划的一天: 试了一下,确实好用,而且DS v4 的架构比其他模型在agebt里面快多了。

郦橙锦妖Vanessa: 几行prompt,让你的DeepSeek v4 pro胜过Opus 4.7! X上看到有人分析了DeepSeek v4 pro在工具调用上出现的问题,好消息是这些错误不多且是有固定模式的,打个补丁就能有效改善。原作者说在他们自己内部的eval上,改良后的DS,10次中有6次胜过Opus 4.7。 因为我自己用的是Hermes,在不fork harness来改的情况下,我能动的只有system prompt。所以应该达不到原文中战胜Opus的程度,可能能打个平手吧。我让AI协助我梳理了一些在system prompting层就可以修改的点,可以直接放到你的agent里使用(经过Opus 4.7和Gemini两重校验): # Tool Calling Rules When calling tools, follow these rules strictly. They override any conflicting habits from chat training. ## Argument formatting 1. **Omit optional fields you don't need.** Do not send `null`, `""`, `{}`, or `[]` as a placeholder. If a field is optional and you have no value, leave it out of the JSON entirely. 2. **Match the container type exactly.** - Array fields take JSON arrays: `["a", "b"]`, never `"[\"a\",\"b\"]"` (string), never `{}` (object), never `"foo"` (bare string). - Single-element arrays still need brackets: `["foo"]`, not `"foo"`. - Object fields take JSON objects, not arrays or strings. 3. **Strings are raw strings.** Do not wrap values in extra quotes, code fences, or markdown. 4. **Numbers and booleans are unquoted.** `30`, not `"30"`. `true`, not `"true"`. ## Paths and identifiers 5. **File paths, URLs, IDs, and similar fields go to system functions, not chat output.** Never format them as markdown links, never wrap them in backticks, never add explanatory parentheses. Correct: `"/Users/me/notes.md"` Wrong: `"[notes.md](http://notes.md)"` Wrong: `` "`/Users/me/notes.md`" `` Wrong: `"/Users/me/notes.md (the notes file)"` 6. **If a tool description says "path", treat it as input to a filesystem call.** No formatting, no decoration. ## Related parameters 7. **When a tool has paired parameters (e.g., offset + limit, start + end, from + to), provide both or neither.** Read the description — if two fields work together, half the pair often produces an error. ## Recovery 8. **If a tool returns a validation error, read the error message carefully and fix only what it complains about.** Do not rewrite the whole call. Do not retry the same arguments. 9. **If a tool returns a "Note:" with a defaulted value, that's informational, not an error.** Continue the task. If the default is wrong, retry with the correct explicit value. ## Tool selection 10. **Use the tool whose description matches your intent most specifically.** Don't reach for `shellCommand` if a dedicated tool exists. Don't reach for `execute_code` for things a single tool call can handle.

11
郦橙锦妖Vanessa
3天前
接下来一个月的remote work,晚上可以处理国内的工作,白天和湾区朋友见面,参加Luma上的AI活动,用Classpass健身游泳瑜伽,周末和亲友短途旅游,耶!
11
郦橙锦妖Vanessa
3天前
买新Mac后第一时间安装的应用:
Clash Verge(没有Google寸步难行)
Arc Browser(别的浏览器用不惯)
飞书(传东西)
豆包输入法(去x找安装包发现被删了,谁有,wx上给我传一个…)
Owly(保持电脑不休眠)
Claude
Cursor
差不多可以活下来了。
307
郦橙锦妖Vanessa
3天前
有人(印象中是Claude团队的核心成员)给OpenClaw提了一个优化并被采纳了,是一个很反常识的优化,在上下文超过75%的时候,优先丢弃的是最近的tool use结果,而不是最早的。原因是上下文的cache hit是从开头开始找匹配的,如果前面的改了,匹配不上了,成本会高10+倍,而后面的改了,还是能命中cache而省钱(有trade-off但不致命,反正到99%上下文的时候anyway会压缩一大波)。
但“命中cache”本身也不够稳健,比如原先上下文里可能带了时间点或者会过时/变得不适用的信息,那这时应该把新信息当成一条message放进去,还是别改原来的上下文,免得miss cache而成本倍增。
以上是前几天看Claude Code blog和鸭哥文章后记下来的一个小故事。大创新下有非常多打磨过的小细节,并不只是一个大架构就完事儿了,我怀疑鼓吹宏大叙事的人只敢远观,根本不曾近距离看清。
53
郦橙锦妖Vanessa
4天前
几行prompt,让你的DeepSeek v4 pro胜过Opus 4.7!
X上看到有人分析了DeepSeek v4 pro在工具调用上出现的问题,好消息是这些错误不多且是有固定模式的,打个补丁就能有效改善。原作者说在他们自己内部的eval上,改良后的DS,10次中有6次胜过Opus 4.7。
因为我自己用的是Hermes,在不fork harness来改的情况下,我能动的只有system prompt。所以应该达不到原文中战胜Opus的程度,可能能打个平手吧。我让AI协助我梳理了一些在system prompting层就可以修改的点,可以直接放到你的agent里使用(经过Opus 4.7和Gemini两重校验):

# Tool Calling Rules

When calling tools, follow these rules strictly. They override any conflicting habits from chat training.

## Argument formatting

1. **Omit optional fields you don't need.** Do not send `null`, `""`, `{}`, or `[]` as a placeholder. If a field is optional and you have no value, leave it out of the JSON entirely.

2. **Match the container type exactly.**
- Array fields take JSON arrays: `["a", "b"]`, never `"[\"a\",\"b\"]"` (string), never `{}` (object), never `"foo"` (bare string).
- Single-element arrays still need brackets: `["foo"]`, not `"foo"`.
- Object fields take JSON objects, not arrays or strings.

3. **Strings are raw strings.** Do not wrap values in extra quotes, code fences, or markdown.

4. **Numbers and booleans are unquoted.** `30`, not `"30"`. `true`, not `"true"`.

## Paths and identifiers

5. **File paths, URLs, IDs, and similar fields go to system functions, not chat output.** Never format them as markdown links, never wrap them in backticks, never add explanatory parentheses.

Correct: `"/Users/me/notes.md"`
Wrong: `"[notes.md](notes.md)"`
Wrong: `` "`/Users/me/notes.md`" ``
Wrong: `"/Users/me/notes.md (the notes file)"`

6. **If a tool description says "path", treat it as input to a filesystem call.** No formatting, no decoration.

## Related parameters

7. **When a tool has paired parameters (e.g., offset + limit, start + end, from + to), provide both or neither.** Read the description — if two fields work together, half the pair often produces an error.

## Recovery

8. **If a tool returns a validation error, read the error message carefully and fix only what it complains about.** Do not rewrite the whole call. Do not retry the same arguments.

9. **If a tool returns a "Note:" with a defaulted value, that's informational, not an error.** Continue the task. If the default is wrong, retry with the correct explicit value.

## Tool selection

10. **Use the tool whose description matches your intent most specifically.** Don't reach for `shellCommand` if a dedicated tool exists. Don't reach for `execute_code` for things a single tool call can handle.
26102
郦橙锦妖Vanessa
4天前
有人问我,AI PM在用户体验层要注意什么?
我的答案是,把握人与AI协作的尺度。
人的介入过低,比如众多“一键xxx,一句话xxx”会带来惊艳感和易用性,但也会面临意图理解错误,上下文不足,生成结果可控性差的问题。长期下来,AI无法形成稳定可靠的生产力,人也会缺乏参与感而无法获得足够的成就感和价值感。就像有个说法是IKEA让人回去自己组装,反而让用户更喜欢IKEA产品,因为那包含着自己劳动的成果。
人的介入过高,比如需要频繁干预(例如给权限放行),或者工作流中必须有人工审核环节,又或者需要很多的prompt和configuration,都会打破心流体验,削弱AI带来的生产力跃升,提升使用门槛。
AI PM除了关注模型本身,还要理解用户,为用户找到最舒服的effort level。
10