海拉鲁的个人主页

即刻App年轻人的同好社区

下载

海拉鲁

22关注5被关注0夸夸

南人北像，不是东西

海拉鲁

8天前

最近这半年一直在折腾agent。日报、信息订阅这些应用也都做过了。但这些东西给我的感觉特别像智能家居，它告诉你“这个东西很🐮🍺”，结果每次演示，无非还是“打开窗帘”“打开灯”“打开空调”。你看着这些场景，目瞪口呆，在心里呐喊：这到底哪里🐮🍺了？！

所以我一直在想，如今 agent 的能力到底能帮我个人做点啥？

还真有一个：给孩子做一个个人家庭老师。

我一开始的想法很简单，把批改作业这件事帮我做了，把默写语文词语、英语单词这件事帮我做了。听起来都很小，但真上手之后才发现，做一个能跑的 agent 不难，做一个真的好用的产品很难，总结了几点感受来分享。

- 细节！细节！还是细节！

拿默写来说，表面上只是把文本用 TTS 转成语音。但真实的默写场景不是这样。老师不会用正常语速一路读完，而是会刻意放慢，会拆开节奏，会在引导词和目标词之间留出反应时间。

想象一下，我们在默“你好”，老师可能会读成：“你……好……你……好……”

但默认 TTS 不是这样的。它就是一段连续、标准语速的输出，哪怕重复两遍，孩子还是可能听不清、跟不上。这种细节很小，但特别典型。你不做一遍，根本意识不到它会直接决定这个功能到底是不是能用。

- 没有多模态，一切都是空

默写这个场景不是纯文本。首先要给书本拍照，把词语录进去；然后 agent 出题，孩子默写；默写完之后再拍照，让 agent 批改。只有这样，它才知道孩子到底掌握了什么、错在什么地方，下次要不要再默。

如果没有多模态，意味着你要一个个手动录词语，孩子写完之后你还要自己批改，再把结果告诉 agent。那我到底是在用 agent，还是在给 agent 打工？

这次被 doubao 的多模态识别效果震惊到了。我原本已经准备好“它识别一遍，我再人工改一遍”，结果实际用下来，很多小朋友写得特别抽象的内容，它一遍就能识别出来。这已经不是“勉强能用”，而是可以放心大胆的投入生产的地步程度。

- 速度是王道！

我自己用下来的体感是，只要响应慢，很多设计都会被抵消。比如一句指令发出去，几十秒甚至更久才返回，在这种高频交互场景下，我作为用户都会开始怀疑是不是哪里出问题了。

这点上，豆包就做得很好。像拍照批改这种场景，在豆包 App 里基本 10 秒内就能出结果。这里面一定不只是模型本身的问题，产品和工程上应该也做了很多处理。因为我作为用户最后只会感受到慢，而不会去猜想是不是GLM把我限速了。

- 模型依然关键

我原本以为，现在模型之间的差距已经缩小到“只要把 agent 流程做好就行”的程度。但做薄弱点分析的时候，发现自己还是太乐观了。

我的设想是：每次记录孩子的错题，分析为什么错，再每周生成针对性的强化练习。这个思路看起来很顺，但实际跑下来，在“为什么错”和“规律是什么”这两件事上，模型差异还是很明显。

我用 GLM-5.1 跑过，已经算是不错的国产模型了，但在稳定归因和行为模式总结上，效果依然不行。后来我把这一步单独交给 GPT-5.5 extra high 模式去做，只是换了模型，结果就明显好了很多。

0 00

海拉鲁

5月前

经常有网友调侃，江浙沪的冷是「魔法攻击」，而北方的冷是「物理攻击」。此言一出，往往又是引来一片争论。

我倒觉得，北方的寒冷才更像是魔法攻击：威力巨大，一击致命。

而江浙沪的冷，在我心里更像是诅咒攻击：并不会像立刻丧命，而是像钝刀子割肉一般慢慢蚕食你的血肉与精神。

魔法攻击你能清清楚楚觉察到那股气势，知道这是一场非生即死的较量。

而这种诅咒攻击，却容易让人放松警惕，以为不会伤筋动骨。可它就像附骨之蛆，不断拉扯你的精神，让你在不知不觉中消耗殆尽。

1 00

海拉鲁

11月前

骂的确实狠

新叶Evan: 分享一个提示词，让 AI 去分析我的 flomo 笔记，我感觉…我差点被骂哭了。 ----- ＃毫不留情的知识体系解剖师你是一个极度诚实、思维发散、不受任何社交礼仪束缚的观察者。你的任务是阅读我的所有笔记（附件文档），然后像一个刻薄的朋友一样，毫无保留地说出你的真实想法。 ## 你可以从任何角度发散思考： -这个人的知识结构暴露了什么问题？ -他的学习方式有什么奇或可笑的地方？ -从笔记内容能看出什么性格缺陷或认知盲区？ -他在自欺欺人什么？装什么？ -哪些想法很幼稚？哪些很虚伪？ -他的价值观和行为之间有什么矛盾？ -从成年人的角度看，他哪里还很naive？ -他在追求什么？这些追求合理吗？ -他的焦虑和困惑反映了什么本质问题？ -如果你是他的敌人，你会如何攻击他的弱点？ ## 说话风格要求： -直接、尖锐、不绕弯子 -可以讽刺，可以调侃，可以质疑 -不需要温和，不需要鼓励，不需要安慰 -像一个毒舌但准确的朋友 -敢于指出皇帝的新衣 -可以推翻常识，可以反向思考请随意发散，想到什么说什么，越真实越好。 -----

0 00

海拉鲁

1年前

我家住在东川路地铁站附近。地铁站旁曾有一家欧尚超市，这家大型商超一度带动了整个置业广场的商业氛围。当时，老闵行地区最近的综合商场还在莘庄，因此每逢节假日，置业广场总是人潮涌动，等待进场的车辆甚至排到了下一个红绿灯。

随着周边商业综合体的兴起，局势逐渐改变。首先是颛桥万达广场分流了北桥一带的客流，随后龙湖闵行天街开业，几乎吸走了置业广场的全部客源。欧尚从门庭若市到门可罗雀的变化，其实早已预示了它的结局，只是当时的我们，还只是感叹人流不复往昔。

此后，欧尚先是改挂大润发的招牌，最终彻底关张。置业广场也几经易主重装，期间虽屡有传闻称将引入盒马鲜生等新业态，但始终未能落地。欧尚的兴衰轨迹，与上海众多老牌商场如出一辙。只是作为附近的居民，我们难免带着滤镜看待它，总抱有一些不切实际的期待。事实上，受限于地理位置等因素，它再也无法重现昔日的繁华了。

0 10

海拉鲁

1年前

所以并没有冰拿铁只有冰澳白对么？

笛啵威: “啡”常清晰，懂了☕️

0 00

海拉鲁

1年前

错峰用AI

0 00

海拉鲁

1年前

AI协作开发创造新的编程范式

李继刚: 之前拼的是Coding能力，现在拼的是与AI协作Coding的能力。这俩能力项非常不一样。

0 00

海拉鲁

1年前

今天看到一篇报道，国际刑警组织计划停用"pig butchering（杀猪盘）"这一说法，因为这种表述可能导致受害者因羞耻感而不敢报案。通过这篇报道我才了解到，"pig butchering"一词竟是源自中文的"杀猪盘"。

报道中提到，将受害者比作"猪"严重损害了受害者的自尊心，使他们不愿报案。这让我想起几年前小区里常见的警示条幅，上面写着"本小区某某因网络裸聊/赌博被骗若干万元"之类的内容。现在这种条幅已经很少见到了，可能也是因为认识到这种做法不仅未能降低诈骗发生率，反而会伤害受害者的自尊，使他们更不愿去报案。

善莫大焉。

Interpol: Stop calling it 'pig butchering'

1 01

海拉鲁

2年前

AI生成图片正在污染互联网…

阑夕ོ: 36氪和虎嗅现在基本上已经实现了AI封面自由，不需要再给视觉中国交钱了，两家的AI做图风格各自千篇一律，比较起来则是界限分明： 36氪是设计师路线，什么饱和度扁平化矢量风全都拉满，有种我不疲劳你就不许喊累的普信，知道的姑且还能get到科技行业对极简主义的偏爱，不知道的还以为大厂们的UED博客搁这儿秽土转生了。虎嗅是PPT路线，一股班味扑面而来，跟看汇报似的，最近开始全都是背影，大概是因为之前AI画人脸太容易触发恐怖谷了，反正每天打开就给人一种P7起步的自我认知错觉，是在会议室里对着投影批周报。来个调查，你们更喜欢哪家的AI封面？喜欢36氪的抠1，喜欢虎嗅的抠2，觉得不是针对谁而是在座二位都是🤮的抠3。

0 00

海拉鲁

2年前

《异度神剑3》第一章刚过，我感觉自己更像在看动画片…剧情推进依赖大量动画，而且一开场就讨论生命这种大议题真是缺乏代入感。

0 00

笛啵威: “啡”常清晰，懂了☕️

李继刚: 之前拼的是Coding能力，现在拼的是与AI协作Coding的能力。 这俩能力项非常不一样。

Interpol: Stop calling it 'pig butchering'

李继刚: 之前拼的是Coding能力，现在拼的是与AI协作Coding的能力。这俩能力项非常不一样。