即刻App年轻人的同好社区
下载
App内打开
海拉鲁
22关注5被关注0夸夸
南人北像,不是东西
海拉鲁
8天前
最近这半年一直在折腾agent。日报、信息订阅这些应用也都做过了。但这些东西给我的感觉特别像智能家居,它告诉你“这个东西很🐮🍺”,结果每次演示,无非还是“打开窗帘”“打开灯”“打开空调”。你看着这些场景,目瞪口呆,在心里呐喊:这到底哪里🐮🍺了?!

所以我一直在想,如今 agent 的能力到底能帮我个人做点啥?

还真有一个:给孩子做一个个人家庭老师。

我一开始的想法很简单,把批改作业这件事帮我做了,把默写语文词语、英语单词这件事帮我做了。听起来都很小,但真上手之后才发现,做一个能跑的 agent 不难,做一个真的好用的产品很难,总结了几点感受来分享。

- 细节!细节!还是细节!

拿默写来说,表面上只是把文本用 TTS 转成语音。但真实的默写场景不是这样。老师不会用正常语速一路读完,而是会刻意放慢,会拆开节奏,会在引导词和目标词之间留出反应时间。

想象一下,我们在默“你好”,老师可能会读成:“你……好……你……好……”

但默认 TTS 不是这样的。它就是一段连续、标准语速的输出,哪怕重复两遍,孩子还是可能听不清、跟不上。这种细节很小,但特别典型。你不做一遍,根本意识不到它会直接决定这个功能到底是不是能用。

- 没有多模态,一切都是空

默写这个场景不是纯文本。首先要给书本拍照,把词语录进去;然后 agent 出题,孩子默写;默写完之后再拍照,让 agent 批改。只有这样,它才知道孩子到底掌握了什么、错在什么地方,下次要不要再默。

如果没有多模态,意味着你要一个个手动录词语,孩子写完之后你还要自己批改,再把结果告诉 agent。那我到底是在用 agent,还是在给 agent 打工?

这次被 doubao 的多模态识别效果震惊到了。我原本已经准备好“它识别一遍,我再人工改一遍”,结果实际用下来,很多小朋友写得特别抽象的内容,它一遍就能识别出来。这已经不是“勉强能用”,而是可以放心大胆的投入生产的地步程度。

- 速度是王道!

我自己用下来的体感是,只要响应慢,很多设计都会被抵消。比如一句指令发出去,几十秒甚至更久才返回,在这种高频交互场景下,我作为用户都会开始怀疑是不是哪里出问题了。

这点上,豆包就做得很好。像拍照批改这种场景,在豆包 App 里基本 10 秒内就能出结果。这里面一定不只是模型本身的问题,产品和工程上应该也做了很多处理。因为我作为用户最后只会感受到慢,而不会去猜想是不是GLM把我限速了。

- 模型依然关键

我原本以为,现在模型之间的差距已经缩小到“只要把 agent 流程做好就行”的程度。但做薄弱点分析的时候,发现自己还是太乐观了。

我的设想是:每次记录孩子的错题,分析为什么错,再每周生成针对性的强化练习。这个思路看起来很顺,但实际跑下来,在“为什么错”和“规律是什么”这两件事上,模型差异还是很明显。

我用 GLM-5.1 跑过,已经算是不错的国产模型了,但在稳定归因和行为模式总结上,效果依然不行。后来我把这一步单独交给 GPT-5.5 extra high 模式去做,只是换了模型,结果就明显好了很多。
00
海拉鲁
5月前
经常有网友调侃,江浙沪的冷是「魔法攻击」,而北方的冷是「物理攻击」。此言一出,往往又是引来一片争论。

我倒觉得,北方的寒冷才更像是魔法攻击:威力巨大,一击致命。

而江浙沪的冷,在我心里更像是诅咒攻击:并不会像立刻丧命,而是像钝刀子割肉一般慢慢蚕食你的血肉与精神。

魔法攻击你能清清楚楚觉察到那股气势,知道这是一场非生即死的较量。

而这种诅咒攻击,却容易让人放松警惕,以为不会伤筋动骨。可它就像附骨之蛆,不断拉扯你的精神,让你在不知不觉中消耗殆尽。
00
海拉鲁
1年前
我家住在东川路地铁站附近。地铁站旁曾有一家欧尚超市,这家大型商超一度带动了整个置业广场的商业氛围。当时,老闵行地区最近的综合商场还在莘庄,因此每逢节假日,置业广场总是人潮涌动,等待进场的车辆甚至排到了下一个红绿灯。

随着周边商业综合体的兴起,局势逐渐改变。首先是颛桥万达广场分流了北桥一带的客流,随后龙湖闵行天街开业,几乎吸走了置业广场的全部客源。欧尚从门庭若市到门可罗雀的变化,其实早已预示了它的结局,只是当时的我们,还只是感叹人流不复往昔。

此后,欧尚先是改挂大润发的招牌,最终彻底关张。置业广场也几经易主重装,期间虽屡有传闻称将引入盒马鲜生等新业态,但始终未能落地。欧尚的兴衰轨迹,与上海众多老牌商场如出一辙。只是作为附近的居民,我们难免带着滤镜看待它,总抱有一些不切实际的期待。事实上,受限于地理位置等因素,它再也无法重现昔日的繁华了。
10
海拉鲁
1年前
所以并没有冰拿铁只有冰澳白对么?

笛啵威: “啡”常清晰,懂了☕️

00
海拉鲁
1年前
错峰用AI
00
海拉鲁
1年前
今天看到一篇报道,国际刑警组织计划停用"pig butchering(杀猪盘)"这一说法,因为这种表述可能导致受害者因羞耻感而不敢报案。通过这篇报道我才了解到,"pig butchering"一词竟是源自中文的"杀猪盘"。

报道中提到,将受害者比作"猪"严重损害了受害者的自尊心,使他们不愿报案。这让我想起几年前小区里常见的警示条幅,上面写着"本小区某某因网络裸聊/赌博被骗若干万元"之类的内容。现在这种条幅已经很少见到了,可能也是因为认识到这种做法不仅未能降低诈骗发生率,反而会伤害受害者的自尊,使他们更不愿去报案。

善莫大焉。

Interpol: Stop calling it 'pig butchering'

01
海拉鲁
2年前
《异度神剑3》第一章刚过,我感觉自己更像在看动画片…剧情推进依赖大量动画,而且一开场就讨论生命这种大议题真是缺乏代入感。
00