即刻App年轻人的同好社区
下载
App内打开
-Flair-
23关注11被关注0夸夸
别对我小心翼翼
人必须教育自己。人最终会水落石出。
-Flair-
1年前

Celia.: 分享一个上次 Agent 活动的笔记: 1. 文锋@wenfeng 现在在做 sheet0,一个专门做表格的 Agent,据说可以实现 100% 准确率。 我不确定准确率是不是真的已经能优化到这种程度了,但他做成这件事儿的思路很有启发! 为什么 Agent 现在不靠谱?一大原因就是 Agent 实现一个任务的步骤非常多,所以即便单一步骤的成功率能有 90%,那假设只有 5 步,一乘下来也就剩 60% 左右的成功率了。 这里文锋提了一个很有意思的思想实验,就是换一个角度看,成功率是 60%,说明在 100 次的任务里,其实有 60 次是完全成功的,所以我们哪怕没有能力把这 60% 的成功率提高,但仍然可以把重点放在怎么把这成功的 60 次找出来,组合在一起。 在他的产品里,实现方式就是当 Agent 每做完一步后,都单独做一轮评估。 如果感觉离目标更近了,那没问题,可以让 Agent 按部就班继续干活。 如果发现不对劲,就调用一个单独的 evaluation 模块,推理一下为什么现在出错了,是这一步出错了,还是再之前就错了,只是当时没看出来? 最后将推理的结果作为额外的 context 给到大模型,让它重新回滚到出错前的位置,换个方法再试一次。 当然有可能多次尝试也还是不行,那就再呼叫人类接管。 2. 上面这种方案的主要难点在于评估,也就是如何判断 agent 每一步是不是做对了? 这之所以能实现主要是因为文锋的产品是个表格 agent,有相对清晰的使用场景和结构化的交付成果。 但如果是通用任务,那基本就没法做。 所以垂直 agent 还是有个很大的优势,它能够预设场景和方案,用领域 knowhow 和工程化的设计提供更好的交付。 比如能更好地识别用户意图并在适当的时候主动向用户提问。 能更好地内嵌 Prompt 并进行各种有针对性的产品设计(e.g. 在恰当场景提供更高效的 UI 交互)。 3. 文锋提到了很多 Usage data 的妙用。 比如说,Agent 内部评估时每一次的报错过程都是一个可优化的数据点,会被收集下来,用作强化学习训练。 比如说,Sheet0 的交付结果是一个可编辑的表格,如果用户双击某个单元格对结果做了修改,这也是一个重要的数据点,会被用作模型训练。 再比如,用户的 prompt 里往往也蕴藏了很多珍贵的 knowhow。有时一个用户会给 agent 提供一些不常见的数据源,让它完成某项任务。 这个数据也会被 agent 记录和学习,下次另一个用户要求 agent 完成类似的任务时,它就会知道其实可以利用这些小众的信息搜集方式。 这些带来的结果都是,agent 会越用越强大,越用越聪明。 这样看来,先发优势带来的数据优势可能是 agent 产品一个非常核心的竞争壁垒。 4. AI coding 是大模型的灵巧手。 因为 coding 场景能自动形成很好的 feedback loop,代码写得对就能跑通,写不对就会报错,所以让大模型通过 coding 完成任务,能很大程度上降低幻觉和出错的概率。 而且几乎一切任务都可以通过 code 表达,所以 AI coding 会是大模型落地一个很好用的工具,甚至说未来会形成一种类似于前端后端的固定范式,所有产品中都能借用到一部分 AI coding 的能力。 P.S. 我们 5 月底还有两场新活动,欢迎大家扫码来玩!

00
-Flair-
2年前
-Flair-
2年前
00
-Flair-
2年前

Yibie: 一直关注 Mac 上平铺式窗口管理器工具,尝试了不少,一直到早两天遇到的 AeroSpace,使用起来非常直觉,很舒服,推荐大家使用。 为什么要关注平铺式窗口管理工具,因为关于窗口的摆放和大小调整非常消耗时间,随便弄弄就起码 10 秒以上。而我们一天面对电脑工作,起码会操作几十次窗口。而且管理电脑上的窗口不光消耗时间,还消耗我们的注意力,尤其是临时开启的窗口,摆放在哪里,以什么大小合适,一考虑到这些小问题, 心思就完全被转移了。 平铺式窗口管理工具,能够自动化管理窗口, 帮助我们卸下了沉重的心智负担,从琐碎的操作中解放出来。 # AeroSpace 的使用体验,指哪打哪 我喜欢这么用 AeroSpace,当我想看之前积存的文章顺带记点笔记,我就按下 Option + 1;当我想上网冲浪,刷刷即刻 Twitter,我就按下 Option + 2;当我想看微信群里聊什么,我就按下 Option + 3。 你可以看到,AeroSpace 的体验核心是围绕着工作区(workspace)展开,每一个工作区,都可提前放好对应的软件,设置专门的布局——想做什么事情,转到专门的工作区里直接处理。不再需要启动软件,摆放好它的位置,或者调整好大小,才开始使用。 整体的体验,有指哪打哪,挥洒自如的爽快。 # 常用快捷键 AeroSpace 是全键盘操作的,记住一些常用快捷键,会提升使用体验: 切换工作区 Option + 数字/英文字母 将当前窗口发送到对应的工作区 Option + Shift + 数字/英文字母 将当前窗口移动到另一个显示器 Shift-Option-Tab 将当前焦点切换到左/下/上/右侧的窗口 Option-H/J/K/L 将当前窗口向左/下/上/右侧移动 Shift-Option-H/J/K/L 将当前窗口尺寸增大/缩小 50 像素 Shift-Option- = (equal) / - (minus) 实际上,AeroSpace 有着极大的自由度,可以自己定制按键,只要不害怕修改配置文件就行了。 附上我的工作区参考。 原文链接:https://https://looming.space/

00
-Flair-
2年前

ErlichLiu: 在公司里,每一个参与的人,要么是推力,要么是阻力。对于工作量相对少,有一定“管理”任务的人来说,通常提供的都是巨大的阻力。 理解起来也很简单,首先如果公司的激励不够,不够明辨是非,那么成为阻碍其他人的人格外的有优势。第一,我可以在不怎么干活的情况下表现出我的关心,并且可以掩盖我的业务能力问题,因为对方提出来的东西竟然不是我发现和来主导的;然后,我还可以通过阻力的方式来彰显我的聪慧和考虑周全;最后,如果这件事最后没有被执行,这就更能证明我是对的;但如果执行了,出错了,错不在我;如果执行了,效果还不错,但公司没激励,我也永远不会损失什么。 最近在推动一件把一项成本降低到 1/10 的工作当中充分体验到的。为了打破这些人的阻力,我不但开发了个小工具来做测试,还证明了我的方案不但省钱,还比原来的方案更棒。 为此,我也学会了一项技能。一旦碰到在提供阻力的人,我就会顺道 at ta,然后:“那么,请问你的解决方案是什么呢?我们真的做不到吗?请给我你的方案,我们再来看看。” 努力 push 其他人,努力 push 老板做更好的激励方案。 我现在觉得经营真的不难,别骗自己,少说假大空的话,假设所有人都是懒惰、自私和贪婪的,努力去打通阻力,设计好权、责、利,别想着一次就设计好,也别过分担心,先等矫枉过正,每次都是矫枉过正,用市场的视角看人。

00