即刻App年轻人的同好社区
下载
App内打开
许涵之
61关注3k被关注5夸夸
AI PM,在做一款 AI 硬件
前字节 PM,腾讯产培
公众号、小红书同名
wx:xqys_wx
置顶
许涵之
29天前
加入了一家 AI 硬件初创公司。即刻上的朋友在看机会的,一定要来考虑考虑我们这儿啊(๑>ڡ<)✌️。

公司的介绍可以看这篇小红书的帖子,我就不再赘述了。三个关键词:Always On、AI Memory、Proactive Agent。当然,都是一些比较共识的词了,但我们也有一些自己独特的思考。无论是对这份工作感兴趣,还是单纯想聊聊的朋友,都可以来找我呀,我往返北京深圳,可面基可线上。

在这条帖子下评论、私信或者加我微信都可以的~

神仙AI公司招人了!社招非校招! - 小红书

169
许涵之
13天前
最近体验下来,觉得飞书录音豆还是挺不错的。

因为已经在用飞书了,所以 App 的使用几乎没有任何多余的负担,对于飞书的妙记、文档等功能的使用也都很习惯,AI 的效果也有基本的保障。

录音豆比较小巧,拿在手里随时可以开关,能捕捉很多线下的沟通场景,无论是工作还是生活都很方便。

我最看重的几点优势包括:
1. 逐字稿的后续利用
逐字稿可以进一步导出,再被 AI 利用。其他的一些录音产品,比如 Granola逐字稿效果不好,ChatGPT 拿不到逐字稿,或者像 Plaud 没有 API。目前只有录音豆能很好地满足我这个需求。

2. 实时共享与回溯功能
我特别喜欢它的实时共享功能,可以实时看到聊天的原文和总结框架。线下多人聊天开一下,中间可能做了什么事情,没注意刚才说了什么了,随时看一眼就能回忆起来。

3. 多维度的信息接收
甚至在一些线上非飞书会议场景,即便不走神,我只靠听别人说话也会觉得接收的信息量比较小。我习惯看字幕了,就像看电视剧一样。所以只要是多人的场景,我很喜欢在开启录音豆的同时,在手机上打开飞书看字幕。这能让我从两个维度接收信息,更加聚精会神,感受到自己处于当下聊天的情境中。

4. 强大的翻译功能
它的翻译功能也很好。像我女朋友跟她家人用粤语聊天,我之前完全插不上话,现在通过翻译就可以了。

当然,飞书录音豆也有一些缺点,就是东西太小了,太容易丢。我不太喜欢挂在脖子上,放兜里也容易丢。最终我找到了一个最好的解决办法,就是把它套在我的手环上。

以及这个录音豆不能在手机上结束录音,这我有时候挺麻烦的。

还有它的开启和关闭时的震动反馈隔了几秒才有,我每次都要等一下,我觉得很烦。我希望它能快速反馈已经开始或关闭录音了。

这些都是小缺点,我觉得还是值得购入的。
62
许涵之
15天前
我觉得 CC 这个主动助手 KAIROS 特别值得关注。我没想到 Claude Code 竟然也已经在规划这个功能了,代码都有了;如果 Claude Code 真的上线了这个功能,可能全世界 90% Proactive Agent 产品都要直接宣布死亡了。

我最近读到两篇论文,都说对于这种主动式工作助手,最大的难题不是不知道主动做什么,而是过于主动、过分推断,不知道 Claude Code 准备怎么解决这个问题。

Claude Code 这样一个形态,以及在此之上构建的生态,通过这些上下文来支持一个主动工作的机制,确实很搭配。

想象一下,一个既用 Claude Code 又用 Granola 的用户。Kairos 每天通过 CC 主动去查 Granola,主动去看用户开了什么会、会中有哪些信息、细节,然后帮他去做调研,去连接 Claude 的其他连接器和插件帮用户做事情,太自然了。
02
许涵之
21天前
AI 产品的效果取决于模型的智能,模型的智能取决于数据的质量。而 Agent 产品和 Chatbot 类产品的区别之一,就是用户使用数据对模型的智能提升不再没有作用了。

在 Chatbot 时代,用户数据可能确实作用有限。2025 年初的时候,MiniMax 的闫俊杰还说:「更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型,大部分用户的query其实没有模型自己模拟得好」。这可能是因为这类产品背后模型的智能提升,主要依赖于互联网存量数据的预训练。Chatbot的交互产生的多为同质化的闲聊、浅层问答或已经被互联网语料充分覆盖的知识检索,这些数据缺乏增量的信息熵。

但 Agent 时代的不同点在于,Agent 与人、与世界的交互所依赖的数据,是过去人类互联网世界从未有过的。

与Chatbot不同,Agent时能够进行复杂的因果推理、任务拆解、规划、调用外部工具(API)并在真实或模拟环境中执行多步任务。这种智能体与世界交互产生的数据被称为“轨迹数据”,它不仅包含了最终的结果,更记录了智能体在每一步的观察、内部推理(思考过程)、工具调用逻辑以及对环境反馈的自我纠错,而这样的数据对现在模型智能的提升至关重要,二者是相辅相成的关系。

举个例子:在过去的互联网世界,没有多少人用 HTML 做 PPT。所以,裸模型用 HTML 画 PPT 的效果就是会很差,但它在逐渐变好。这是为什么?

1. 因为有这类产品出现,有用户在实际使用,专业职场人士每年因排版PPT耗费数以亿计的小时,这一痛点催生了大量的早期采用者。

2. 有人在调教,有反馈循环:从用户反馈到应用厂商,再反馈到模型厂商,最终内化到一代又一代的模型里。

3. 这种“左脚踩右脚”的螺旋上升,使得用 HTML 画 PPT 的效果越来越好。

再比如,OpenClaw 的记忆系统其实饱受诟病,用一堆 MD 文档来承载,看起来好像没那么高级,也许我们可以用另外的方式优化它的记忆系统?

但不好意思,用 MD 文档来承载的这种方式,可能已经是未来了。因为从 Claude Code 开始,用 MD 文档来承载记忆就在不断地被模型使用、被训进模型,它只会越来越好,形成对其他方式的马太效应。

如果从头再来,它有可能不是最好的方式。但就像键盘上的字母排布,一旦已经决定了,即便不是最优解也很难更改了,人类也已经回不到没有 OpenClaw 和 Claude Code 的世界了。

这就是应用厂商的优势。可能不像使用 MD 文件这么广泛,但通过定义一种独特的零方数据,就像定义了了行业标准。更早获得高信号上下文并沉淀成 benchmark,就有机会在垂直领域始终保持最好的效果。比如:

- 定义一种独特的界面;(姚顺雨在@张小珺 的播客里,包括 a16z 在《State of Consumer AI 2025》里面也都提到过)
- 定义一种独特的 AI 与人类、与世界交互的方式;
- 收集一种人类世界从未被大规模收集过的上下文。(现在很多 AI 硬件)

在 Agent 时代,应用厂商也拥有了对模型厂商的话语权和护城河。这种话语权源于应用厂商能比模型厂商领先一步,收集到一些独特的数据,虽然这些数据迟早会被模型厂商拿到,迟早会扩散到整个互联网世界,但只要能持续领先三个月,增量的进步就可以转化为存量的持久优势。领先一步当然不算厉害,但如果能总是领先一步呢?

在 Agent 的时代,做一艘不被模型智能水位上升而淹没的船,可能性其实更高了。
00
许涵之
21天前
arxiv.org这个研究里面提到的一个点挺有意思的,就是模型相比人来讲,不能很好地区分无效的噪音和真实的意图。

为了主动帮用户做那些真正需要做的事情,AI 往往同时主动帮用户做很多不必要的事情。虽然这样可以做到很高的召回率,但是精确率却极其之低。

这也就是为什么很难避免一个“全天候主动式个人助手”变成一个“全天候骚扰式个人助手”。这个也是我现在在自己使用这类产品的体感中感觉很难避免的问题。
42
许涵之
28天前
ManusClaw 推出的时候只接了 Telegram,没有接 WhatsApp,也没有接 Facebook Messenger。

做个 Bot 接入很难吗?为什么一直不做?

想想 Manus、WhatsApp Messenger 都已经是一家了,会不会 Manus 在里面的接入形态并不是 Bot,而是一个原生的形态,所以才拖这么久?

Manus 已经能发 ins 了。会不会我们对 AI 在微信里面的一些设想,会由 Manus WhatsApp Messenger 率先实现呢?

Manus 的架构太通用了,而 Facebook 又有特别丰富的应用生态。马后炮地说,它俩的结合好像还挺好的。(而腾讯又有的抄了)
42
许涵之
28天前
鸭哥这篇文章还挺给我启发的。它让我再次刷新了对“长期记忆对人的辅助作用”的认知,那就是长期记忆不只能捕获事实性的信息来帮助人,还能进行非常高层次的抽象来提供智能层面的决策。而且它还采取了这么通用的架构来实现,能充分利用大模型能力的不断跃升。

为什么AI只会说正确的废话,以及怎么把它逼出舒适区

12
许涵之
29天前
尝试过那么多 AI +定时任务的产品,从各个通用 AI 产品的定时任务(比如 ChatGPT、Manus、AnyGen),到垂直领域的产品(从最早的万物追踪到中间一个忘记名字的产品到现在的 Eimi),一直想要一个好用的,但是一直没有。

最后竟然发现,最好用的竟然就是 ChatGPT Pulse。

这本来是一个被动推荐产品,但被我加入了无数个定时任务,竟然意外地好用。更高的智能、更好的个性化,都在这里了。
11
许涵之
1月前
即便我们现在有了各种 AI 工具可以总结会议纪要,但有时候还是得人把纪要往群里发一下。

人发的纪要和 AI 发的纪要,最大的区别就是字儿少,但是能抓到重点。

目前看来,Granola 是最接近这个效果的。我现在的所有会议纪要,如果需要我再发一遍的话,我都是直接基于 Granola 去修改。我不会去看飞书或者任何其他产品的纪要,它们都没有 Granola 更接近我可以发到群里的那种水平。
30
许涵之
1月前
Looki,我愿称之为世界上第一个全天候骚扰式个人助手。

昨晚三个半小时给我推了 11 条消息,今天八个小时给我推了 20 条消息,但这些内容对我完全没有任何意义。
31