这家公司的新进展，今天（7月8日）《晚点科技》独家获悉：Pokee.ai 近期完成种子轮融资，募资额约 1200 万美元。投资人包括对冲基金 Point72 旗下风险投资机构 Point72 Ventures、芯片公司高通的风投部门 Qualcomm Ventures，以及英特尔 CEO 陈立武、前 Adobe CTO Abhay Parasnis 和前 Tinder CTO Maria Zhang。https://mp.weixin.qq.com/s/I978haQ-CUNUokiPwd3tEA?from=groupmessage&isappinstalled=0&scene=1&clicktime=1751982698&enterid=1751982698

太牛了，通过这期播客认识了Pokee，昨天也开始使用起来了，体验真的很丝滑

mp.weixin.qq.com

Bill之前在Meta的团队有很多很好的工作，但是不依赖语言模型的RL，可能在泛化能力和scaling上还没有形成共识。

Manus 并不是一个成功的好产品，而其他想做agent的创业公司也根本没有机会，因为这是大厂的菜，字节刚刚出了扣子空间，而百度也已经 launch 了安卓版的心响，苹果版的也会马上推出，还有其他大模型平台公司跃跃欲试。agent 相当消耗 token， 就像训练大模型一样，创业公司根本没机会

最近几期ai创业产品的播客都是强调强化学习了，这个是垂直领域agent的共识了嘛

记得一年多以前奥特曼曾经公开表达过一个观点，就是不要做目前Open AI的能力欠缺的事情，因为那些事情都会在未来随着大平台的升级而解决掉，他还是建议创业者多从现实世界的应用去考虑。感觉这位嘉宾做的事情就是犯了这个错误

主流 AI Agent 产品主要把（多模态）大语言模型（LLM）当“大脑”，靠一个或几个 LLM 编排工作、调用工具。

但Pokee.ai 创始人朱哲清（Bill），认为 LLM 只是 Agent 理解人类需求、向人类递交产出的“前端”，后端决策、完成任务则可以靠用强化学习方法训练的、不依赖自然语言的模型完成。

这期我们和 Bill 聊了他不一样的 Agent 造法。准确说，Pokee产品也不是直接to使用者的 Agent，而是to D 的造 Agent 的工具。

Bill 也分享了他过去十几年，从在斯坦福读博和Meta期间的 RL 研发故事，他是怎么度过“冷板凳”阶段的，为什么没转去 LLM。

本周，这个在北美的4人小团队的产品即将发布。到时可以看 RL 做 Agent 的初期效果。（有产品信息后，我们会更新在评论区～

111: Pokee.ai 朱哲清的 Agent 造法：强化学习作后端，语言模型作前端|Agent#3

晚点聊 LateTalk - 111: Pokee.ai 朱哲清的 Agent 造法：强化学习作后端，语言模型作前端

《晚点 LatePost》科技报道负责人，  同时在做播客《晚点聊 LateTalk》。

111: Pokee.ai 朱哲清的 Agent 造法：强化学习作后端，语言模型作前端|Agent#3

晚点聊 LateTalk

来自圈子

一起听播客