即刻App年轻人的同好社区
下载
App内打开
曼祺_火柴Q
8月前
主流 AI Agent 产品主要把(多模态)大语言模型(LLM)当“大脑”,靠一个或几个 LLM 编排工作、调用工具。

但Pokee.ai 创始人朱哲清(Bill),认为 LLM 只是 Agent 理解人类需求、向人类递交产出的“前端”,后端决策、完成任务则可以靠用强化学习方法训练的、不依赖自然语言的模型完成。

这期我们和 Bill 聊了他不一样的 Agent 造法。准确说,Pokee产品也不是直接to使用者的 Agent,而是to D 的造 Agent 的工具。

Bill 也分享了他过去十几年,从在斯坦福读博和Meta期间的 RL 研发故事,他是怎么度过“冷板凳”阶段的,为什么没转去 LLM。

本周,这个在北美的4人小团队的产品即将发布。到时可以看 RL Agent 的初期效果。(有产品信息后,我们会更新在评论区~

111: Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端|Agent#3

晚点聊 LateTalk

620

来自圈子

圈子图片

一起听播客

113715人已经加入