主流 AI Agent 产品主要把(多模态)大语言模型(LLM)当“大脑”,靠一个或几个 LLM 编排工作、调用工具。
但Pokee.ai 创始人朱哲清(Bill),认为 LLM 只是 Agent 理解人类需求、向人类递交产出的“前端”,后端决策、完成任务则可以靠用强化学习方法训练的、不依赖自然语言的模型完成。
这期我们和 Bill 聊了他不一样的 Agent 造法。准确说,Pokee产品也不是直接to使用者的 Agent,而是to D 的造 Agent 的工具。
Bill 也分享了他过去十几年,从在斯坦福读博和Meta期间的 RL 研发故事,他是怎么度过“冷板凳”阶段的,为什么没转去 LLM。
本周,这个在北美的4人小团队的产品即将发布。到时可以看 RL 做 Agent 的初期效果。(有产品信息后,我们会更新在评论区~