关于AI agents的碎片化思考(1)
0.
先交代下,非技术背景,近期在关注AI agents,有一些浅显的思考,不对的欢迎指正~
1.
关于AI Agents的定义:
行业内关于此的共识主要是来自Open ai的Lilian的那篇博文:
大语言模型作为大脑,agent有感知、规划、记忆、和使用工具的能力,能自动化实现用户复杂目标。
Auto GPT让大家看到基于大语言模型下的通用问题解决器(AGI)的潜力。
---
2.
AI Agents这个概念近期好像火了, 不少公司和应用都声称自己是基于agents技术的;
倒可不必去纠结是否是真正定义上的agents,而是大家开始用这个思路去思考技术架构,思考产品了,这是好事。
---
3.
Agent相关开源框架推陈出新,Auto GPT, Meta GPT,Auto Gen, X-agent等等;
我个人会持续关注Meta GPT和Auto Gen,原因是:
(1)结构化SOP的OOD(注1)和 人类监督 是保证效率和质量的关键,才有可能被大规模采用。
(2)Meta GPT背后是深度赋智,全球化知名度高,聚合学术资源很强,框架持续快速迭代;在beta中的Agentstore,有完善的GUI页面,面向用户的产品呼之欲出。目前看形态和支持能力,跟MindOS相似。我小小期待下,正式推出时,可以构造多智能体协同。
(3)Auto Gen背后是微软公司,从研究成果到应用场景落地的能力强。
近期Auto GPT拿到了巨额1200万美金融资,拭目以待接下来的动作。
*注1: ODD:Operating Design Domain:设计运行域,自动驾驶中的概念,在agent中也适用——自动驾驶汽车,本身也是一个agent。
---
4.
开发架构从面向过程的开发逐步在往面向目标的开发范式转移。(注2)
面向过程的是指详细地去指令机器人(how),以达到你想要的(what)
面向目标的是告诉机器你想要的结果(what),机器自己探索过程(how)
有意思的是:
在面向过程技术架构下的产品,用户的表达方式也是面向过程的。
比如百度搜索,大家表达的query是“产品经理简历模板”,而背后的目标是“我需要写一份适合我的简历”。
产品设计规范会定义用户的使用思维。
过去,很难做大规模的个性化生产,因为成本很大;
现在,低成本的大规模个性化生产的能力已经基本具备了。
注2: 引用于邓范鑫老师《第一性原理看agent技术》文章。
---
5.
目前看Agent-2C产品的场景主要分为:
(1)个人超级助理:
使用自然语言执行任务,如自动撰写并发送邮件、订外卖等,如Lindy, Multion等
这可能会是下一代超级入口的机会,但长期看,可能只有大模型公司才能做成。原因是:
- Agent的核心能力其实在于LLM;
- 大模型公司会把自己打造成一个超级agent调度系统,一些clues:智谱ChatGLM3.0把Agent Tunning内化到模型内;Open AI把自家3个王炸插件整合成all-tool,且可以混合使用,得益于规划和调用工具能力的增强。
(2)专业场景Co-pilot
特定场景下的提效,如编程、数据分析、写作等,如Github copilot,Julius等
---
6.
Agent to AGI时代,产品经理应该如何思考和行动?(纯就我个人而言,不构成通用建议)
(1)提升元能力
学习心理学、社会学、经济学等跟研究人及人与组织密切相关的基础学科。
从近期发的多智能体论文中,都可以看到这些基础学科跨学科的交叉。
未来的AB test,不是换种文案或按钮颜色,可能是换一种思维策略/人格。
比如在某个协作框架中,民主型领导风格和专制型领导风格,在协作效率上的差异实验。
(2)多跟研究员交朋友、多玩玩agent产品
理解前沿研究成果,思考面向目标的产品设计。
---
7.
一则硬广:
注2中邓范鑫老师在Agents42视频号直播分享了《第一性原理看agent技术》,欢迎关注查看回放~
分享大纲:
- 从大模型到智能体的技术发展串讲
- Agents的两个底层逻辑:通用智能基本原理和面向目标的架构
- Agents前瞻性分析:智能体架构仍存在的缺陷及未来可能的发展方向
Agents42是专注于推进产学研融合创新的开源社区,欢迎加入~详细介绍👉
mp.weixin.qq.com