关于AI agents的碎片化思考（1） 0. 先交代

即刻App年轻人的同好社区

下载

33是小名

1年前

关于AI agents的碎片化思考（1）

0.

先交代下，非技术背景，近期在关注AI agents，有一些浅显的思考，不对的欢迎指正～

1.

关于AI Agents的定义:
行业内关于此的共识主要是来自Open ai的Lilian的那篇博文：

大语言模型作为大脑，agent有感知、规划、记忆、和使用工具的能力，能自动化实现用户复杂目标。
Auto GPT让大家看到基于大语言模型下的通用问题解决器（AGI）的潜力。

---

2.

AI Agents这个概念近期好像火了，不少公司和应用都声称自己是基于agents技术的；

倒可不必去纠结是否是真正定义上的agents，而是大家开始用这个思路去思考技术架构，思考产品了，这是好事。

---

3.

Agent相关开源框架推陈出新，Auto GPT, Meta GPT，Auto Gen, X-agent等等；

我个人会持续关注Meta GPT和Auto Gen，原因是：

（1）结构化SOP的OOD（注1）和人类监督是保证效率和质量的关键，才有可能被大规模采用。

（2）Meta GPT背后是深度赋智，全球化知名度高，聚合学术资源很强，框架持续快速迭代；在beta中的Agentstore，有完善的GUI页面，面向用户的产品呼之欲出。目前看形态和支持能力，跟MindOS相似。我小小期待下，正式推出时，可以构造多智能体协同。

（3）Auto Gen背后是微软公司，从研究成果到应用场景落地的能力强。

近期Auto GPT拿到了巨额1200万美金融资，拭目以待接下来的动作。

*注1: ODD：Operating Design Domain：设计运行域，自动驾驶中的概念，在agent中也适用——自动驾驶汽车，本身也是一个agent。

---

4.

开发架构从面向过程的开发逐步在往面向目标的开发范式转移。（注2）

面向过程的是指详细地去指令机器人(how)，以达到你想要的(what)

面向目标的是告诉机器你想要的结果（what），机器自己探索过程（how)

有意思的是：

在面向过程技术架构下的产品，用户的表达方式也是面向过程的。

比如百度搜索，大家表达的query是“产品经理简历模板”，而背后的目标是“我需要写一份适合我的简历”。

产品设计规范会定义用户的使用思维。

过去，很难做大规模的个性化生产，因为成本很大；
现在，低成本的大规模个性化生产的能力已经基本具备了。

注2: 引用于邓范鑫老师《第一性原理看agent技术》文章。

---

5.

目前看Agent-2C产品的场景主要分为：

（1）个人超级助理：

使用自然语言执行任务，如自动撰写并发送邮件、订外卖等，如Lindy, Multion等

这可能会是下一代超级入口的机会，但长期看，可能只有大模型公司才能做成。原因是：

- Agent的核心能力其实在于LLM；
- 大模型公司会把自己打造成一个超级agent调度系统，一些clues：智谱ChatGLM3.0把Agent Tunning内化到模型内；Open AI把自家3个王炸插件整合成all-tool，且可以混合使用，得益于规划和调用工具能力的增强。

（2）专业场景Co-pilot

特定场景下的提效，如编程、数据分析、写作等，如Github copilot，Julius等

---

6.
Agent to AGI时代，产品经理应该如何思考和行动？（纯就我个人而言，不构成通用建议）

（1）提升元能力

学习心理学、社会学、经济学等跟研究人及人与组织密切相关的基础学科。

从近期发的多智能体论文中，都可以看到这些基础学科跨学科的交叉。

未来的AB test，不是换种文案或按钮颜色，可能是换一种思维策略/人格。

比如在某个协作框架中，民主型领导风格和专制型领导风格，在协作效率上的差异实验。

（2）多跟研究员交朋友、多玩玩agent产品

理解前沿研究成果，思考面向目标的产品设计。

---

7.
一则硬广：

注2中邓范鑫老师在Agents42视频号直播分享了《第一性原理看agent技术》，欢迎关注查看回放～
分享大纲：
- 从大模型到智能体的技术发展串讲
- Agents的两个底层逻辑：通用智能基本原理和面向目标的架构
- Agents前瞻性分析：智能体架构仍存在的缺陷及未来可能的发展方向

Agents42是专注于推进产学研融合创新的开源社区，欢迎加入～详细介绍👉mp.weixin.qq.com

23 224

来自圈子

AI探索站

86022人已经加入