AgentGPT 实验（消耗了我巨资 0.34 元） 🤔

即刻App年轻人的同好社区

下载

莱森LysonOber

2年前

AgentGPT 实验（消耗了我巨资 0.34 元）
🤔 什么是 AgentGPT？
👉 简而言之就是你输入一个大目标，然后 AgentGPT 会根据你的目标进行任务的拆解并执行。执行之后还会自动思考下一步任务需要做什么，以此类推。

看下面的配图，除了一开始的起点，其他部分都由 AgentGPT 自行思考推理完成。

其中最后的紫色不是指任务完成，而是代码设置了 25 轮后终止进一步思考，防止过快地消耗了 OpenAI API 的账户余额。

其中的绿色代表 AgentGPT 认为任务已经完成了，无需再向下一步推理子任务。

其中的黄色代表一些问题点，我待会儿会写；红色是一个故障节点，因为它和上面这个卡片的子任务写重复了（在这个例子中可以忽略）

另外，大家可以看到卡片连了很多线条。其实原本只是一个树状分支的思维导图，并且每个分支独立，分支之间没有连线；因此，你看到的交叉连线是我自己通过观察而主动连的线条，代表两者存在某种关联（线条上写了注视）

没写注释的线条一定写了一个数字，这个数字代表 AgentGPT 在思考过程中的执行步骤。例如「20」向右边延伸出来的卡片是思考中的第20步。（你可以观察我标注的数字来窥见 AgentGPT 的思考模式）

——————————————————

🤔 本次实验的主题：「你是2023年大三在读的学生，你碰巧遇上了ChatGPT这门产品问世。你需要抓住机会，成为这个行业的专家。」

为了分析这个思路的弱点，也为了帮助大家看清楚整个过程，遂做了个思维导图。图片看不清，所以你需要用电脑打开我的白板链接：app.heptabase.com

在整个实验中，我们可以看到 AgentGPT 作为一个大三学生的清晰思路。他不仅仅考虑到要分析该领域的领军公司和人物（联网搜索），并且还找到了潜在的优秀导师；同时，他还通过联网查找了展开行业研讨会的优质网站，并且查找了 2023 年的相关研讨信息。

不仅如此，AgentGPT 也试图提前埋下伏笔准备名片、自己可能的展示资料（也想到了PPT）和自己在和他人交流中可能提及的问题的思考。不足的是，PPT 没做出来（毕竟没实现对应的功能，并且需要PE的定向优化），以及潜在的问题清单是什么（轮数不够是原因之一）。

另外，他还给自己制定了以周为单位的学习计划，以及考虑到了学习过程中的资金问题。所以他联网调查了奖学金的相关信息和发布奖学金的时间，并试图写信来联系对方。

——————————————————

1⃣️ 缺陷一、它本身其实是一个树状图思考，分支之间没有交叉，图里的交叉线是我自己思考后画的，也就意味着每个任务推进之后得到的信息不互通，那么就会出现很多重复项目。

例如，分支 B 本来一开始是要研究行业领军人物，后来得出子任务要去找实习机会。但是分支 C 的任务本身就是找实习。

所以未来的优化方向：解决分支之间的信息沟通问题。就如同一个组织中的不同成员，总是会在某些时间节点开会来「对齐」信息。你不对齐，就会重复造轮子，也不会有更好的思考、推理和分析。

2⃣️ 缺陷二、假想推理。类似于「我要在 2023年参加某个网络研讨会」，但是毕竟 AgentGPT 确实没办法直接跳到未来（岂不是穿越和预知未来了）（所以个别卡片被我标黄）

所以他直接脑补得到「我已经参加了xx网络研讨会，收获了很多……」之类的发言。这种脑补推理需要阻止。

（btw，同时也让我想到了 arxiv.org）

3⃣️ 缺陷三、不断重复。类似于「今天学了xxx，成功完成了任务」，下一个子任务：「进一步学 xxx」，如此往复……所以虽然说 AgentGPT 看起来能够执行很多步，但是轮数变多后性能就变低了（口水话）。我觉得这个点的根因主要是缺陷一和缺陷二。缺陷一、二代表着任务的推进却带来不了反馈，没有反馈自然就不能很好地推进。这些问题不是说没用 GPT-4，你应该已经明白了～

4⃣️ 缺陷四、思维的维度太少。需要 PE 的优化 + GPT-4 这种更强大的推理能力，这样也能解决一些卡片出现内容截断过于突兀的问题。另外，记忆长度的拉长可以在根基上加强推理能力（你的每次分析可以容纳更多的上下文）。btw，我看它这个计划其实不太符合国内…所以信息源需要被优化以达到更佳的效果。

218 23136

来自圈子

AI探索站

77945人已经加入