即刻App年轻人的同好社区
下载
App内打开
莱森LysonOber
2年前
AgentGPT 实验(消耗了我巨资 0.34 元)
🤔 什么是 AgentGPT?
👉 简而言之就是你输入一个大目标,然后 AgentGPT 会根据你的目标进行任务的拆解并执行。执行之后还会自动思考下一步任务需要做什么,以此类推。

看下面的配图,除了一开始的起点,其他部分都由 AgentGPT 自行思考推理完成。

其中最后的紫色不是指任务完成,而是代码设置了 25 轮后终止进一步思考,防止过快地消耗了 OpenAI API 的账户余额。

其中的绿色代表 AgentGPT 认为任务已经完成了,无需再向下一步推理子任务。

其中的黄色代表一些问题点,我待会儿会写;红色是一个故障节点,因为它和上面这个卡片的子任务写重复了(在这个例子中可以忽略)

另外,大家可以看到卡片连了很多线条。其实原本只是一个树状分支的思维导图,并且每个分支独立,分支之间没有连线;因此,你看到的交叉连线是我自己通过观察而主动连的线条,代表两者存在某种关联(线条上写了注视)

没写注释的线条一定写了一个数字,这个数字代表 AgentGPT 在思考过程中的执行步骤。例如「20」向右边延伸出来的卡片是思考中的第20步。(你可以观察我标注的数字来窥见 AgentGPT 的思考模式)

——————————————————

🤔 本次实验的主题:「你是2023年大三在读的学生,你碰巧遇上了ChatGPT这门产品问世。你需要抓住机会,成为这个行业的专家。」

为了分析这个思路的弱点,也为了帮助大家看清楚整个过程,遂做了个思维导图。图片看不清,所以你需要用电脑打开我的白板链接:app.heptabase.com

在整个实验中,我们可以看到 AgentGPT 作为一个大三学生的清晰思路。他不仅仅考虑到要分析该领域的领军公司和人物(联网搜索),并且还找到了潜在的优秀导师;同时,他还通过联网查找了展开行业研讨会的优质网站,并且查找了 2023 年的相关研讨信息。

不仅如此,AgentGPT 也试图提前埋下伏笔准备名片、自己可能的展示资料(也想到了PPT)和自己在和他人交流中可能提及的问题的思考。不足的是,PPT 没做出来(毕竟没实现对应的功能,并且需要PE的定向优化),以及潜在的问题清单是什么(轮数不够是原因之一)。

另外,他还给自己制定了以周为单位的学习计划,以及考虑到了学习过程中的资金问题。所以他联网调查了奖学金的相关信息和发布奖学金的时间,并试图写信来联系对方。

——————————————————

1⃣️ 缺陷一、它本身其实是一个树状图思考,分支之间没有交叉,图里的交叉线是我自己思考后画的,也就意味着每个任务推进之后得到的信息不互通,那么就会出现很多重复项目。

例如,分支 B 本来一开始是要研究行业领军人物,后来得出子任务要去找实习机会。但是分支 C 的任务本身就是找实习。

所以未来的优化方向:解决分支之间的信息沟通问题。就如同一个组织中的不同成员,总是会在某些时间节点开会来「对齐」信息。你不对齐,就会重复造轮子,也不会有更好的思考、推理和分析。

2⃣️ 缺陷二、假想推理。类似于「我要在 2023年 参加某个网络研讨会」,但是毕竟 AgentGPT 确实没办法直接跳到未来(岂不是穿越和预知未来了)(所以个别卡片被我标黄)

所以他直接脑补得到「我已经参加了xx网络研讨会,收获了很多……」之类的发言。这种脑补推理需要阻止。

(btw,同时也让我想到了 arxiv.org

3⃣️ 缺陷三、不断重复。类似于「今天学了xxx,成功完成了任务」,下一个子任务:「进一步学 xxx」,如此往复……所以虽然说 AgentGPT 看起来能够执行很多步,但是轮数变多后性能就变低了(口水话)。我觉得这个点的根因主要是缺陷一和缺陷二。缺陷一、二代表着任务的推进却带来不了反馈,没有反馈自然就不能很好地推进。这些问题不是说没用 GPT-4,你应该已经明白了~

4⃣️ 缺陷四、思维的维度太少。需要 PE 的优化 + GPT-4 这种更强大的推理能力,这样也能解决一些卡片出现内容截断过于突兀的问题。另外,记忆长度的拉长可以在根基上加强推理能力(你的每次分析可以容纳更多的上下文)。btw,我看它这个计划其实不太符合国内…所以信息源需要被优化以达到更佳的效果。
23136

来自圈子

圈子图片

AI探索站

77945人已经加入