和克劳德第一次讨论 AutoGPT的原理、应用案例和以及我的

即刻App年轻人的同好社区

下载

Szhans

2年前

和克劳德第一次讨论 AutoGPT的原理、应用案例和以及我的担忧

基于AutoGPT、BabyAGI 这类自动化的文本生成模型又掀起了技术讨论的狂潮；出于科普的视角，尽量深入浅出，整理出目前部分相关技术的原理和场景、案例和一些流行观点。让更多人通过多次接触和感知，切入自己理解的角度。

以下讨论，是我和Poe上的Claude+ 进行的一次长谈，稍微侧重非专业人士，如果对新技术有好奇、恐惧或深度思考的朋友，欢迎提出宝贵意见。仅供参考。

（全部提问和Prompts 一次性放出，方便你和其他模型交流；完整对话内容，见 Poe上的分享地址🔗： poe.com）

Q1：Hey ，你现在是AI专家、软件工程师、进化心理学家以及商业分析师，我们开始讨论一些新的GPT技术话题，主要是AutoGPT这个技术进展、应用，以及社会影响。目标是让更多中学生都能理解技术原理，并更好的创造（而非人云亦云）；建议语气保持轻松愉快，不要浮夸。那么，我们开始吧。首先，什么是AutoGPT？

Q2：先说个八卦，有人评价AutoGPT 是「自我进化」系统，你怎么看？

Q3：谢谢你的反驳，我是赞同的。听说AutoGPT有几大杀手级功能：
- 🌐 上网进行搜索和信息收集
- 💾 长期和短期的内存管理
- 🧠 用于文本生成的 GPT-4 实例
- 🔗 访问热门网站、平台
- 🗃️ 文件存储，用GPT-3.5进行汇总你有什么补充或者纠正吗？

Q4：是这样的，已经有了一个名为 AgentGPT的项目，直接在浏览器中尝试了AutoGPT。只要你给AI代理输入一个目标，就可以看着它思考，提出执行计划，并采取行动。这个网址是这里， agentgpt.reworkd.ai （免费试用）

Q5：知道你的「担忧」，别着急我们接着来。这个AgentGPT项目的原理，据说是，
「使用模型生成任务列表，然后迭代执行任务，评估任务是否完成或需要进一步的子操作。」项目还计划在未来结合Pinecone 矢量数据库来获得所谓的长期记忆赋予模型查询网络的能力。」我在网上看了一些AgentGPT 模拟运行的样子，确实挺吓人的，普通人看来就像它能自主思考和行动一般。你有什么补充吗？

Q6：是的，谈不上真正的智能，但是提出这个项目 Amazon工程师Asim Shrestha 也承认它目前能力有限，但他补充说，计划为正在努力为AgentGPT赋予胳膊/腿/和眼睛等能力。可以Github项目上能更多部署软件、浏览网页等

Q7：有不少技术狂热者，举了几个应用层面的例子，来说明AutoGPT 所谓“不可忽视”的商业影响：

1. 客服场景。 AutoGPT 可以理解客户的查询、提供支持，想象一下，有一个 AI 支持的代表可以 24/7 全天候为您的客户提供各种语言的帮助，满足他们的需求；

2. 社交媒体经理。AutoGPT 还可用于根据 RTs/likes 甚至销售目标管理企业的社交媒体帐户，它可以生成高质量的内容、安排帖子，甚至可以回复客户的询问；只需简单设置，就不用管了；

3. 财务顾问。投资虽然是一项艰巨的任务，但 Auto GPT 可以让它变得轻而易举。作为财务顾问，它可以分析财务数据并根据数据和顶级研究提供有关如何保持领先优势的建议。
基于以上几个场景，技术狂热者会直接得出结论，「AutoGPT 是提示工程的下一个前沿」

Q8：对于你的「冷静」， Ethan Mollick教授可能会提出挑战，他进行了一个市场模拟实验：
让AutoGPT 分析市场进行模拟，设定自己的目标。现在，人工智能很容易分心和混淆，但你可以看到它可能很快就会起作用（该系统只有一周的历史）。他发现，该系统与默认的 ChatGPT 有所不同：

- 它能通过搜索 API 连接到谷歌，并可以进行搜索
- 它与 Pincone （矢量数据库）相连，为 AI 提供某种长期记忆
- 它可以阅读网站，如果信息太长，它会将信息分成块
- 它可以创建文件
不过， Mollick教授也补充，说我很多推文将这项技术推销为一种“会自动让你赚钱”或类似炒作的人工智能。值得警惕的是，这种方法看起来非常有前途，但他的早期实验表明，今天它更像是原型而不是神奇的工具。（图2、图3）

Q9：赞同，当有人说，“ChatGPT feels like old school” “新时代有来了”时候，我们要保持批判和独立思考😌我们接着讨论另外一个案例和场景，「AI 代理做产品调研研究」：开发者Zahid 经营了一个AI代理，让其复杂产品调研并撰写有关最佳耳机的摘要。（图4）

Q10：我们再聊聊 BabyAGI 这个开源项目，很多AutoGPT的项目是基于其之上的，作者 Yohei称之为“任务驱动的自治代理”。即：利用GPT-4、Pinecone（矢量数据库、向量搜索）和LangChain框架，根据目标自主创建和执行任务的代理。具体展开说，包含这些方面：

- 系统可以完成任务，根据结果生成新任务，并实时确定任务的优先级。它展示了人工智能语言模型在各种约束和上下文中自主执行任务的潜力。
- 自治代理使用 GPT-4 完成任务，Pinecone 用于高效搜索和存储任务相关数据，以及 LangChain 框架来增强决策过程。
- 系统维护一个任务列表，用于管理任务和确定任务的优先级。它根据完成的结果自主创建新任务，并相应地重新排列任务列表的优先级，展示了 AI 驱动的语言模型的适应性。
- 为了完成任务，系统使用了GPT-4和LangChain的能力，将结果丰富并存储在Pinecone中。这种集成方法允许 AI 代理与其环境交互并有效地执行任务。
- 系统根据完成的任务结果生成新任务，并使用 GPT-4 对它们进行优先级排序。这允许系统适应和响应新的信息和优先级。
- 未来的改进包括集成安全代理、任务排序和并行任务、生成临时里程碑以及合并实时优先级更新。
- 这种新方法为 AI 驱动的语言模型在各种约束和上下文中自主执行任务铺平了道路，从而实现了新的应用程序和机会。
（图5、图6）

Q11：你指出的问题，还蛮到位的。语言模型对知识理解确实还相当「局限」，这不是所谓增加了「记忆和决策」框架就能实现全能的自动化。不过，Slack工程师Frank，将BabyAGI 部署到了Slack上，让人类输入自然语言目标，例如， BabyAGI 请解决世界饥饿问题。然后，人类就能看着Slack的线程内， BabyAGI可以一步步分解任务，还是相当有趣的。你懂的，人类擅长幻想～（图7）

Q12：还有一个更贴近普通人的案例也很有趣，让GPT代理阅读近期新闻，并准备播客大纲。

Jamesbbaker4的做法是，通过 5 次搜索（和 15 次网络浏览），Auto GPT 研究代理准备了一个关于最近新闻的 5 主题播客，并提供准确的参考资料。研究代理通过谷歌搜索、 Pinecone、多代理反馈和增量草稿改进持续学习。最终输出一份颇有参考意义的播客大纲。
（图8、图9）

Q12：还有更多应用场景，因此，现在Github上，有三个超级快速上升的开源项目， BabyAGI、AutoGPT以及 Jarvis 都可以被认为是自我提示类项目，这让AI 和软件行业有关参与者和观察员都为之沸腾，甚至称它们为 primate AGI projects（灵长类AGI项目），你怎么看？

Q13：谢谢你的「理性建议」，至少表现的比诸多言论要客观一些；我想对任何新巨大的技术，至少应该保持两点清醒的认识： 1. 亲自去了解或尝试，不要人云亦云；2. 找到真正有成本的信号或者智者，借助他们的发现，进行批判性思考。我们第一次AutoGPT的交流先进行到这里吧，回头再聊。

Enjoy！

90 1752

来自圈子

AI探索站

86027人已经加入