江浩探索AI大陆的个人主页

即刻App年轻人的同好社区

下载

江浩探索AI大陆

5关注70被关注0夸夸

AI大陆探索者，专注大模型、向量数据库、RAG、智能体，开发有趣AI应用
Git：https://github.com/BushJiang

江浩探索AI大陆

4月前

AI agent框架如何选择？这有一份调研报告可供参考，对当前流行的多种AI Agent框架进行全面的调研与横向对比，助您选择最合适的工具。

AI Agent框架对比：yw.app

张海立老师在b站做了视频解读：www.bilibili.com

0 04

江浩探索AI大陆

4月前

感谢小龙邀请我参加Milvus的访谈直播，我会详细介绍如何接触到向量数据库，怎么与Milvus结缘并且参与社区活动，怎么开始创作技术科普文章，百万播放量科普视频鲁迅说没说背后的故事，如何挖掘开源社区的宝藏，后面还有哪些新的项目计划，感兴趣就来预约吧[呲牙]

直播预告丨从码农到 B 站百万播放 KOL！技术人转型传播秘籍大公开

0 00

江浩探索AI大陆

6月前

我写了篇向量数据库的实战教程（附完整代码），用Milvus实现以文搜图，比如输入一句古诗词，搜索出意境相似的图片。或者你也可以把相册里面的照片作为数据，看看哪张照片最有诗意。

大家可以猜一下，下面五组图对应的是哪首古诗词？
提示：
1. 一组图对应一句。
2. 是首元曲。
3. 诗句和图片对应得不是特别好。为什么？文中有解释。

文章链接：mp.weixin.qq.com

1 00

江浩探索AI大陆

7月前

上海人工智能实验室（minerU就是他们开发的）办了个mcp和机器学习的训练营，免费，送算力，课程内容见海报。

1 00

江浩探索AI大陆

7月前

智能体核心能力之反思（reflection）
**反思**
对于固定场景，提前设计好执行流程就可以了。但是有些场景动态变化，而且可能性很多，无法为所有可能性制定对应的方案。

这时，必须根据实时反馈动态调整下一步的行动。反思在这种动态场景中起着重要作用，系统根据反馈（比如行动的结果和外部数据）重新评估下一步行动。

比如在教学场景中，智能体根据测试结果，分析学生哪些知识点已经掌握，哪些知识点还需要巩固，而从动态调整后续教学计划。

比如，在编程场景中：
1. 让大模型生成代码。
2. 让大模型从可读性、可复用性、简洁、可扩展性等角度提出改进意见。还可以让大模型生成、运行测试用例（需要用到工具）。
3. 让大模型根据改进意见和运行结果，优化代码。
4. 重复第二和第三步，直到生成满意的代码。
5. 第二步和第三步可以使用不同的智能体。因为智能体有自己擅长的领域。

再比如，在RAG智能体中，如果检索到的结果和问题不相关，或者不够完整，就重新分解查询、再次检索。

除了动态调整行动，反思能力还能提升大模型的输出性能。主要有下面3种方案，自优化算法、reflexion框架和CRITIC框架。自优化算法只依赖大模型本身提供反馈和优化，reflexion框架增加了记忆功能，CRITIC框架则依赖外部工具提供反馈。

**自优化算法（SELF-REFINE）**
大模型在处理复杂需求时往往表现不好。比如，任务包含多个维度的目标，或者任务的目标难以界定。想要提升大模型的输出质量，可以使用特定领域的数据训练模型，但是成本很高。是否存在一种不需要额外训练模型，就可以提升输出效果的方法呢？当然，这就是自优化（SELF-REFINE）算法。

简单来说，该算法分成3个步骤：
1. 大模型根据提示词输出回答。
2. 大模型自己基于回答和反馈提示词，输出反馈。
3. 大模型再根据优化提示词、回答和反馈，输出优化后的回答。
4. 重复第2和第3步，直到达到指定的迭代次数，或者大模型判断不用再继续优化回答。

这和我们平时解决问题的过程很像。我做了一份向领导汇报的ppt（回答），发现有些地方表述不清晰（反馈），于是增加了具体数字（优化），然后继续检查、修改（重复反馈和优化），直到临近任务节点或者我认为ppt已经很完美了（结束循环）。

自优化算法效果怎么样？研究人员测试了它在7个任务（涵盖自然语言、代码生成等领域）上的表现，绝对性能比直接使用GPT-3.5和GPT4提升了5%-40%

当然，想要实现这样的性能提升，需要大模型具有足够的小样本学习能力和指令遵循能力。对于Vicuna-13B等开源小模型，性能反而衰减20%-35%。

**reflexion框架**
reflexion框架包括执行器（actor）、评估器（evaluator）、自反思模型（self-reflection）和记忆（memory）4个部分。

执行器的作用是根据提示词生成回答。

评估器评估回答得质量。它以生成的轨迹（短期记忆）为输入，计算反映上下文中性能的奖励分数。

自反思模型根据评估结果生成（稀疏奖励信号，比如二元成功状态）转化为自然语言反馈，并且结合短期记忆和长期记忆，生成优化建议。

记忆分成短期记忆和长期记忆。轨迹历史是短期记忆，自反思模型的输出是长期记忆。

reflexion框架工作流程：
1. 执行器和环境互动产生轨迹（trajectory）。
2. 评估器根据轨迹输出分数。
3. 自反思模型根据评估生成反馈，并且存储在记忆中。
4. 重复1-3步，直到评估器评估通过。

**CRITIC框架**
CRITIC（self-correcting with tool-interactive critiquing），通过与工具交互的方式实现自我纠正。

CRITIC框架的特点在于引入了外部反馈。它通过与搜索引擎、代码解释器等外部工具交互，实现交叉验证，从而改进性能。

CRITIC框架运行步骤：
1. 大模型生成回答。
2. 与外部工具交互，针对回答生成评论。
3. 基于回答和评论，纠正回答。
4. 根据收到的评论纠正输出。
5. 重复2-4步，直到满足特定的停止条件。

参考：
[Agentic Design Patterns Part 2: Reflection](www.deeplearning.ai)

[Self-Refine: Iterative Refinement with Self-Feedback | 自优化：带有自我反馈的迭代改进](arxiv.org)，Madaan et al. (2023) ；[自优化算法的网页](selfrefine.info)；[self-refine-GitHub](github.com)

[Reflexion: Language Agents with Verbal Reinforcement Learning | 反思：基于语言强化学习的语言智能体](arxiv.org)，Shinn et al. (2023)；[reflexion框架-GitHub](github.com)

[CRITIC: Large Language Models Can Self-Correct with Tool-Interactive Critiquing | 评论：大型语言模型可以通过工具交互式评论进行自我纠正](arxiv.org)，Gou et al. (2024)；[CRITIC-GitHub](github.com)

0 00

江浩探索AI大陆

7月前

5.24深圳有一场AI线下活动，有一起去的吗？内容包括向量数据库、RAG、智能文档处理等领域

微信文章

1 00

江浩探索AI大陆

7月前

智能体核心能力之规划
规划可以用来分解任务，比如把复杂的任务分解成多个简单任务，把复杂的查询分解成多个简单的子查询，以提高响应的准确性和可靠性。

对于固定场景，提前设计好代码执行的流程就可以了。但是有些场景是动态变化的，必须根据实时反馈动态调整。

除此之外，规划在动态场景中也起着重要作用。比如在教学场景中，智能体根据测试结果，分析学生哪些知识点已经掌握，哪些知识点还需要巩固，而从动态调整后续教学计划。

再举个例子，在编程场景中，智能体编写代码并且执行。然后根据反馈，比如报错信息、对代码质量的评估等等，继续调整代码。

参考：www.deeplearning.ai

0 00

江浩探索AI大陆

8月前

qwen3这么强吗，有人用过吗？感觉怎么样？

4 30

江浩探索AI大陆

8月前

智能体如何调用工具？
工具让智能体具备了执行能力，比如联网搜索、执行代码、向量搜索等。工具让智能体不再停留在“想”的层面，而是和现实世界互动。

**例子**
比如，deepseek 的“联网搜索”功能就是调用了网络搜索这个工具。

1. 识别请求
智能体识别出用户的问题属需要最新的外部信息，本地知识可能不足，因此需要联网搜索。

2. 筛选工具
在已注入的工具定义中，智能体通过启发式策略（如关键词“哪个最好”、语义匹配“推荐”）判断出`web_search`工具最合适。

此时的工具定义可能如下：
```json
[
{
"tool": "web_search",
"description": "执行互联网搜索，返回网页摘要结果",
"args": {
"query": "str"
}
}
]
```

3. 调用工具
智能体基于用户意图和工具定义，生成工具调用请求：

```json
{
"tool": "web_search",
"query": "coffee maker reviews"
}
```

随后，通过代理系统（如 LangChain 或 AutoGPT）发送请求，调用 `web_search` 工具，并获取返回的搜索内容。例如：

```
搜索结果：2024年最佳咖啡机排名前五，包括 Breville、Nespresso 和 Keurig 等品牌……
```

4. 生成回答
智能体基于用户问题与搜索结果，生成自然语言回答：

“根据最新评测，Breville 和 Nespresso 是目前口碑最好的咖啡机品牌，建议根据预算和功能需求选择。”

参考：www.deeplearning.ai

0 00

江浩探索AI大陆

8月前

使用的是免费版的 GPT-4-turbo，它有时会在问答完问题后给出一个建议，比如画一幅流程图。但是效果不咋样，比如生成的中文怪怪的

0 00