即刻App年轻人的同好社区
下载
App内打开
boyazuo
94关注34被关注0夸夸
程序员|创业者
关注 AI 领域|出海产品
会分享 AI 使用经验技巧,欢迎关注交流。
boyazuo
8月前
云行 AI 开发周刊 - 第 11 期

## 开源推荐
1. Awesome LLM Apps
地址: github.com

一个精心整理的采用 RAG、AI 智能体、多智能体团队、MCP、语音代理等技术构建的精选 LLM 应用集合。本仓库收录了使用 OpenAI、Anthropic、Google 等商业模型及 DeepSeek、Qwen 或 Llama 等可在本地运行的开源模型的 LLM 应用案例。

2. Claude-Flow
地址: github.com

Claude-Flow v2.0.0 Alpha 代表了人工智能驱动开发编排的革命性飞跃。它从零开始构建,具有企业级架构、先进的群体智能和无缝的 Claude Code 集成。

3. Claude Code UI
地址: github.com

为Claude Code打造的桌面和移动界面,让AI辅助编程更便捷。

4. ChatWiki
地址: github.com

开箱即用的基于企业私有知识库的LLM大语言模型的智能客服机器人问答系统,支持私有化部署,代码免费开源且可商用,由芝麻小客服官方推出。

5. NextChat
地址: github.com

一键免费部署你的私人 ChatGPT 网页应用,支持 Claude, GPT4 & Gemini Pro 模型。

6. DocsGPT
地址: github.com

DocsGPT 是一个超级聪明的资料管理员 + AI 小助理的结合体。它的核心任务就是:只从你指定的知识库(比如你上传的文件、公司文档、网页内容等)里查找信息,然后结合 AI 的能力,给你一个准确、可靠的回答,并且明确告诉你答案是从哪里来的。

7. Label Studio
地址: github.com

Label Studio 是一款开源数据标注工具。它允许您通过简洁直观的界面标注音频、文本、图像、视频和时序数据,并导出至多种模型格式。它可用于准备原始数据或改进现有训练数据,以获得更准确的机器学习模型。
00
boyazuo
9月前
云行 AI 开发周刊 - 第 10 期

## 云行AI

最近在项目中使用了 MyBatis-flex,与 MyBatisPlus 相比,flex 主要优势在于支持多表关联查询。它不仅能自动映射,还支持手动关联查询,既灵活又性能极佳。后续计划抽时间将项目中的 plus 替换为 flex。

## 开源推荐

1. Trae Agent
地址: github.com

Trae Agent 是一个基于 LLM 通用软件工程任务的代理。它提供了一个强大的 CLI 界面,可以理解自然语言指令,并使用各种工具和 LLM 提供商执行复杂的软件工程工作流。

2. WebAgent
地址: github.com

阿里开源,专门执行复杂信息搜索的WebAgent,WebSailor-72B版本目前是开源最佳Web Agent,能力接近豆包Search。

3. OmniAvatar
地址: github.com

音频驱动生成虚拟人视频,基于Wan 2.1模型,通过音频生成虚拟人说话视频,嘴型匹配,有表情有动作。

4. OCRFlux
地址: github.com

OCRFlux 是一个多模态大型语言模型工具包,用于将 PDF 和图像转换为干净、易读的纯 Markdown 文本。它旨在将当前最先进的技术水平提升到一个显著更高的层次。

5. ThinkSound
地址: github.com

ThinkSound 是一个统一的 Any2Audio 生成框架,通过链式思维(Chain-of-Thought, CoT)推理进行流匹配指导。

基于 PyTorch 的多模态音频生成与编辑实现:可基于视频、文本、音频及其组合,生成或编辑音频,底层由多模态大语言模型(MLLMs)逐步推理驱动。

6. Hands-On Large Language Models
地址: github.com

O'Reilly 书籍《Hands-On Large Language Models》的官方代码库,旨在帮助读者动手实践和深入理解大型语言模型。

7. GenAI Agents
地址: github.com

当今最广泛和最具活力的生成式人工智能(GenAI)代理教程和实现集合之一。这个资源库是一个全面的学习、构建和分享 GenAI 代理的资源,从简单的对话机器人到复杂的、多代理系统。

8. MCP Toolbox for Databases
地址: github.com

数据库 MCP 工具箱是一个开源的数据库 MCP 服务器。它通过处理连接池、身份验证等复杂问题,使您能够更轻松、更快、更安全地开发工具。

9. Machine Learning for Beginners
地址: github.com

微软开源,面向所有人的经典机器学习入门课程 (ML-For-Beginners)。
00
boyazuo
9月前
云行 AI 开发周刊 - 第 9 期

## 云行AI

最近有很多事情要忙,云行 AI 的优化完善工作也需要持续一段时间。希望在这个月内能将现在的版本做得更加完善。

近期,Claude Code 备受关注,其能力可与 Cursor 相媲美。目前也有很多相关的开源项目,感兴趣的朋友可以研究尝试。

## 开源推荐

1. Directories
地址: github.com

为Cursor和Windsurf开发者提供规则和提示的社区平台。

2. Onlook
地址: github.com

使用 AI 在 Next.js + TailwindCSS 中构建网站、原型和设计。通过可视化编辑器直接在浏览器 DOM 中进行编辑。实时用代码进行设计。这是 Bolt.new、Lovable、V0、Replit Agent、Figma Make、Webflow 等的开源替代方案。

3. awesome-claude-code
地址: github.com

这是一个精选的斜杠命令、CLAUDE.md 文件、CLI 工具以及其他资源和指南列表,旨在提升您的 Claude Code 工作流程、生产力和使用体验。

4. Claudia
地址: github.com

Claudia 是一款强大的桌面应用程序,它改变了你与 Claude Code 的交互方式。使用 Tauri 2 构建,它为管理你的 Claude Code 会话、创建自定义代理、跟踪使用情况等提供了美观的 GUI。

将 Claudia 视为您的 Claude Code 命令中心——它弥合了命令行工具与可视化体验之间的差距,使 AI 辅助开发更加直观和高效。

5. autoMate
地址: github.com

autoMate 是一款革命性的AI+RPA自动化工具,基于OmniParser构建,它能够

• 📊 理解您的需求,自动进行任务规划
• 🔍 智能理解屏幕内容,模拟人类视觉和操作
• 🧠 自主决策,根据任务需求进行判断并采取行动
• 💻 支持本地化部署,保护您的数据安全和隐私
• MultiAgentPPT
地址: github.com

一个基于 A2A + MCP + ADK 的多智能体系统,支持流式并发生成高质量 (可在线编辑)PPT 内容。

6. Spy Search
地址: github.com

Spy Search 是一个智能搜索框架,旨在提供比现有网页搜索代理更快速高效的日常搜索体验。

7. Speakr
地址: github.com

Speakr 是一款个人自托管网络应用程序,用于转录音频录音(如会议),生成简洁的摘要和标题,并通过聊天界面与内容互动。将您的会议笔记和见解安全地保存在您自己的服务器上。

8. Next.js SaaS Starter Kit
地址: github.com

一个全面的、生产就绪的 SaaS 启动套件,使用 Next.js 15 构建,具有认证、订阅、AI 集成和现代 UI 组件。
01
boyazuo
9月前
云行 AI 开发周刊 - 第 8 期

## 云行 AI
云行 AI 后端使用 SpringBoot 框架开发,其中 SpringBoot 的 IoC 容器管理非常便捷。然而,如果没有合理规划架构和依赖,IoC 也会给系统埋下诸多隐患。IoC 默认采用单例模式实例化并管理对象,这容易导致习惯使用依赖管理的开发者将有状态的对象也放入 IoC 容器中,从而埋下安全隐患。此外,当架构层次不清晰时,复杂项目很容易出现依赖混乱、循环依赖等问题。

因此,我们对云行 AI 后端框架进行了进一步重构优化。所有工具类都重构为静态工具类,不再参与 IoC 管理。对于有状态的实例或需要参数配置的对象,则采用 Builder 模式灵活构建,同样不参与 IoC 管理。这些改进使整体代码更加简洁,结构也更加清晰了。

## 开源推荐
1. Claude Code
地址: github.com

Claude Code 是一个智能编码工具,它存在于你的终端中,理解你的代码库,并通过执行常规任务、解释复杂代码和处理 git 工作流程,帮助你更快地编码——所有这些都可以通过自然语言命令完成。

2. Gemini CLI
地址: github.com

Gemini CLI 是基于Google Gemini 的对标 Claude code 和 Cursor 的开源命令行AI工具,主要用于在终端中快速查询、编辑大型代码库,自动化开发和运维任务。它支持多模态输入,能生成代码、处理文档,还能集成搜索和多种扩展工具,提升开发效率。

3. Tersa
地址: github.com

Tersa 是一个开源的画布,用于构建 AI 工作流。拖放、连接并运行节点来构建您自己的由各种行业领先 AI 模型提供支持的工作流。

4. Pickaxe
地址: github.com

Pickaxe 是一个简单的 TypeScript 库,用于构建具有容错性和可扩展性的 AI 代理。

5. Twocast
地址: github.com

真人对话AI播客生成器,多语言,多音色。

6. Dual AI Chat
地址: github.com

一个先进的聊天应用,演示了一种独特的对话范式:用户的查询首先由两个不同的人工智能角色进行辩论和提炼,然后才提供最终的综合答案。该项目利用 Google Gemini API 驱动一个逻辑型 AI (Cognito) 和一个怀疑型 AI (Muse),它们协作生成更健壮、准确和经过严格审查的响应。

7. DPanel
地址: github.com

Docker 可视化面板系统,提供完善的 docker 管理功能。

##云行 AI 开源地址
Github:github.com
Gitee:gitee.com
欢迎关注。
00
boyazuo
9月前
云行 AI 开发周刊 - 第 7 期

## 云行 AI

目前,云行 AI 基于知识库的对话功能已经开发完成。为了便于后期扩展优化,我们需要持续调整代码架构和封装。从这个过程中可以看出,Java 在对象封装方面比 Python 要复杂得多。Java 需要考虑合理的封装、层级和参数配置等多个方面,而 Python 则更加简洁直接,没有那么多对象封装和嵌套层级的考虑。

由于近期还有其他工作需要处理,预计现有代码的优化和完善工作将持续两周左右。

## 开源推荐

1. PandaWiki
地址: github.com

PandaWiki 是一款 AI 大模型驱动的开源知识库搭建系统,帮助你快速构建智能化的 产品文档、技术文档、FAQ、博客系统,借助大模型的力量为你提供 AI 创作、AI 问答、AI 搜索 等能力。

2. MetaMCP
地址: github.com

MetaMCP 是统一中间件 MCP,用于管理所有你的 MCP。

3. Nano-vLLM
地址: github.com

从零构建的轻量级 vLLM 实现。

4. Zen MCP
地址: github.com

Claude 的终极开发伙伴——一个模型上下文协议服务器,它让 Claude 能够访问多个 AI 模型,以增强代码分析、问题解决和协作开发。

5. graph-rag-agent
地址: github.com

本项目聚焦于结合 GraphRAG 与 私域 Deep Search 的方式,实现可解释、可推理的智能问答系统,同时结合多 Agent 协作与知识图谱增强,构建完整的 RAG 智能交互解决方案。

6. Agents Towards Production
地址: github.com

面向生产的智能体是你构建可扩展 GenAI 智能体的首选资源——从零到生产。

无论你是刚刚起步还是优化你的部署栈,这个仓库都为你提供了正确的工具、模式和代码示例。

## 云行 AI 开源地址
Github:github.com
Gitee:gitee.com
欢迎关注。
00
boyazuo
10月前
云行 AI 开发周刊 - 第 6 期

## 云行 AI
云行 AI 近期在持续完善和优化功能细节,为第一个版本的正式发布做准备。对于正式用户版本,我们将进一步开发用户功能与积分系统,同时完善官网和在线文档。

近期 MCP 服务十分热门,涌现出许多优质的 MCP 开源项目。 这些项目涵盖了从基础工具到企业级解决方案的多个层面,展现了 MCP 生态系统的蓬勃发展。让我们一起来看看这些优秀的开源项目。

## 开源推荐
1. Bagel
地址: bagel-ai.org

一个开源的统一多模态模型 BAGEL,基于图片的聊天对话、编辑、改写、文生图、风格转换、图片变换方向等 AI 能力,说是和 GPT-4o、Gemini 2.0 的能力相当。

2. OpenAiTx
地址: github.com

OpenAiTx 会为您的 GitHub 项目自动生成 20 种语言的翻译版 README,您只需要将项目 URL 中的 GitHub 替换为 OpenAiTx,例如:github.com => openaitx.com

• ask-human mcp
地址: github.com

让AI不再“瞎猜”,为困惑的Agent提供“求助”通道,避免错误假设带来的调试困扰。

• Spotify MCP Server
地址: github.com

一个轻量级 MCP 服务器,使 Cursor & Claude 等 AI 助手能够控制 Spotify 播放并管理播放列表。

3. MCP 虾米任务管理器
地址: github.com

虾米任务管理器通过结构化的工作流程引导,协助 Agent 系统性规划程序开发步骤,强化任务记忆管理机制,有效避免冗余与重复的编程工作。

4. MCP Gateway
地址: github.com

为企业级AI应用提供强大的Model Context Protocol (MCP) 网关解决方案。核心价值在于将REST API转换为MCP协议,实现工具、资源和提示的集中管理,并支持多种传输协议和身份验证机制。

5. Mermaid-AI-Diagram-Generator
地址: github.com

一个基于人工智能的图表生成器,用于创建流程图、序列图等。

6. 文颜 MCP Server
地址: github.com

文颜 MCP Server 是一个基于模型上下文协议(Model Context Protocol, MCP)的服务器组件,支持将 Markdown 格式的文章发布至微信公众号草稿箱,并使用与文颜相同的主题系统进行排版。

7. Chrome MCP Server
地址: github.com

Chrome MCP Server 是一个基于chrome插件的 模型上下文协议 (MCP) 服务器,它将您的 Chrome 浏览器功能暴露给 Claude 等 AI 助手,实现复杂的浏览器自动化、内容分析和语义搜索等。

## 云行 AI 开源地址
Github:github.com
Gitee:gitee.com
欢迎关注。
00
boyazuo
10月前
云行 AI 开发日记 - 14. 把简单留给用户:顶级开发者都在遵循的设计哲学

在架构设计的三个原则中,我曾提到简洁原则。这一原则不仅适用于架构设计,也适用于产品设计。然而,简单并非意味着采用最简单的开发方式(这正是当今许多软件的问题所在)。相反,我们应该把简单留给用户,把复杂留给开发。

对用户来说,简单不是功能的缺失,而是精心设计的结果。产品的简单性需要在多个维度上精心打磨,它主要体现在以下几个方面:

• 视觉层面: 界面应清晰直观,使用统一的设计语言,保持视觉元素的一致性。关键信息要突出显示,减少干扰元素,让用户能一眼理解产品功能和使用方法。
• 交互层面: 操作流程应当流畅自然,及时给予反馈。预设合理的选项,减少用户操作,如果一项操作能用两步完成,就不该设计成三步。设计要符合用户的使用习惯,最大限度降低学习成本。
• 功能层面: 专注于核心需求,避免过度堆砌功能。太多软件过分追求功能数量,却忽视了真正的用户需求。软件的本质是服务需求,而不是盲目地添加功能。
对于开发者,要尽可能的实现用户的“简单”,承担相应的“复杂”,产品开发要在这些方面做更多的工作:

• 深入理解用户: 了解用户的真实需求、使用场景和操作习惯,避免闭门造车。要不断地从用户视角思考产品的逻辑,不断地优化界面展示和交互体验。
• 优化业务流程: 反复思考并分析分析产品的业务逻辑。用户提出的业务流程往往不是最佳方案,开发者需要深入理解用户需求,设计出更合理的程序逻辑。
• 保证系统稳定性: 软件的稳定性是用户体验的关键。我们必须编写高质量、易维护的代码,以确保软件的稳定性和性能表现,并最大限度地减少故障发生的可能。
• 持续测试和反馈: 通过用户测试和数据分析,不断发现问题并改进优化。
“把简单留给用户,把复杂留给自己”,这不仅仅是一种设计原则,更是一种服务用户的态度。只有真正理解用户,尊重用户,才能设计出卓越的产品。

云行 AI 开源地址
Github:github.com
Gitee:gitee.com
欢迎关注。
00
boyazuo
10月前
云行 AI 开发周刊 - 第5期

## 云行AI

云行 AI 已实现知识库的创建和动态维护功能,可以管理所有知识内容及其分段。用户只需在应用配置中关联知识库,即可开展基于知识库的智能问答对话。目前第一期开发计划中的基本功能已经完成。下一步将着重优化和完善现有功能,扩展支持更多文档类型和分割处理方法,并对接更多大模型。同时,我们也将持续提升系统的稳定性和交互体验。

## 开源推荐

1. Happy-LLM
地址: github.com

一个系统性的 LLM 学习教程,将从 NLP 的基本研究方法出发,根据 LLM 的思路及原理逐层深入,依次为读者剖析 LLM 的架构基础和训练过程。同时,我们会结合目前 LLM 领域最主流的代码框架,演练如何亲手搭建、训练一个 LLM,期以实现授之以鱼,更授之以渔。

2. LLM course
地址: github.com

一站式学习大型语言模型(LLM)的免费课程。课程包含三个模块:LLM 基础介绍数学、Python 和神经网络的基础知识;LLM 科学家讲解如何运用前沿技术打造优质的 LLM;LLM 工程师着重于开发和部署基于 LLM 的应用。

3. AI System
地址: github.com

AI 大模型的开源课程,本课程主要为本科生高年级、硕博研究生、AI 系统从业者设计,帮助大家:完整了解 AI 的计算机系统架构,并通过实际问题和案例,来了解 AI 完整生命周期下的系统设计;介绍前沿系统架构和 AI 相结合的研究工作,了解主流框架、平台和工具来了解 AI 系统。

4. Dify-Workflow-DSL-Examples
地址: github.com

基于Dify自主创建的AI应用DSL工作流,你可以免费获取,无论是出于个人需求还是学习目的,它都能为您开启一段充满无限可能的智能之旅。

5. VERT
地址: github.com

下一代文件转换器。开源,完全本地,永远免费。

6. ChatGPT Adapter
地址: github.com

集成了openai-api、coze、deepseek、cursor、windsurf、qodo、blackbox、you、grok、bing 绘画 多款AI的聊天逆向接口适配到 OpenAI API 标准接口服务端。

7. Quarkdown
地址: github.com

Quarkdown 是一个基于 Markdown 的现代排版系统,围绕通用性这一核心概念设计,能够无缝地将项目编译成印刷就绪的书籍或交互式演示文稿。

8. NoteGen
地址: github.com

NoteGen 是一款跨端的 Markdown 笔记应用,致力于使用 AI 建立记录和写作的桥梁,将碎片化知识整理成一篇可读的笔记。

## 云行 AI 开源地址
Github:github.com
Gitee:gitee.com
00
boyazuo
10月前
云行 AI 开发日记 - 13. .gitignore 使用指南

在使用Git进行版本控制时,.gitignore文件是一个非常重要且实用的配置文件。它的作用是告诉Git哪些文件或文件夹不需要被提交到版本库中,从而避免将一些不必要或敏感的文件上传,保持仓库的整洁和安全。本文将详细介绍.gitignore的作用、配置方法、常用语法及使用中的注意事项,帮助你高效管理Git项目。

一、什么是.gitignore文件?
.gitignore是Git项目根目录下的一个文本文件,用于定义需要被Git忽略的文件和目录。凡是写在该文件中的规则,Git在执行git add时会自动忽略这些文件,不会将它们纳入版本控制。

为什么需要.gitignore?

• 编译生成的中间文件(如Java的.class文件、C/C++的.o文件)不需要提交,因为它们可以由源代码重新生成。
• 操作系统自动生成的文件(如Windows的Thumbs.db、macOS的.DS_Store)无意义且杂乱。
• 包含敏感信息的配置文件(如密码、密钥)不宜上传。
• 大型二进制文件或临时文件会占用仓库空间,影响性能。

简单来说,.gitignore帮助我们排除不必要的文件,只将真正重要的源代码和资源提交到仓库中。

二、如何创建和配置.gitignore文件?
1. 在Git项目的根目录新建一个名为.gitignore的文件。
2. 在文件中写入你想忽略的文件名、目录或匹配规则。
3. 保存后提交.gitignore文件本身到仓库,以便团队成员共享忽略规则。
你不必从零开始写规则,GitHub官方维护了一个丰富的.gitignore模板库,涵盖各种编程语言和框架,地址:github.com 。你可以直接复制对应语言的模板内容到你的.gitignore中使用。

三、.gitignore文件的常用语法
• 注释:以#开头的行为注释行,Git会忽略。
例如: # 忽略所有日志文件

• 忽略文件:直接写文件名或使用通配符。
例如: *.log 忽略所有.log文件

• 忽略目录:目录名后加斜杠/表示忽略整个目录。
例如:build/ 忽略build目录及其所有内容

• 通配符匹配:
• * 匹配任意多个字符
• ? 匹配单个字符
• [abc] 匹配括号内任意一个字符
• ** 匹配任意目录层级
• 否定规则:以!开头表示排除某个文件或目录,不被忽略。
例如:

*.class
!App.class
表示忽略所有.class文件,但App.class除外,仍被跟踪提交。

四、使用.gitignore避免泄露本地配置的示例
项目中经常有一些本地配置文件包含敏感信息,如数据库连接字符串、API密钥、密码等,这些文件不应上传到远程仓库。使用.gitignore可以有效避免这些敏感信息被泄露。

假设项目中有如下配置文件:

• config.ini:存储数据库用户名和密码
• .env:环境变量文件,包含私密密钥
• config.local:本地开发专用配置文件
你可以在.gitignore中添加:

# 忽略配置文件,防止敏感信息泄露
config.ini
.env
config.local
!config.local.example # 保留一个示例配置文件,方便他人参考

这样,当你执行git add .时,这些文件不会被添加到版本库,也不会推送到远程仓库。如果项目中其他人需要参考配置文件时,复制 example 文件修改就可以了。

五、使用中的注意事项
• .gitignore只对未跟踪文件生效,如果某文件已经被Git跟踪,再修改.gitignore不会自动忽略它。此时需要先用git rm --cached 文件名将其从版本库中移除,再提交,才能生效。
• 在项目开始阶段就创建并配置好.gitignore,避免后期处理已提交的无用文件带来麻烦。

掌握.gitignore的使用,是每个开发者高效使用Git的必备技能。希望本文能帮助你快速上手.gitignore,提升版本管理体验。
00
boyazuo
10月前
云行 AI 开发周刊 - 第 4 期

## 云行 AI

对模型调用的封装是云行 AI 项目的第一个挑战。本周我们继续优化了框架的封装,目前架构已经相当完善。整体 AI 大模型调用架构分为四层:底层是各大模型提供商的原生 API 封装;上层是对这些原生 API 的通用封装,包含 ChatModel、EmbeddingModel 等核心接口。由于业务需要协调和配置各个模型,我们在 ChatModel 之上又封装了一层 ChatClient,负责模型的协调与配置。这样,业务层只需提供基本参数调用 ChatClient 即可。总的来说,这个架构符合预期设想,结构清晰,易于扩展,调用简单。

详细内容将在后续的开发日记中介绍。

我比较关注 AI 领域的项目和产品,因此本周刊的开源推荐以 AI 项目为主。这些都是近期看到的的优质项目,欢迎感兴趣的读者关注,我会持续更新推荐。

## 开源推荐

1. AgenticSeek
地址: github.com

一个 100% 本地替代 Manus AI 的方案,这款支持语音的 AI 助理能够自主浏览网页、编写代码和规划任务,同时将所有数据保留在您的设备上。专为本地推理模型量身打造,完全在您自己的硬件上运行,确保完全的隐私保护和零云端依赖。

2. n8n
地址: github.com

n8n 是一款带有 AI 能力的工作流程自动化工具,提供了多步骤 AI 代理集成和超过 500 个集成工具的能力,开发者可以自定义想要使用的功能和应用程序。

3. AingDesk
地址: github.com

AingDesk是一款简单好用的AI助手,支持知识库、模型API、分享、联网搜索、智能体,它还在飞快成长中。

4. Magentic-UI
地址: github.com

微软出品,一个由多智能体系统驱动的、以人为中心的界面研究原型,能够浏览和执行网页操作、生成和执行代码,以及生成和分析文件。

5. IDEA 系列激活
地址: github.com

只需点击一次,自动激活。

6. PDF2MD
地址: github.com

PDF2MD是一个高效的PDF到Markdown转换工具,旨在帮助用户轻松将PDF文档转换为Markdown格式,便于编辑、分享和发布。通过简洁易用的界面和强大的转换功能,PDF2MD成为内容创作者、研究人员和开发者的得力助手。

7. Gemini Image App
地址: github.com

一个现代化的全栈 AI 图像处理平台,集成了 Google Gemini、OpenCV 和 YOLO 等先进技术,提供图像问答、生成、编辑、目标检测、图像分割和视频生成等功能。

8. Vanna
地址: github.com

Vanna 是一个基于 MIT 许可的开源 Python RAG(检索增强生成)框架,用于 SQL 生成及相关功能。

9. Opik
地址: github.com

Opik 帮助您构建、评估和优化 LLM 系统,使其运行得更好、更快、更经济。从 RAG 聊天机器人到代码助手,再到复杂的智能体管道,Opik 提供全面的跟踪、评估、仪表板,以及诸如 Opik Agent Optimizer 和 Opik Guardrails 等强大功能,以改进并保护生产环境中的 LLM 驱动应用。

10. Second Me
地址: github.com

轻松定制你的本地 AI 数字分身。该项目是专注于用个人数据训练 AI 的平台,致力于帮助每个人构建、训练并拥有属于自己的本地 AI 数字分身。它采用分层记忆建模(HMM)和 Me-Alignment 算法,将你的知识、兴趣和偏好融入 AI,打造更懂你的 AI 助手。

11. Chatterbox TTS
地址: github.com

顶尖开源语音合成

12. Smart Mermaid
地址: github.com

Smart Mermaid 是一款利用人工智能技术,将您的文本描述智能转换为 Mermaid 格式图表代码,并实时渲染成可视化图表的 Web 应用。无论是流程图、序列图、甘特图还是状态图,只需输入文本,AI 即可为您生成相应的图表。

13. Ainee
地址: github.com

AI 开源笔记工具,将音频、文字、文件以及 YouTube 视频等转换为笔记。

## 云行 AI 开源地址
Github:github.com
Gitee:gitee.com
00