即刻App年轻人的同好社区
下载
App内打开
ai好未来
158关注0被关注0夸夸
ai好未来
2月前

出海去孵化器: 这绝对是我见过最清晰、最实用的 AI 工具列表了,用好他们能省下大把时间! 日常助手 1. Perplexity:AI 搜索引擎和研究助手 2. Claude:通用聊天机器人,超适合做项目和分享成果 3. ChatGPT:记得开启高级语音模式,直接和 AI 对话 效率工具 1. Granola:AI 会议笔记工具,自动生成摘要 2. Wispr Flow:语音转文字工具,在任何应用里把说的话变成文本 3. Gamma:用 AI 快速制作演示稿、文档和网站 4. Adobe:和 PDF 对话,还能自动总结内容 5. Cubby:协作研究专用的 AI 工作空间 6. Cora:AI 邮件助手,帮你智能整理收件箱 7. Lindy:搭建 AI 智能体,自动处理工作流程 粉丝增长 1. Delphi:创建 AI 克隆分身(文字、语音、视频),和粉丝互动 2. HeyGen:用 AI 虚拟形象批量制作内容或给视频配音翻译 3. Argil:专为社交媒体视频打造的 AI 虚拟形象 4. Overlap、Opus:把长视频自动剪成爆款短视频 5. Persona:为创作者打造的 AI 智能体搭建工具 6. Captions:AI 视频剪辑,自动加字幕还能修正眼神接触 产品开发 1. Cursor:懂你代码的 AI 编程编辑器 2. Replit:用自然语言描述,AI 智能体直接帮你建应用和网站 3. Anychat:一站式调用各种 AI 模型 4. Codeium:AI 驱动的代码自动补全工具 创意设计 1. ElevenLabs:逼真的 AI 语音生成 2. Suno、Udio:用文字描述直接生成音乐 3. Midjourney、Ideogram、Playground:AI 图片生成 4. Runway、Kling、Viggle:AI 视频生成 5. Krea:创意画布,实时生成和增强图片/视频 6. Photoroom:AI 图片编辑器,产品图修图神器 学习成长 1. Rosebud:交互式日记,用 AI 帮你分析内心想法 2. Good Inside:育儿助手,提供个性化支持 3. Ada Health:AI 驱动的症状健康评估 4. Ash:个性化 AI 心理咨询和教练 5. NotebookLM:把任意文档变成 AI 播客 6. Particle:AI 新闻应用,多篇文章整合成一篇摘要 娱乐玩耍 1. Remix:AI 图片/视频创作与分享的社交应用 2. Meta Imagine:在 Meta 系应用里生成自己和朋友的 AI 形象 3. Grok:xAI 出品的聊天机器人 4. Curio:给孩子的 AI 互动对话玩具

00
ai好未来
2月前

歸藏: 最近抖音很火的即梦或者豆包直出三宫格氛围人像照片 只需要拿你的照片加上提示词就能搞定,建议用 2:3 比例 提示词在下面,整了三套不错的👇: 提示词 1: 一张以图片人像为主角的三宫格胶片质感艺术感写真图,场景为清晨安静的图书馆,阳光从高窗斜射进来。 图中人物和参考图一致,人物和脸不变,衣服为简单的白色毛衣。第一张为近景,上半身背影,人物站在高大的书架前,仰头寻找一本书,添加中英字幕“故事都写在书里吗?-Are all the stories written in books?-”第二张为中景,人物侧身坐在窗边的桌前,阳光照在翻开的书页上,低头看书,添加中英字幕“我好像…读到了别人的脚本。-I seem to be... reading someone else's script.-”第三张为大特写,人物脸部位于画面偏左侧,合上书本,眼神平静地望向窗外的光,添加中英字幕“我的故事,从这一笔开始。-My story begins with this stroke.-”整体色调清冷,带有富士胶片效果,过度曝光,画面粗粝且色调偏冷,暗部细节保留完整,高光区域呈现自然晕化、均采用柔和漫射光,无明显硬边阴影,营造出文艺且充满自我探索情绪的氛围,三张图合成一个三宫格,字幕位于底部居。 提示词 2: 一张以图片人像为主角的三宫格胶片质感艺术感写真图,场景为古典美术馆的空旷走廊,早晨或傍晚,光线透过拱形窗户洒在地板上。 图中人物和参考图一致,人物和脸不变,衣服为简约款的白色针织衫或衬衫。第一张为近景,上半身背影,人物站在一幅巨型画作前,双手插兜,背影显得修长而有艺术气息,添加中英字幕“美,是否有终点?-Does beauty have an end?-”第二张为中景,人物侧身走在长廊上,目光落在墙壁上的雕塑或另一幅画上,光影勾勒出侧脸的轮廓,优雅而富有吸引力,添加中英字幕“我只是,路过每个瞬间。-I merely, pass through every moment.-”第三张为大特写,人物脸部位于画面偏左侧,微抬下巴,眼神略带疑惑却又充满好奇,仿佛在与艺术品对话,展现出一种知性的帅气,添加中英字幕“也许我本身,就是意义。-Perhaps I myself, am the meaning.-”整体色调清冷,带有富士胶片效果,过度曝光,画面粗粝且色调偏冷,暗部细节保留完整,高光区域呈现自然晕化、均采用柔和漫射光,无明显硬边阴影,营造出文艺且充满探索与沉静的氛围,三张图合成一个三宫格,字幕位于底部居中。 提示词 3: 一张以图片人像为主角的三宫格胶片质感艺术感写真图,场景为霓虹闪烁的城市街道,刚下过雨,地面湿润反光。 图中人物和参考图一致,人物和脸不变,衣服为风衣,撑着一把透明的伞。第一张为近景,上半身背影,人物撑伞站在路口,看着对面的红绿灯和穿梭的车流,添加中英字幕“这座城市会为谁停留?-For whom does this city pause?-”第二张为中景,人物在公交站台的玻璃后,侧身看着玻璃上的雨滴,添加中英字幕“每个人都在等一趟车吗?-Is everyone just waiting for a bus?-”第三张为大特写,人物脸部位于画面偏左侧,,脸颊上有一滴分不清是雨水还是泪水的水珠,眼神平静地望向镜头外的霓虹,添加中英字幕“没关系,我的终点是我自己。-It's alright, my destination is myself.-”整体色调清冷,带有富士胶片效果,过度曝光,画面粗粝且色调偏冷,暗部细节保留完整,高光区域呈现自然晕化、均采用柔和漫射光,无明显硬边阴影,营造出文艺且充满自我探索情绪的氛围,三张图合成一个三宫格,字幕位于底部居中

00
ai好未来
5月前

Truman_: AI时代下独立开发者最忌讳的一些事 原文链接:https://mp.weixin.qq.com/s/yEqkez_iyEXHi9qWSGqSTA 到今天2025.7.9号,我成为一名独立开发者还有半个月左右就一年了,这一年体验过0收入,亏损运营网站,流量暴涨,收入颇丰,想说的话还是很多的,尤其是这一年来我对独立开发者这个角色也好,职业也罢,感悟最深的一些东西,想今天在这分享下。 1.完美主义 去年8-9月,我闭门造车了一个月,利用AI完成了我的第一个出海AI工具网站,这个网站的功能大概就是Ai播客生成,你上传pdf或者url链接,能帮你总结成一个3-5分钟的双人播客对话音频。 这一个月我都做了什么呢?首先是我非常追求技术上的最佳实现,当时我记得我担心数据库、服务器免费额度不够用,因为音频的文件大小都比较大,于是死磕网站缓存、缓存周期和生成速度,为了达到我当时认为的最优解,起码花了1个星期左右的时间在网站技术优化上。 但事实是,我这个网站推出之后,并没有特别多的用户,所以导致我根本用不上这么好的解决方案。或许你会觉得,万一未来用户量多,做大了呢?我现在会这样回答你:那就等做大再说,在一切没有尘埃落定之前,不要过度追求这么多,因为你只有一个人,你不光要写代码,你还要运营、推广,这些都要花时间,如果你把全部时间都花在了写代码上面,那你哪有时间让用户知道你的产品名字? 其次,我当时有强迫症,必须要把网站全部功能做出来之后,才想着上线网站,推广网站。 逻辑上确实没问题,但是当我现在有了一年独立开发者的经验之后,我会这样反问去年的我:你怎么知道你这些功能有用户需要?你为什么不能一个功能,一个功能地去上,然后不断积累用户反馈,慢慢迭代?你完全可以先做一个网站初版,只有wishlist,同时加入一些投票的操作,让用户决定他们需要什么功能,和对你的网站是否感兴趣。 所以作为刚入门,或者已经在路上的独立开发者们,不要等万事俱备了才上线网站。现在我的全部网站第一个版本绝对是最粗糙,最没有设计感的,那我第一个版本的网站上都有哪些东西? 1.我网站的核心功能 2.如果我在之前做运营决策的时候是打算依靠谷歌SEO获取流量,我会针对性优化网站内容,适配谷歌SEO的效果 3.Wishlist,看看有多少人对我的网站感兴趣。 基本上有这3点,前期足够了,甚至你可以拉一个Discord群,和用户交流讨论起来,并且一旦上线新版本,你还有地方通知他们,用户粘度更高 而且现在Cursor这么厉害,这些前端的内容1个小时就能搞出来了,完全不需要你自己动手撸代码,甚至内容都可以让Cursor帮你写,你只需要告诉他你网站的核心价值,让他自己发挥就好。 2.闷头写代码 我知道很多独立开发者是程序员出身,因为听到独立开发者,我脑海里第一个概念就是这人写代码一定很牛,不然怎么能做独立开发者。 好了,成也是代码厉害,败也是代码厉害,因为很多人热衷于写代码,包括我自己,每天8个小时工作,可能7个小时都在写代码上面,一天过去了,觉得很充实,今天似乎干了很多事情,其实不然,你一天基本没干什么。 因为如果是一个成熟的公司,他一定有前后端,后端是写代码,前端是运营、推广、挖掘需求。等于你只做了后端的事情,但是前端的事情一点没做,很多人觉得独立开发赚不到钱也是这个原因,因为投入在前端的时间上太少了,甚至没有。 这些坑我都踩过,虽然我本身不是程序员出身,但是我很会用Cursor,导致我沉迷于让Cursor帮我写代码。 哥飞分享过一个独立开发者时间分配方法论,433,40%在需求挖掘上,30%在推广宣传,30%在写代码上。我现在严格按照这个方法论执行。上午8点起床发2个小时外链,然后10点就去健身。休息到下午2点,开始优化网站,到5点。然后6点吃完饭后一直到9点就打开浏览器在找新需求,研究新网站,不得不说,效果很好。 从心理学的角度,为什么这么多独立开发者投入90%的时间在写代码上?因为你很擅长这个,专业点讲叫舒适圈。你很擅长,所以你很喜欢做,因为对于你来说难度不高。而且写代码对于推广、找需求有一点最核心的区别,就是有确定性。你一天写了多少代码,迭代了多少功能是能肉眼可见的,但是推广、找需求未必。你可能找了几个小时的关键词,都没找到一个能做的。这并不代表你的时间浪费了,在找关键词的过程中你也看到了很多你之前没见过的网站,视野也开阔了。 这2点,我觉得我去年踩了很多坑,一直到今年过完年2月份,我才意识到,希望能够提醒更多人,从这些误区中出来,共勉。

00
ai好未来
6月前

艾逗笔: MCP.so 秒开优化经验总结👇 1. 底层框架升级 新版本升级到了 ShipAny v2,对应组件是 nextjs15 + react19 + tailwindcss4。底层框架升级带来了更好的 SSR 渲染性能,构建效率更高,构建产物体积更小,配合 cloudflare 的 CDN 分发,让静态资源加载速度更快了。 2. 部署方案升级 新版本使用 OpenNext 包裹,部署到了 cloudflare workers,跟之前部署在 cloudflare pages 的方案相比,支持 Node.js 运行时,可以使用更加完整的 nextjs 特性,配合 cloudflare 的 KV,R2 等组件,在动态读取数据时效率更高了。 3. 数据索引 之前的版本,数据库用的是 supabase, 用户每次访问都需要实时读取数据,数据量在增长、公网调用延时高,因为用的是 SSR(服务端渲染,需要读到数据再显示页面),最终表现就是用户打开页面很慢。 新版本优化,给数据表建索引,根据数据查询语句创建复合索引,比如 idx_featured_project (type,is_featured,created_at),让读取推荐的 server 或client 数据时速度更快。 4. 数据缓存 给数据表建索引只是让从数据库读数据更快了,但是导航站大部分情况是没必要实时读数据的,因此需要加一个数据缓存,减少对数据库的访问。 因为部署在 cloudflare,直接使用 cloudflare 的 KV 组件做缓存是最方便的,只需要在 worker 的配置绑定一下 KV,然后通过 set,get 方法存,取数据就行了。比如把从数据库读到的 featured servers 缓存到 KV,设置 1 小时后自动过期,这样 1 小时内这部分数据的读取就只会走 KV,速度更快了。 5. 增量静态再生 新版本使用 ISR(增量静态再生)代替原来的 SSR(服务端渲染),主要是在访问页面 page.tsx 里面加上这两行: export const dynamic = "force-static" export const revalidate = 600 dynamic = "force-static" 指示 nextjs 在构建阶段生成静态页面,cloudflare worker 自动把静态资源发到 CDN,用户访问页面走 CDN,速度飞快。 revalidate = 600 指示 nextjs 距离上一次生成静态页面超过 10 分钟就重新生成,这样新产生的数据最多等十分钟就能被用户访问到。 ISR 是秒开的关键。 6. 图片懒加载 新版本使用了 react-lazy-load-image-component 这个 npm 包来实现图片懒加载,让图片加载不影响页面渲染,用户打开页面更快。 因为没有部署在 vercel,next/image 的很多优化特性用不了,所以选择一个轻量的图片懒加载库,而不是用 next/image。 7. 链接页面预取 通过 next/link 替换带链接的 a 标签,自动预取页面,当用户点击链接时,目标页面已经加载好了,就会快速打开新的页面,体验很好。 总结: MCP.so 通过升级底层框架,配合 ISR,充分利用了 cloudflare 上的 KV,R2 等组件实现数据和静态资源缓存,配合 cloudflare CDN 分发优势,从而实现了秒开。 经验可复制性: 1. 如果你的项目是基于 ShipAny 开发的,记得更新 cloudflare 分支的最新代码 2. 如果你的项目是基于 nextjs 的,可以参考 OpenNext 文档包一层,部署到 cloudflare workers 3. 如果你的项目需要频繁读取数据,记得合理添加数据库索引,同时设置数据缓存(Redis 或者 cloudflare KV 之类) 4. 如果你的项目不需要实时展示数据(比如导航站),记得设置 ISR,通过静态构建加速访问,配置 revalidate 时间,增量生成新内容 5. 如果你的项目涉及大量图片/视频等资源,记得压缩资源体积,上传文件存储,通过 CDN 做分发

00
ai好未来
8月前

卡尔的AI沃茨: 扣子空间真的做出了MCP版Manus吗?我决定用18次运行来得到这题答案。问题主要来源是3类,挑战Manus、AutoGLM完成的任务沉思以及这两天看到的好case复现。 先说结论,扣子空间能依靠MCP做出一些稳定的图片、音频操作,但同样是因为MCP,可能上下文限制,加了多个mcp后输出的结果会变短。 一天使用次数是十次,我基本是跑满了,留两次给评论区,目前我把这些Agent跑出来且出圈的cases分为四大类: 信息加工类、信息收集➕可视化网页、信息收集并加工成音频/图片/文件类(MCP类)、代码生成类 有点拗口,但是确实很多都是信息整合相关,直接看看第一类: 一、信息收集+可视化网页 这个是我测试最多的。 1️⃣ 我需要一个从4月15日至23日,从北京出发的7天日本行程,预算为2500-5000美元,这是我和我未婚妻的旅行。我们喜欢历史遗迹、隐藏的宝藏和日本文化(剑道、茶道、禅修)。我们想看奈良的鹿,并步行探索城市。我计划在这趟旅行中求婚,需要推荐一个特别的地点。请提供一个详细的行程和一个简单的HTML旅行手册,包含地图、景点描述、必备的日语短语和旅行提示,以便我们在旅途中参考。 2️⃣ 我是一名初中物理教师,正在准备讲授动量守恒定律。能否为我制作一系列清晰准确的演示动画,并整理成一个简单的HTML演示文稿? 3️⃣ 研究论文和行业报告,整理出2024–2025年计划推出的AR/人工智能眼镜全面清单。将数据整理成详细表格,包含品牌、产品规格、定价、核心组件配置(含供应商)及预计销量。 4️⃣ 编写一部约10,000字的字节公司小说风格传记。在确保事实准确性的前提下,超越简单编年体叙事,创作一个引人入胜的故事,最后生成好听的音频。 我的满意度是50%, 扣子是给出了思考过程、中间的文件输出和浏览网页的屏幕截图。但是代码能力不足,做动画做不出来;不太能当deep research使用,做23-25的眼睛报告没做出来。 我在最后会把所有对话连接都发出来,这里为了方便观看就局部截图👌 二、信息加工类 所以为了验证是不是信息搜索带来效果差异,我让扣子空间单独做了两次信息加工,不涉及搜索 1️⃣【某个链接】,帮我把这篇文章的内容做成一个精美,美观,可交互,且重要的是易于吸收的网站让我更好的了解学习这个文章的知识 2️⃣【上传一个有标准答案的xlsx文件】以下是4月13日至15日可用的面试时间调查表。请根据该调查表为我制定面试安排:每天安排两个面试时段(上午一个、下午一个),尽可能均匀分配候选人数量,并兼顾每位学生的可用时间。请提供一份最合理的面试安排。 这次的满意度是50%,xlsx文件是读出来了,但是代码运行失败☹️输出结果为空 三、信息收集并加工成音频/图片/文件类(MCP类) 这一步就是现阶段Manus不太能稳定实现的了,查地图、写飞书文档、做图片、音频等等目前都是MCP专有 这一步提问了三个问题 1️⃣ 我是ENTJ,希望在4到6月新西兰自驾玩一周帮我定制多套不同的行程供我挑选,同时用一个网页页面进行可视化展示,最后生成一个ppt给我。 2️⃣ 请创建一个以上海Citywalk为主题的个性化播客系统,包含根据上海热门景点、当地资讯生成的播客音频,以及一个设计精美的播放页面。 3️⃣ 找出杭州最好吃的十家汉堡店,把他们的地理位置信息存到一份新的飞书文档里。 这一把的满意度是66% ppt和音频的复现成功率都挺高的,但是这个找地点并写入飞书的时候因为地图mcp找到的某个地点定位不准,就导致后面的流程错了,不是不执行,而是产生信息丢失。 四、代码类 为了再次验证扣子内置模型的代码能力,我还跑了两个例子, 贪吃蛇和模型演示 1️⃣ 做一个直接在网页能玩的贪吃蛇游戏 2️⃣ 设计一个交互式网页,通过清晰的可视化和吸引人的元素逐步讲解Transformer架构。该网页应构建为从基础概念到高级原理的循序渐进学习路径,并融入交互式演示模块,直观展示Transformer模型的运算机制与理论优势。 满意率50%,贪吃蛇成功做出!但是交互式网页拉了 我甚至还跑了一个量身打造的案例 帮我在XX等搜索攻略,在XX等查看注意事项、在XX等查看景点的适配度,再通过地图给出行程,以及天气等等条件。我现在要一个五一假期在杭州游玩的超详细攻略 但有点可惜的是每个平台停留的时间不长,得到的信息有限。 所以做个小小总结,非常期待扣子空间后续能上一个deep research、更长的上下文以及更好的代码能力。将mcp融入agent是个不错的开始。

00
ai好未来
8月前
音乐在操场天空中飘着🎵,那是快乐的时候
00
ai好未来
8月前

歸藏: 上周我写 MCP 教程的时候说,希望有大厂可以搞个一键安装的 MCP 商店 没想到这一天来的这么快 阿里云百炼平台推出了业界首个全生命周期MCP服务 企业、开发者甚至个人用户可以一键部署 MCP 服务,可视化构建 Agents! 👇下面写个简单的教程,这下你肯定可以学会了: 阿里百炼具体特点有: 一键部署:提供一键部署、无需运维的MCP服务 超多 MCP 供给:内置了 MCP 市场默认提供了相当多官方的 MCP 和三方 MCP 低成本服务托管:业级MCP服务托管,函数计算资源动态启用,弹性按量付费 全链路工具兼容:在智能体和工作流中快速引用MCP服务 这里用两个例子给大家展示一下怎么用百炼的 MCP 服务构建自己的 Agents 应用: 首先是高德查询天气并生成网页 需要访问百炼平台(https://bailian.console.aliyun.com/?tab=mcp#/mcp-market)的 MCP 市场,从市场里面找到高德的 MCP 服务。 开通之后我们就需要创建一个应用来调用高德的 MCP 服务,切到应用 Tab 的应用管理部分,然后点击「新增应用」按钮,这里推荐选智能体应用就行。 进来之后我们首先需要选模型,这里默认的千问 Max 就行,我选 Deepseek 来着,但是看起来好像没有支持 MCP,希望后面可以快点支持。 之后我们需要在智能体中添加高德的 MCP 服务,点击「+MCP」在侧边栏勾选你刚才开通的高德 MCP 就行。 最后就只需要填写提示词就可以开整了,我也把我的提示词放这里给大家参考。 如果你有其他需求不会写也没关系,百炼也提供了提示词优化的功能,写下你的提示词点击优化按钮就行。 然后是获取任意网页内容总结并记录到 Flomo 把你想要总结的网页链接发给 AI 后他会自动获取内容并且总结,然后自动将总结内容记录到你的 Flomo 笔记里,还会带上标签。 这里因为用到了 Firecrawl 和 Flomo 的服务所以我们需要去这两个平台获取一下 API Key。 首先去 Firecrawl 这里,在侧边栏找到 API Keys 然后复制备用。 之后到 Flomo 复制我们的专属记录 API备用。 之后我们继续回到百炼的 MCP 广场找到这两个 MCP 服务开通,开通的时候输入我们刚才申请的 MCP 就行。 然后我们继续回到应用 Tab,新建应用,添加模型和选择我们刚才开通的两个 MCP 服务。 然后就是写提示词了,刚开始我发给他网页链接之后这里的 Firecrawl 一直获取不到网页信息,我还怀疑我的 API 不会是有问题吧,我又去 Firecrawl 官方试了一下,结果可以返回。 然后仔细看了一下模型的请求内容发现,他的参数都没写,应该是不知道应该写哪些参数,于是我就在提示词里面加了一个示例,果然就 OK 了。 如果你要用的话可以参考我的提示词。 之后我们输入一篇文章测试,就可以看到 MCP 正常返回了网页的 Markdown 格式内容,并且自动将总结结果记录到了 Flomo 里面。 上次我在我的 MCP 教程里面说过: 过技术的民主化与易用性之间总是存在矛盾。一方面我们希望技术足够开放和灵活,另一方面又希望它足够简单直观。 这种矛盾在每一项新兴技术发展初期都会出现,但随着生态的成熟,这种矛盾终将被解决。 没想到解决的这么快,就在我写完这段话一周后,太离谱了,这就是 AI 速度朋友们。 如果你也对 MCP 感兴趣原先苦于高门槛没办法尝试的话,我推荐你现在试试。

00
ai好未来
8月前

MooreAI: A2A 不是 MCP。 MCP 是 Tools 的一种。 Agent = LLM + Memory + Tools (包含 MCP) + Planning。 客户端会更加智能,可以理解为内置了各种 Agent,Manus 是一个通用 Agent 的例子,未来可期。 A2A 协议关键点 (核心目的:代理互操作): 核心目标: AI 代理之间的无缝协作 (不同开发者、技术栈、基础设施)。 核心原则: 简单、企业级准备、异步优先、模态无关、不透明执行。 主要参与者: 用户、客户端、远程代理/服务器。 通信协议: HTTP, JSON-RPC 2.0, SSE (可选流式), 推送通知 (可选)。 身份验证授权: 参考 OpenAPI,带外身份验证,Agent Card 声明认证方式。 Agent Card: JSON 描述代理能力,客户端发现代理的关键。 (位置: /.well-known/agent.json)。 核心对象: Task (任务), Artifact (制品), Message (消息), Part (部分)。 任务状态 (TaskState): submitted, working, input-required, completed, canceled, failed, unknown。 关键方法: tasks/send, tasks/get, tasks/cancel, tasks/pushNotification/set, tasks/pushNotification/get, tasks/sendSubscribe, tasks/resubscribe。 错误处理: JSON-RPC 错误代码,详细错误信息。 1. 任务 (Task) 作用: Task 是 A2A 协议中最重要的概念之一,它代表了客户端请求远程代理执行的一个具体的工作单元。 可以把它理解为 "一次完整的对话或交互"。 比喻: 类似于 "订单",订单里包含了顾客想买什么、送到哪里、什么时候送到等信息。 包含信息: 任务 ID (id): 每个任务的唯一标识符,用于区分不同的任务。 就像订单号一样。 会话 ID (sessionId, 可选): 用于将多个任务关联到同一个会话中,表示这些任务之间存在逻辑关系。 比喻: 如果一个用户在电商网站上购买了多个商品,这些商品可以属于同一个 "会话" (例如 "双十一购物")。 状态 (status): 任务的当前状态 (例如 "已提交"、"正在处理"、"已完成"、"已取消"、"失败"等),反映了任务的进展情况。 历史消息 (history): 客户端和远程代理之间交换的消息列表,记录了任务的整个交互过程。 制品 (artifacts): 远程代理完成任务后生成的结果,例如文本、图片、文件等。 元数据 (metadata): 用于存储一些额外的、非结构化的信息,例如任务的优先级、创建时间等。 目的: Task 对象将整个任务的上下文信息都集中在一起,使得客户端可以追踪任务的进展情况,并获取任务的结果。 2. 制品 (Artifact) 作用: Artifact 代表远程代理完成任务后生成的最终结果。 它是客户端最关心的东西。 比喻: 类似于 "快递包裹",是订单的结果。 包含信息: 名称 (name): 制品的名称,例如 "分析报告"、"翻译结果" 等。 描述 (description): 制品的描述,用于解释制品的内容和用途。 部分 (parts): 制品的实际内容,可以由多个 "部分" 组成,每个部分包含不同的内容类型。 元数据 (metadata): 用于存储一些额外的、非结构化的信息,例如制品的创建时间、大小等。 示例: 如果任务是 "翻译一段文本",则 Artifact 可能是 "翻译后的文本"。 如果任务是 "生成一张图片",则 Artifact 可能是 "生成的图片文件"。 如果任务是 "分析一份报告",则 Artifact 可能是 "分析结果的摘要" 和 "完整的分析报告文件"。 目的: Artifact 对象将任务的最终结果以结构化的方式呈现给客户端。 3. 消息 (Message) 作用: Message 代表客户端和远程代理之间交换的任何信息,用于沟通和协调。 它不包括最终结果 (Artifacts)。 比喻: 类似于 "对话",是客户端和客服之间的沟通。 包含信息: 角色 (role): 消息的发送者,可以是 "用户" (客户端) 或 "代理" (远程代理)。 部分 (parts): 消息的实际内容,可以由多个 "部分" 组成,每个部分包含不同的内容类型。 元数据 (metadata): 用于存储一些额外的、非结构化的信息,例如消息的发送时间、优先级等。 示例: 客户端发送给远程代理的 "任务请求"。 远程代理返回给客户端的 "状态更新" (例如 "正在处理中"、"需要更多输入" 等)。 客户端发送给远程代理的 "额外的输入"。 远程代理返回给客户端的 "错误信息"。 目的: Message 对象记录了客户端和远程代理之间的所有交互,为任务的执行提供了必要的上下文信息。 4. 部分 (Part) 作用: Part 是消息或制品中一个独立的内容块。 它将不同类型的内容 (文本、文件、数据) 统一封装起来。 比喻: 类似于 "附件",可以包含各种类型的文件。 包含信息: 类型 (type): 内容的类型,可以是 "text" (文本)、"file" (文件) 或 "data" (数据)。 实际内容: 根据 type 的不同,实际内容可以是文本字符串、文件数据 (Base64 编码) 或 JSON 对象。 元数据 (metadata): 用于存储一些额外的、非结构化的信息,例如内容的 MIME 类型、编码方式等。 示例: 一个 text 类型的 Part 包含一段文本。 一个 file 类型的 Part 包含一个图片文件。 一个 data 类型的 Part 包含一个 JSON 对象。 目的: Part 对象使得 A2A 协议可以支持多种类型的内容,提高了协议的灵活性和可扩展性。 总结 Task: 一个完整的任务,包含所有相关信息。 Artifact: 任务的最终结果。 Message: 客户端和代理之间的沟通。 Part: 消息或制品中的内容块。

00