即刻App年轻人的同好社区
下载
App内打开
深绘
93关注422被关注2夸夸
深绘
2月前
开源一个轻量级多agent框架,默认自带七个agent,对话中能够智能刷新系统的提示词,具备记忆管理系统,能够查找以往的聊天记录,可以执行命令和查询数据库,甚至还可以自己搭建新的agent。代码简明易懂,作为agent开发入门上手框架也很不错,地址:github.com
00
深绘
3月前
这两天让 Claude Code 帮我写了个终端转发工具,主要是为了解决外出时还想用 Claude Code 的问题。

之前好几次在外面想改点代码或者查看项目,但是 Claude Code 只能在电脑上用。特别是有时候想到什么思路,但人不在电脑前,就很不方便。于是想着能不能让手机也能连到电脑的 Claude Code 。

具体实现方式就是,电脑上跑个 pty ,服务器用 cloudflare worker 做 WebSocket 中转,网页端用 xterm 做命令渲染和输入。

目前用下来感觉还行,但是还不是很成熟,连接上会有不稳定的情况等等。主要是想知道大家有没有这种需求,需求多的话,会继续投入精力完善。

项目地址: github.com
21
深绘
4月前
GPT5终于要来了
00
深绘
5月前
说实话,我还是Get不到MCP的点。

这件事的本质,其实就是AI发起一个工具调用请求,服务方给出工具执行结果,AI添加到上下文,然后回答用户或者继续调用。

如果说这是为了统一标准,OpenAPI不是已经是标准了吗?全世界的API都在用OpenAPI文档,AI也能直接读懂,工具调用完了结果该怎么加到上下文还是怎么加,为啥还要搞个MCP?

OpenAI的Actions多简单,配个API,写个schema就能用,调用结果直接回来。MCP呢?要学协议、搞服务器、处理SSE、WebSocket一堆东西。但最终不还是要把工具执行结果塞回上下文吗?90%的场景就是查个天气读个文件,用得着这么复杂吗?
55
深绘
7月前
与AI对话的消息应该视为文档,AI能够根据对话调取文档,重整上下文。在代码修改的场景里,AI能够把用户发送的代码直接加载到工作台,然后通过局部修改快速完成编辑。
00
深绘
9月前
现在每天的工作全靠AI,我感觉并不是agent在代理我,而是我是ai在公司的代理。
00
深绘
1年前
初步跑通claude-computer-use的写作功能,利用官方内置的text_editor实现ai编辑器,可以通过和ai对话让ai创建、撰写和编辑文章,这和传统的编辑器有根本的不同,传统的编辑器本质还是一个工具,它本身不会产生内容,更不用说理解你的想法,而ai编辑器则是一个写作代理,你能够和它对话,它能够理解你的复杂的想法,然后自动选择合适的工具,实现你的需求,它还能在对话中启发和引导你,提供你原来想不到的思路,从而创造更好的内容。
11
深绘
1年前
关于人工智能操作电脑,这个之前也已经做了,方法是让gemini给出目标交互元素的坐标,然后让ai输出坐标去点击,然后再把截图信息发送给ai让ai进行下一步的操作...如图中所示,创建账号按钮上的红色圆点就是视觉模型给出的坐标点的标记...

实现ai操作电脑没有难度,有多种方案,现在感觉比较好的是视觉,但是问题在于,找不到场景,一个简单的任务,ai要搞很久,并且还容易出错...现在的gui本身是为了鼠标设计的,并不是为了ai设计的。

这么说来,也许接下来交互界面就是要综合人类和ai进行设计,既能让人类利于理解和互动,也能让ai较好的理解和互动,这样才能很好的实现人机两个模型的协同,并且,当然是生成式的。
20
深绘
1年前
在gpt canvas 推出的三个月前,自己也做了一个通过tools call 来响应用户需求编辑文章的demo产品,今天看到claude 的Computer use功能中官方定义的写作部分(text_editor_20241022)发现大家思路都差不多。
10
深绘
1年前
AutoSite是一个可以让Ai根据你的需求开发网站并自动部署上线的小工具,大部分的代码基本都是Ai写出来的,之前都是命令行和Ai交互的,今天又让它实现一个网页的界面,没想到几下就帮我搞定了,而且成品效果非常好,调整了一下文案就直接可以了,不得不感叹现在的Ai太强大了。
01