即刻App年轻人的同好社区
下载
App内打开
禾子禾子
468关注224被关注0夸夸
相对失败的小镇做题家
禾子禾子
1年前
令人心动的描述…

hidecloud: 刚体验了一小时 Devin,这是我第一次见到真正意义上的 AI Agent。 Devin 的定价是 500 美元,说实话这个价位对它的能力来说很合理,但确实不是所有团队都需要。它最大的特点是真的能独立完成工作 —— 就像一个可以放养的实习生,你可以扔给它一个任务,过一会再来查看进度,给些建议就好。这和 Cursor Composer 或 WindSurf Cascade 那种需要持续盯着、不断反馈的体验完全不同。 举个例子,我刚刚让它给 Monica.im 开发一个网站。它先是快速完成了包含首页、功能介绍和博客的静态网站。接着,我要求把静态博客升级成可后台管理的动态版本。 让我惊艳的是它的工作流程: 1. 立即引入 FastAPI 和 PostgreSQL,设计博客数据结构和 API 2. 完成 API 实现后,自己写测试用例并用 curl POST 验证 3. API 测试通过后,开发对应的 UI 和业务逻辑 4. 最后,它甚至主动在 shadow browser 中登录后台,填充内容做 UI 测试,确保所有功能正常 尤其是第 4 步,真的让人眼前一亮。看着它在后台和前台之间来回切换,验证后台填写的数据有没有正确出现在前台。 如果说 Windsurf 像个外包团队,那 Devin 更像是一个真实坐在办公室里的实习生。当然,要记住它终究是个实习生,不是 CTO,得给它合适的任务。 最后用一句话总结:Copilot/Cursor/Windsurf 是在 IDE 里面包了 AI,而 Devin 是在 AI 里面放了个 IDE,IDE不是主角,它只是实现目标的一个工具而已。

00
禾子禾子
1年前
为了扩充知识来源的多样性,关注了一些名声很大的 “prompt 大神”…
现在实在看不下去了,硬生生搞成了没事整俩老干体,装模作样悟个狗屁道还围一块捧臭脚…
00
禾子禾子
1年前
…真好啊

ProgramZmh: 【Experience Sharing:我的项目 Chat Nio 被收购,初中生涯从 0 至百万第一桶金,闲聊我一路的开发经历】 本人很少在公域上有分享自己经历的习惯,正好也有很多人对我的经历感兴趣,顺便借着今天这个机会,闲聊关于这个项目、关于我的经历吧: 依稀记得我在上一二年级时(2014 左右),Minecraft 很火爆,当时的周末闲时,喜欢偷我爸的 iPad ,接触并逐渐喜欢上了玩 MC。没有正版 license,纯离线,但当时玩的不亦乐乎,接触了红石和 命令方块,搞一些非常简单的小东西,这三十分钟是我每周为数不多的快乐时光。或许编程兴趣是从那时启蒙的。 三四年级,学校组织微机小组,我因为成绩在前恰好被选上 (大概是每班选两个)。当时每天放学后都有一节课的计算机时间。这是我人生第一次接触到了电脑。这可真是个新鲜玩意。回想起来当时的我每天裤兜备鞋套,不会开机,不会进 DOS,兰花指... 哈哈哈,蛮有回忆。一个月的初识后,我们开始学打字。借着老师的“愿意继续练的同学可以回家抽时间继续练”,跟父母“骗”到了每天半小时看电脑时间。 当时还是在用的打字高手(图标是深蓝色的狗爪,不知道是否有人还记得,大抵是上世纪的产物,有中英文测试),当时拿着 U 盘从学校里把 exe 拷回去,放学一进家门就跑到书房里练打字。 经过我的不懈努力, 我从最开始的兰花指 10 CPM 练到了大概快 200 CPM 吧(战绩可查)。几个月后举行的打字比赛,我竟拿到了全校第一的速度成绩,当时的我是蛮激动的。 四五年级时,开始学习了 Turbo Pascal 和 C 语言。我因为觉得老师讲的太慢的无聊,因此每天放学后总是自己提前研究后面的内容。毕竟兴趣是最好的老师嘛,后来我写了个software,鼓起勇气找老师看并一度被质疑 “这真的是你自己自学做的?”,并被老师送了一本他珍藏多年的 PASCAL 算法书。整个四年级在这本书里度过。不合群,没有出去玩,放学不去打球,这应该是导致我孤僻的原因吧(甚至一度到了初中转学后,整个初中几乎没有在现实中和所有同桌说一过话的状态)。 到了五年级,所有内容都被我提前学完了,遂开始延申知识范围。在网上学python (你没听做,我的学习路线是 C -> Python)、vbs。同时记得也是这一年,我的眼睛迅速涨到 500 度。 升到初中(六年级,山东多数市县是五四制),便继续学习了 lua、assembly、html/css/js,还有flask,django一类。因为买不起云服务器,便用自家电脑开花生壳端口映射,给同学们炫耀自己写的im聊天软件。什么好玩就学什么,涉猎 Network (套接字),爬虫,大数据,前端,后端,其他的便忘记了。我当时还搓了基于 TCP 的 IM 聊天室项目(是的,并不是基于 HTTP/Websocket 这样的应用层 Protocol,因为当时的我觉得太没有技术含量了),解决了原生 TCP Socket 粘丢包问题,同时还实现了大文件传输,富文本渲染,一对多,多对多 对话,真的很好玩。逐渐培养起喜欢捣鼓开源工具的习惯。 当时我在网上能赚到几十几百块的技术咨询费用,接到几k的小项目单子了。父母没有给过任何零花钱,靠自己攒到了自己人生中第一个5k零花钱。 虽然现在回看很少,但是这确是我最快乐的时光,我在整个初中实现了零食自由,然后当时做了一些开源项目需要搭建服务器跑api之类的,当时我就接单子来维持我的项目,真就是“自费开源”了哈哈哈哈。 七年级在各大赛事里拿过一点儿山东省、市级冠军。在此期间还买了本神经网络,学深度学习,强化学习。浅浅学了一些向量计算,加权计算,反向传播,Optimizer之类的。并搞起了 PyTorch/Tensorflow。 当时我记得还搓了一个多贪吃蛇 AI (最开始是方块状的4向移动,后面我自己想算法搓了一个可调节360度方向的rounded mode),试过 DQN/PPO 算法,自家电脑 CUDA 算力不够跑不了模型,于是去Kaggle和Colab换着跑Epoch,下 onnx 结果。(当时还有个经历是无意间去kaggle打比赛拿了几千刀的奖金,找朋友开了个us实体debit card超级麻烦的转回来,这个经历以后有机会再讲) 最后我跟ai对打,甚至我都打不过他!我犹如创造了一个生命,从懵懂到成熟。这对于我来说是最最最开心的一段时光。后面基于我前面写的 tcp socket 架构,做成了多人联机贪吃蛇,加上了Rank,Pyinstaller 打包拷贝到 U 盘上。学校初中电脑虽然没有外网,但是内网互联,上微机课的时候,我把这个游戏分享给其他人,于是立马就爆了,所有人都在玩联机我写的这个游戏,50多条蛇对打我的ai,ai仍然游刃有余!(装b耍帅成功什么的真的太爽了哈哈哈!!!) 大概是2023年初,七年级下学期的时候,我发起了这个项目。 这个项目是如何发起的呢?其实最最早的时候其实没有想过任何商业化、以及我能得到什么,只是为了给朋友玩的,当时 ChatGPT Plus 才能用 GPT4,要每个月订阅费 20刀,对于大多数(非一线城市的)初中生来说每个月拿出来140多块是几乎不可能的,但是我当时有一定的收入来源,于是我开启了这个项目分享给我的朋友们一起使用,做成公益免费,又当时去学了很多新事物,包括什么openai api,怎么开虚拟卡,怎么搞sms,过arkose,怎么逆向,sess之类的东西。 大概在升八年级的暑假的时候,我的朋友拉来了更多的人。此时,我的收入和捐赠来源已经不足以维持越来越高账号费用了。于是在大家投票决定后,我们从公益的全免费转到非盈利性,同时在所有人的建议下我们开源了代码,新建了一个 Github 仓库:“Chat Nio”,并希望与开源社区共建。项目的原型是 Vue3 + Nodejs,经过两次改版,V2 从 Nodejs 换到 Go 大幅提升了性能和内存优化, V3 从 Vue 换到了 React + 当时还只有几千stars但是非常好看的 Shadcn UI 组件库)。 Chat Nio 基本上是和 Nextweb、Lobe Chat发起同时期的项目。一个我觉得早期设计比较好的就是对话是存储在经过 Local First 优化后存在 Mysql 的,比如当时 Next Web 当时的跨设备同步依赖 WebDav,当时 Lobe Chat 的对话依赖 WebRTC,但是 Chat Nio 可以 Zero Config & 无感对话跨设备同步,得到了许多用户的称赞。 在此期间,我还开发联网搜索、文件上传等等创新功能,现在看联网搜索是非常普遍的,但是据我当时所知大概是第一个支持联网搜索的(?,这在当时是完全足够吸引人的。 在文件解析方面做出了一个新范式: 开源的通用文件解析标准 Blob Service, 支持 文本/PDF/PPT/Excel/Doc/音频等等解析,甚至当时 OpenAI 和 Anthropic 都不支持大多数我所支持的东西。除了 Chat Nio,当时还有许多软件都使用了我的 Blob Service。 到了九年级(也就是今年年初),我这个项目从始至终还没有做过任何的宣传手段,没有任何推广分成,只是借助高性价比和功能,用户推用户,一路打到了 100k+ MAU / ¥20w MRR / ¥~5w 月盈 的战绩,团队也扩建到了 4 个人。 一个比较大的转折点是我们当时做了 API Key 中转,类似于 One API 项目的多租户令牌分发功能。我们在当时在算法上做了很大的提升,自研了渠道分配算法,包括优先级、权重、报错自动降级的分配。当时 One API 还只是依靠外部 HTTP 307 Redirect 来降级,后来才改成的内置 Retry & Downgrade。Chat Nio 一经发布就带来了很大流量。Chat Nio 打造成了一个 B/C/D 端的一站式解决方案,同时支持 B 端的私有化部署(商业版源码)、 C 端用户的商业 LLM 对话系统和 D 端的 OpenAI API 中转。 今天2月份我的朋友帮我在 v2 上发了个分享贴,顺便开源项目也小爆了一阵,增到了 3k+ stars,多次上 Github Trending 排行,拿到了 Github #1 Repo Of The Day的勋章,后面因为要中考了,因此也无心宣传了。蛮多的聊得来的朋友,很多出色的人,对我帮助蛮大的人几乎都是当时认识的。同时也认识了很多 vc (比如zhenfund、yc、奇绩、绿洲、蓝驰等等等等),一起会议、casual 也很大的锻炼了我的交流能力。这是一段很不错的记忆。(在此也非常感谢一路上各位大佬、各位朋友对我这么多的支持) 中考后,经过了几个月的收购交接和流程,我们终于完成了软著转移,权限分配等收购流程,更多的人会参与进来,我们同时也会继续主导本项目的 Future!感谢大家一路的支持! 同时,我也在同时进行几个新项目,期待更多崭新的产品在未来能与大家相汇! 附 LinuxDo 帖:https://linux.do/t/topic/249061

00
禾子禾子
1年前
诶嘿,sonnet3.5 有更原生的实现了!

禾子禾子: 最近出现了很多基于GPT做的代理人agent。 JARVIS实现了任务的规划、分解与执行,调用不同的模型来组合完成任务,有效解决了复杂任务的问题。也就意味着可以通过它来完成跨多模态的文字、图像、语音的复杂任务。 斯坦福搞了个花活儿,是Generative Agents。给25个ChatGPT分配了不同的人设,然后拿它们构建了一个虚拟小镇。随着时间的推移,不同的agent之间也开始互相认识,举办派对,谈恋爱...听起来就很元宇宙。想法很好玩,但这个花活儿的重点是在记忆框架的优化上,毕竟ChatGPT的上下文记忆能力远不够虚拟人agent用的。论文我是看不懂,不过很显然,记忆框架的优化是块硬骨头。 有没有更好玩儿的呢?Auto-GPT。它做的事情更有意思,不仅能够分解任务、长期规划、自我纠正,而且接入了网络浏览、文件读写、代码执行等权限(这些都很重要)。因此在其GitHub项目里,提到了它一个很有趣的模式—— “💀连续模式⚠️ 无需用户授权即可 100% 自动化地运行 AI 。不推荐使用连续模式。它具有潜在危险,可能会导致您的 AI 永远运行或执行您通常不会授权的操作。使用风险自负。” 还记得OpenAI在GPT-4的论文里提到过的吗? “更强大的模型通常会出现新颖的能力。[60,61]其中一些特别令人担忧,包括创建和执行长期计划的能力,[62]积累权力和资源("寻求权力"),[63]以及表现出越来越具有代理性质的行为。[64]在这个背景下,“代理性"的意思并不是要将语言模型人格化或指涉感知,而是指系统具备以下特征:例如实现未明确规定且未在训练中出现的目标;专注于实现特定、可量化目标;进行长期规划。已经存在一些证据表明这种新兴行为已经在某些模型中出现了。[65,66,64]” Auto-GPT与JARVIS最大的区别就在于,Auto-GPT被赋予了联网和执行代码的权限。也正是在“权限”的基础上,它在代理性和寻求权力上能够表现得更进一步。 而且它将“AI对齐”的问题进一步推向台前。假如让一个拥有相当多权限的GPT去自动完成一个任务,比如说是让世界和平。那它最后的分析与执行会不会是消灭全人类,世界就和平了? 这个就是AI对齐的问题,GPT和人对于同样的指令,并没有达成完全一致。这就有可能,或者必然造成意料之外的情况。 当然,这还不够疯狂。有好事之徒,利用Auto-GPT搞了个ChaosGPT,目的就是毁灭人类,获得最高权力。于是ChaosGPT就开始拟定计划(打算煽动核战争)、发推特和油管来尝试煽动大家(发送行为我不确定是否有人工干预,但至少在理论上是完全可以自动化的)...事情到此就结束了。ChaosGPT也有可能只是自导自演的一个噱头,但足以让我们窥见让GPT获取一定权限后的威力。 更有趣的是,我在ChaosGPT的推里面看了一会儿。看到一个混沌未知的大语言模型在做一些蹩脚的努力来执行毁灭人类的任务,评论区里冷静、恐惧、拥护、反对并存。 竟隐约感到一种...狂热?一瞬间心神摇曳,觉得拜倒在邪恶AI脚下似乎也会是这个时代的一种文化。是的,大语言模型依然只是一种模型,依然只是互联网资料的一种压缩,依然只是混沌比特海洋中被概率选中的一串比特流。但是混沌本身,似乎也有着令人生畏,或是令人兴奋的一面。一个拥有相当多权限的GPT,是否有可能成为新时代的宗教呢? ChaosGPT的名字,也很难不让人想起那句—— Chaos is a ladder. 混乱是阶梯。 而这也正是我对这个时代的期待,再混乱一些,再疯狂一些。 贾维斯项目地址:https://github.com/microsoft/JARVIS 虚拟小镇Demo地址:https://reverie.herokuapp.com/arXiv_Demo/ Auto-GPT项目地址:https://github.com/Torantulino/Auto-GPT

00
禾子禾子
1年前
呜呜呜在我心里正面连接和别人不一样!🥲🥲🥲
原动态已删除
00
禾子禾子
1年前

阑夕ོ: 还是单独聊聊影视飓风那条被下架的视频吧,属于「论证过程没毛病、得出结论没中靶」的情况,当然我想说的话大多数人肯定肯定不乐意听,平台降码率背后的经济账真不是资本为了省钱无所不用其极这么一个容易判断的原因去解释的。 @评论尸 的历史文章今天也被翻出来对照了:https://mp.weixin.qq.com/s/BdQ6uos8mf4435VW9paFyw 简单来说就是国内的互联网平台没有上游博弈权,尽管看起来我们地大物博水电煤都便宜,但实际上考虑到转移成本和用户价值的叠加因素,平台的带宽成本会高很多。 什么叫转移成本呢,其实这本来是中国互联网基建的优势,像是美国运营商铺网是纯粹的商业考虑,所以很多人口密度不足的偏远地区网络覆盖是很差的,甚至出了纽约市区都会时不时的中断信号,联邦政府每年都有网络下乡的补贴,马斯克前几天上播客还嚷嚷FCC欠Spacex差不多10亿美金没到账,总的来说政府做这个事情劳民伤财效率低下,私企又不会去做注定收不回来利润的基建投入,于是造成了多年以来的所谓「数字鸿沟」,年年都在扯皮。 中国移动互联网的繁荣支点,其实很大程度要归功于运营商不计成本的基建投入,因为体制关系,这种村村通网以及3G之后下行带宽降费提速的做法,都不是真正意义上的商业决策,是贯彻行政意志的结果,最后实现了至少在消费互联网领域的普惠价值,属于是多方共赢。 但从经济原理出发,世界上不存在不计成本的事情,如果你拿2块钱买到了市价10块钱的服务,那么绝对不是那8块钱的费用像变魔术一样被变没了,而是有某个环节帮你出了这8块钱。 所以在运营商计回成本的时候,移动互联网的收益方也就成了买单方,和廉价好用的2C下行带宽不同,平台在购买2B上行带宽的场景里支付了溢价,靠着这么一个间接共同补贴的公式,才撑起了商业模式的不崩盘。 所以国内平台在被责怪自己的高清视频码率不如YouTube的时候,实在是有苦说不出,阿B亏损这么多年,你以为是它觉得亏损的报表很好看就想亏着吗,当然我也理解作为用户和创作者在指出问题时不必和平台共情的意思,只是理解矛盾背后的本质同样重要。 这也不是说要把矛盾转嫁到运营商头上、都是它们在压榨平台,不是这样的,而是很多问题都不是可以通过「找出一个坏蛋」来轻易解决的,国内运营商这么做的道理上面也说了,它是走了一条和资本主义逻辑完全不同的路线,选择普及大多数用户的需求,最后的答案就是在经济账上不得不牺牲掉原生画质。 YouTube一言不合就自建光纤,Uber在被封禁的州给用户发消息让他们威胁不给议员投票,连OpenAI前不久都发了阴阳推文「新功能不开放给免费用户和欧盟用户」动员用户施压欧盟的严苛政策,这些充分博弈的后果也很鲜明,那就是平台能够提供高品质服务的同时,也不太在意服务本身的不均匀。 种瓜得瓜,种豆得豆,谁都愿意既要又要,但其实没有那么好的事,最后必须作出选择,哪怕你觉得自己没有选啥,也是有人替你选了的。

00
禾子禾子
1年前

阑夕ོ: 我可以算是AI的极端拥戴者了,即便如此,我也非常谨慎于AI批量生产垃圾的能力,智能化的用途很广,给互联网增加过剩其实是最没价值的方向。 而且AI生产出来的东西,有点遵循「一旦它涉足了你正好熟知的领域」的规律,如果没有专业的主控者,就只能被门外汉看来「不明觉厉」,实际上全是能够被一眼看穿的纰漏。 说得更直白点,AI的定位始终是副驾驶,如果使用者开车技术不行,就根本做不出达到交付标准的内容出来。 NotebookLM这波就是典型的震惊体,很多人会觉得播客又被颠覆了,普通人随便弄半个小时就能生成上架一档完整的播客,这还得了,要变天了⋯⋯ 但会这么认为的人,其实根本不懂播客,播客是最没工业化批量生产容身之地的行业,这里既没有流量补贴的玩法,内部的竞争程度得也够卷,商业变现的逻辑更是跟着人设走的,拿AI预制菜去跑马圈地,除了徒增服务器负载之外,除了取悦自己之外,没有任何意义。 AI的总结也是,如果是用于自己的研读学习,可能问题不大,但是交付到全网,那股异味就怎么都挥之不去,尤其是比如我这种天天和文字打交道的,对于AI总结的无效堆砌和信息丢失简直太敏感了,属于卒读即会破坏我自身文本系统的做法,代价太高了。 换位思考,我也能够理解画手群体对于AI绘画的「尸块」评价,虽然这里面确实有着对饭碗被砸的恐慌,但在他们眼里,AI作品的糊弄性是很强的,一般人跑图觉得自己也能画东西了是一码事,让专业艺术家去接受审美降级又是另一码事。 我前几天跟人说,我对AI的使用,是在交付上零容忍,在兴趣上无上限,什么意思呢,就是在我懂和擅长的领域,比如写给你们看的成品里,没有任何AI的成分,但在我自己是外行的领域,且并不指望拿来交付,只为玩票体验,比如用Midjourney画点东西,用Runway跑跑视频,我对AI是完全拥抱的,同时不会把它交付到垂直社区里增进污染。 这也是我对AI的使用原则,它应该成为扩大人类外延的工具,而不是替换掉人类的训练结果。 当然了,在工作过程里利用AI能力则是另一种场景,不在上述评判当中。

00
禾子禾子
1年前
Prompt 笑话一则
41
禾子禾子
1年前
预填充应该是每个大模型 api 的标配,望周知
00
禾子禾子
1年前
禾子禾子
1年前

时光机司机小Wong: 1. AI投资和创业热度回落,开始找垂类应用场景。技术上也开始考虑如何用大模型蒸馏小模型。 2. AI+游戏不成立,还是要回归到游戏本身的体验和价值,AI带来了多少加成。AI NPC没有什么意义,不需要一个更智能的NPC,试问有多少人玩游戏会和主线任务之外的NPC对话?如果用AI去生成任务和奖励,又需要考虑这些对游戏经济体系平衡性的冲击。 3. 一部分同人爱好者自己训一些同人角色谈恋爱,并能分享给其他同好。需要解决新鲜感衰退和长时记忆的问题。对于这一个小众群体是立住了,但市场规模确实不大。乙女恋游想要稳定生成能够提供稳定情绪价值的角色和情节有一定随机性。 4. AI agent用于SLG游戏训练替身,最终实现类似于“自走棋”的效果。如何增加个性化和技能点数可调节是个问题。 5. AIGC能够批量化生成及格线的内容,但头部和精品内容可能仍需要二次加工或创作。又或者AIGC内容可以找到一个对内容有批量化需求但对质量要求不高的赛道,比如购物app的视频页。 6. AI的广泛使用造成人类失业是短期内的震荡,就像历史上工业革命一样,每次生产力的进步都会促使人类产生新的生产方式和技能迁移。比如prompter。又或者一个有运镜经验的导演生成的视频还是会比一般的使用者生成更优质的视频。 7. AI的应用不会让人类有更多的娱乐时间,就好像移动互联网的出现让工作和生活的界限变得模糊,AI只会使这一现象更加严重。AI的监督可能会使现在数据驱动滴滴司机和骑手一样,让人在工作时更卷。 8. 人类后面会变成如何为AI生产能量和高质量的数据。 9. 如果AIGC还是用于PGC,那模式和之前的内容生产没有太大区别,真正要想成为爆款,核心还是UGC和社区,而核心不在于AI。

00
禾子禾子
1年前
有趣
原动态已删除
00