即刻App
年轻人的同好社区
下载
App内打开
酸的雨
103
关注
5
被关注
0
夸夸
酸的雨
9月前
所以,agent解决的是类似于:知道自己知道,知道自己不知道——这两个象限的边界划分问题
木遥: 前几天在群里和朋友聊用 AI 写代码的痛点,我说我最大的抱怨是它在完成某些看似很平凡的任务的时候异常吃力,比如最常见的操作:把一个代码库里的某个变量全局统一改名。这个事显然开发环境有现成的接口,但 AI 只会逐个文件编辑,又慢又浪费还容易出错。这件事之所以荒谬,在于 cursor 自己就是个开发环境。换句话说,它在这件事上表现的像是那种两个部门老死不相往来的大公司,明明一个部门已经把某件事做到了近乎完美,另一个部门却对此不闻不问,非要用自己的笨办法重来一遍。 这听起来像是一个简单的可以修复的 bug,但它背后反映的是 AI 现状里一个巨大的鸿沟,这个鸿沟时时处处在各种 AI 应用里会以不同面貌展现出来。你试试看给一个业外人士(比如你的父母)解释为什么 AI 算不清楚两个数字谁大谁小,你会发现这种解释惊人地困难,因为人民群众的直觉在这里是合乎情理的:再怎么说,它自己就是个电脑,它为什么不直接算一下呢?另一个例子是我在玩 GPT 4o 生成图像的时候发现虽然模型虽然强大,但它仍然完成不好诸如「把一张风景照主体内容不动,把上面的天空再往上延伸一些」这样的 outpainting 任务,而这即使在十年前对传统图像处理来说就不是什么特别困难的问题了。 在这里,我们谈论的实际上仍然是自人工智能这个概念于1956年在达特茅斯诞生之日起就阴魂不散的「符号主义 vs. 联接主义」之争。在基于统计神经网络的大语言模型走上主流地位之前,人们一直认为基于符号计算的专家系统是通向智能最有希望的道路,几十年来的软件工程实践在这条路上已经走了足够远,常用的工具(比如传统的软件开发环境)基本打磨到了极致。直到上世纪末联接主义这个烧了几十年的冷灶咸鱼翻生,基于神经网络的大语言模型从零开始试图重写从轮子到火箭发动机的一切已有的软件工程成就。它遵循的是完全不同的生长逻辑,因此对习惯了旧世界的我们来说,它的表现常常好得莫名其妙也差得莫名其妙,有些技能近乎魔法,有些方面又笨拙得宛如一个弱智。前面所说的变量改名就是个有代表性的例子,事实上,这里的难点甚至都不在于语法解析,而在于更底层的文本替换——对旧世界来说,哪怕在亿兆级别的文本里要把所有的 A 都替换成 B 也不费吹灰之力,以至于你根本都不觉得这还是一个「任务」。但对大语言模型来说这件事天生困难,并且难度随着文本大小急剧上升。绘画也是这样,你想直接让今天的生图模型「对图片按照某些明确到像素级别的规则做某些明确定义好的操作」极其困难,它觉得整体重画一遍比较省事。对用户来说这种体验常常令人抓狂。 打一个不精确的比喻。这两种模式可以粗略对应于大脑的左右半脑。基于符号主义的左脑在过去几十年里得到了充分的发育,基于联接主义的右脑在过去十年里急起直追,并且仍然在极速进化。问题在于这两个半脑之间沟通——对应于人脑胼胝体的功能——极其孱弱,才会出现 cursor 的编程助手不知道如何调用 cursor 的编译功能这种奇葩问题。 于是人们开始引入中间层。 在现实中这个中间层会被人们冠以各种不同的称呼,有人认为自己做的叫垂直 AI,有人认为自己做的是 agent,也有人认为自己做的就只是单纯的 wrapper。但在这个上下文里,它实质上起到的总是类似于胼胝体的作用,让神经网络模型这个右脑可以调用已经高度成熟的传统软件左脑的功能来完成更复杂精细的任务。事实上,这一部分的历史欠账已经如此严峻,以至于哪怕接下来一两年里大模型本身的思考能力停止提高(并不是完全不可能),单单改善这个左右脑的对齐问题也能解锁许多前所未有的能力。在今天,如果一个人说自己在搞 AI 创业但又没有直接训练大模型,那他们的工作多半就实际上可以归属于这一类。 这当然在整体概念上是个充满机遇和潜在回报的领域。毕竟,现有的软件工程领域的应用如此繁荣,切入社会的所有方面。但值得改进和革新的方向又俯拾皆是。把现有的专业知识和大语言模型的智能结合起来,再造一次信息化革命,听起来是成千上万现成的创业机会。 但困难(以及有趣之处)在于,虽然这种泛泛而论听起来很难反驳,但你会发现对每一个具体例子而言,人们对它的价值都充满怀疑。问题的根源是这两个半脑中传统的那一个相对静止,而新的那一个每天都在变化。因此任何工作都像是在和历史(确切来说大模型的进化史)赛跑。一个近乎讽刺的事实是,如果两个人都在前年开始投身 AI 图像生成领域,一个花大量时间和金钱投入 ComfyUI 和工作流的研究,另一个两年都在游山玩水,本周 GPT 4o 发布更新之后他们仍然基本上站在同一起跑线上。换句话说,你很难说服自己(和投资人)相信,你不只是一直在一架上升中的电梯里做俯卧撑。 于是你会看到 Richard Sutton 的 The bitter lesson 被人一遍又一遍提起——我想不出除了 Shannon 等人的早期作品外还有哪篇短文在人工智能历史上有这么大影响力——简单地说,它概括了这样一种原则或者说是哲学: AI 研究者总想把人类已有的专业知识经验塞进 AI。 它短期确实管用,还带来成就感。 但这么做迟早会遇到瓶颈,甚至阻碍 AI 的进步。 而真正的突破往往来自更多算力和更大的模型。 换句话说,大力出奇迹。除非你的专业应用有某些不同寻常的护城河,比如只有你自己掌握的独家数据,否则长远来看,通用模型总是能赢过专业方法。 回到上面那个左右脑的模型,这基本上就是在说右脑的成长如此势不可挡,以至于终将吞噬和取代左脑。因此任何立足于胼胝体的商业模型早晚都是失效的。或者用很多人很喜欢的一个说法:基于大模型的产品只是一个幻觉,模型本身才是产品。 当然,现实世界总是更为复杂。即使你认同 The bitter lesson 所阐述的原则,你也未必会接受这个极端的一刀切的判断。真正重要的问题在于边界何在,或者说,是否存在一些问题,即使对大模型的发展做最乐观的估计,用传统的(基于左脑的)软件工程解决方案也还是更为经济?如果这样的问题存在,围绕着它们所建立的接口就总是有价值的。 在我看来,这样的问题事实上大量存在。这篇文章开头所写的文本替换就是一个简单但有代表性的例子。你当然可能设想有一天大语言模型的 token 如此便宜,上下文窗口如此之大,以至于它真的能胜任亿兆级别的文本的文本字符替换。但它在这个问题上的效率上限也不过就是做到和传统工具一样好,换句话说,在这个问题上,左脑事实上已经掌握了 ground truth,右脑能做的只是逼近它而已。作为对照,上面举的另一个例子 image outpainting 则不然。虽然今天人们可以通过 Photoshop 一类工具做到这件事,但对它的实现几乎总是伴随着复杂的规则和需要考虑各种现实条件的工作流程,你完全可以想象有一天通用模型能够一鼓作气吃掉它。 现实中的问题几乎总是上面这两个简单例子的复杂混合。它们可能在各种层面纠缠在一起,并且由于历史的惯性并不被分别对待(因为在从前无此必要),但最终它们还是会被小心翼翼的解耦,然后分而治之。在我看来,这里才是所谓 agentic AI 领域的真正挑战:在日新月异一日千里的模型能力进化中辨认出仍然存在长远经济价值的「旧世界」的孑遗,进而围绕着它们构建人工智能接口。即使是为 AI 做带路党,也要做一名有长期利用价值的带路党。 目睹这场洪流之中新旧两个世界之间大规模的技能迁移,以及在洪流冲刷之后新的边界的浮现,可能是当下这个时刻最有意思的体验。 差不多两年前的这时候我写过一段话,后来被很多人转引过: 「当你抱怨 ChatGPT 鬼话连篇满嘴跑火车的时候,这可能有点像你看到一只猴子在沙滩上用石头写下1+1=3。它确实算错了,但这不是重点。它有一天会算对的。」 两年后你再访这片沙滩,那只猴子还在,但已经非复吴下阿蒙。此刻它正在充满困惑地摆弄一台袖珍电子计算器。电子计算器太小巧,显然是另一条文明路线下千锤百炼的产品,它的手指太粗太笨拙,还驾驭不了这么精致的工具。于是你充满信心——但也不无恐惧地——等待着它找到开关看懂按钮的那一刻的到来。
0
0
0
酸的雨
10月前
很少人看到了美团外卖业务真正的价值(之于美团自己)是打破商业地产对餐饮企业制造的流量牢笼。这是意义重大的
臀总: 我来给美团洗个地😳 首先每单不是七毛,而是两毛八,你付给美团的配送费是亏本的,美团的确在商家抽佣上赚钱,但83.1%的抽佣要支付给骑手。一年经营利润是28亿,看起来很多,但这28亿对应的营收662.6亿,净利润率只有4%,还不如银行理财,但对应直接解决了950万骑手就业,其中230万人来自贫困地区,算上美团的代理服务商和其他间接雇佣的人数肯定是千万以上。拉个参照物,开发王者荣耀的天美工作室2020年营收是100亿美元,差不多刚好是美团外卖的规模,对标A股游戏类上市公司,我猜天美的毛利率和净利率大概在90%和50%以上,也就是300多亿利润。一个游戏工作室解决了多少就业,这个我不清楚,但应该没有美团外卖多。外卖小哥的流动性极大,本来很多人就当作过渡工种,且并不是城市常驻人口,先不说上社保有多不便利,一旦上社保加工资,美团外卖4%的薄利肯定扛不住,企业又不是做慈善,羊毛出在羊身上,配送费估计要飙到10块左右,评论区说"天理难容"“怎么罚都不为过”的即友们,真正落在自己头上,有几个人能接受10块一单的配送费?到时候是不是又要骂美团黑心大笨蛋资本家了? 所以现在还觉得美团外卖在大笔捞钱压榨劳动者吗? 注: 美团数据来自2020年财报 天美数据来自新闻报道 美团外卖的确为美团其他业务间接带来导流产生收益,本人能力有限未能计算这部分规模,所以数据仅涉及美团外卖
0
0
0
酸的雨
2年前
春晚小品完美的学会了随地大小爹
0
0
0
酸的雨
2年前
神对比,设计毕业人员创业IPO率,拿华为一家的管理成效干死了所有互联网大厂~
Alchian花生: 这本书值得快读一下,大厂在风口的高增长和高薪让很多人高估了管理制度带来的价值,这本书对字节、阿里、腾讯、美团的人才管理制度的解读和问题分析能提供一个祛魅的视角
1
0
0
酸的雨
2年前
如果你家几口人都喜欢蕉内等新消费品牌的内衣裤袜子,那么在屯了一堆一次性机洗后,怎么区分是谁的臭袜子?
0
5
0
酸的雨
2年前
这个很可能得不偿失,老人家用的手机不是防蓝光高刷旗舰机的话,很伤眼镜。
一直盯着屏幕老年人很容易加重老花眼甚至白内障。
刷到的那点羊毛得不偿失不够医药费。
我们家老人劝不住,眼睛都看不见了,还是要刷。现在只好买个pad,让她刷视频时用pad,看剧就投影100寸大电视
王登科: 我妈还是厉害,给我看她零元购的一堆小东西,然后又展示了靠刷短视频和各种通过阅读和浏览就给返现的App,最近一年赚的一千多块钱(每次块儿八毛的提现),那些App里面的广告则一个都不点,属于真的薅羊毛专家了
0
0
0
酸的雨
2年前
分段结束,是某个时间点前续的一期会员,到期之后,后面续的就没券了
我是去年10月结束,但因为这个消息很早就公布了,所以基本上七月起就很难抢券了。
这个结束的策略,很烂,又长又臭,余音绕梁,还不如一刀切 //
@肥肠耐撕
: 我的会员都没有礼金了
臀总: 京东真是活该被pdd踩在脚下摩擦!🙄多年的plus付费会员了,这一年来几乎就没打开过京东买东西但plus还在续,今天想买一箱车厘子过年吃,结果plus100元的减免icon悄咪咪从第一页挪到第二页,深怕大家薅羊毛🙄 点进去一看居然还全部抢光了领不了,需要蹲准点抢,我真的要骂脏话了,今天进去了三次了都是抢光,我领个券还要tmd设闹钟吗?! 京东淘宝pdd我都开了plus/省钱卡,最近一直被唱衰的淘宝省钱卡体验反而最好,实打实的优惠,月费也不贵;pdd以前体验好,但把省钱卡从全场可用调整成部分可用,比较鸡贼;京东真的是体验最差,枉我开了五年的plus,到期谁续费谁是🐶!
0
0
0
酸的雨
2年前
这泼天的不富贵😂
王登科: 一大早起床(其实没有)看了眼,今天token 要爆炸了,犹豫要不要先关停了🙄
0
0
0
酸的雨
2年前
除了应答格式总是过拟合成1234之外,作为知识助理,AI是完全够格的。
克劳德可以自豪的说:没有人比我更懂专利。
1
0
0
酸的雨
2年前
从天猫国际 / z.cn的昂跑货源占比看,也让人误会昂跑是日本品牌
投资人黄海: 昂跑进店的这条队要排
0
0
0