即刻App
年轻人的同好社区
下载
App内打开
Riching
51
关注
5
被关注
0
夸夸
爱看美漫🦄
Riching
5月前
Context Engineering for AI Agents: Lessons from Building Manus
Kenny_肯尼: 今天AI界最大的新闻是manus以数十亿美金价格被meta收购,也是中国人团队史上最贵的收购,公司创立三年,几十亿美金落袋为安。 这个价格是什么概念?做出Kimi K2这样超强模型的,让硅谷都respect的月之暗面,目前的估值也就40亿美金。 1. 为什么meta要收购Manus Meta很有钱,但在AI领域落后,前几个月主题是亿级美金年包挖大模型训练人才,现在是重金收购应用层,Meta对AI的态度跟腾讯有点像,最终是把模型的智力服务于生态发展,而不是单纯追求AGI和技术突破。 Meta可能看重Manus两点,一个是通用agent的产品定位和工程能力,Manus在在复杂长程任务执行有极强的优势,并且1亿美金ARR也验证了PMF,对Meta来说,可以让模型到应用之间的转化更加快速有效 另一个是组织能力,Manus在技术大潮来临前,敢于往一个“没人看好但逻辑正确”的方向全速前进的嗅觉和组织执行力,3月刚出来,大家都觉得这有啥,可以快速做出来,但到现在,依然只有一个manus 2. Manus不是简单的套壳 首先,Manus定义了Agent的产品范式,也因为它,涌现了那么多垂类的Agent,这个足以留名 Manus没有做模型训练,是在模型和应用之间,做了非常扎实的工程建设,给AI一个电脑环境,提供最基础的工具,让它完成几乎所有人可以完成的事情。 给Agent的工具数量不多,都是很底层的,比如shell、bash、file system、browser,让agent基于用户需求,调用这些工具去实现,而不是在上面挂在非常多的基于特定场景定义的一键式工具 这种方式,可以满足用户尽可能泛化的需求和提高效果的天花板。 用一个视频剪辑的比喻,一种是提供一系列的滤镜、特效,一键套用,快速稳定出结果,另一种是提供曲线、色轮、HSL等基础工具,牛逼的调色师可以调出几乎所有的色调,而且很精细,Manus选择了后者,因为赌模型的能力会进步并且超过人类。 但这样会带来3个问题 1)工具越基础越底层,完成一个任务步骤就越复杂,带来了上下文窗口爆炸的问题,于是Manus在上下文工程上也做到了极致,推荐看 Context Engineering for AI Agents: Lessons from Building Manus 2)每个任务都是从0开始,不如workflow预设的稳定和快速,Manus是先通过通用的方式吸引用户尝试各种任务,然后分析高频、高价值的任务进行反向优化,推出类似预设的能力,让常见任务更快完成。这个思路我有实践的体验,过去产品经理是带着个人的先验来做判断,大部分是赌输的,字节的AB文化,降低了对产品经理主观经验的依赖,而AI时代,大模型的泛化能力 + 用户实际需求的复杂性,更进一步了,这三年的感受是,你永远不知道用户会怎么用模型和产品,而且会给你惊喜。 3)面对一个输入框,用户不知道怎么用。 - 先满足少数用户的需求,不要直接切最大众的,因为最大众的就是豆包里的快问快答,并且还不会付费; - 通过replay和社群分享其他人的优秀实践; - 把PPT、wide research这些高频需求,固化为预设,放在输入框下方作为快捷入口; - 连接用户的context,比如gmail、calendar,更主动地完成 3. Manus的经验借鉴 24年立项,25年3月上线,事后看,这个也不复杂,但是在24年立项做这个是非共识的,需要极大的勇气和坚定的信仰判断。推荐看manus立项会议纪要,在当时做这样的判断,还是很respect https://mp.weixin.qq.com/s/Ud0djNpSAqUoFUYpTzasmg 3月发布的时候,我拿到邀请码后,周末和@钟十六 @叫我本泽马就好 朋友研究manus是怎么做的,当时是Claude 3.5 sonnet没有原生的planning和tool use能力,manus是产品层来实现,的确当时没有那么难做,甚至有48小时复刻manus的开源项目 但是那么多团队做manus,都没做成,差在两个点,一个是认知,大部分人当时还是以当时的静态看manus这个产品,一堆问题,没有从长期角度看。另一个是组织,做一个demo,和 做一个产品,以及保持领先的产品,之间是巨大的鸿沟,需要配套的组织能力 即使monica已经做了两年AI产品,但做manus这样超前的不确定的产品,依然很难达成共识,所以manus最开始一直就是五人,充分共享context,高度对齐,高效沟通 4. 资本市场的影响 Manus,创业3年,产品上线九个月,ARR1亿美金,token消耗量140万亿,以几十亿美金被收购,对资本市场是利好,VC赚到钱了,会更加愿意投钱,创业者也更容易融到钱,这种泡沫会放大。 Manus靠IPO还是非常难的,token消耗太恐怖,亏损严重,也很难长期依赖融资,不如给财大气粗的meta,这是理性的商业判断。目前也是最好的时机,最好的结局了。 不过被美国公司收购,有点尴尬,还好已经转到新加坡,不然在某些方向的影响不大好看 ai创业还是要出海,国内用户爱白嫖,大厂爱抄袭而不愿意收购,上市更是遥遥无期,导致国内VC的投资更偏财务投资,而非真正的风险投资。当然国内也有大笔人民币资金投入,只不过会流向更偏实物的芯片、机器人。 1月8日智谱IPO,股票代码2513,如果能打新,就是赚到了。 附上3月对manus的一些分析 看宣传片的分析 https://m.okjike.com/originalPosts/67c8724d92fdb6dbc6f61ed4?s=ewoidSI6ICI1OTE5MGI1MWIxYzVhODAwMTIwOWY2NDYiCn0= 对manus营销的看法https://m.okjike.com/originalPosts/67c9d3367cb8c547e25c73ac?s=ewoidSI6ICI1OTE5MGI1MWIxYzVhODAwMTIwOWY2NDYiCn0= manus上手体验 https://m.okjike.com/originalPosts/67cdabd540e6b6754a7b402a?s=ewoidSI6ICI1OTE5MGI1MWIxYzVhODAwMTIwOWY2NDYiCn0=
0
0
0
Riching
5月前
2年内,99%的人都考不过ai,但是不影响人能做更多ai做不到的事,而且很多事还是需要高能力的人的做的。而高考能筛选出高能力的人,所谓高分低能是绝对的少数,大部分高分低能还是停留在某些低分低能的人的意淫里。
所以最后的结论就是高考不会取消,原因高分能筛选出高能的,而企业、社会需要这种筛选去做决策,和ai不ai无关。
另外更会用ai的人会更容易取得高分,高考也帮助筛选出这些更能适应ai社会的人。
梁梁喝茶不加糖: 如果90%的学生,高考成绩都不如AI,那么高考会取消吗
0
0
0
Riching
9月前
现在已有的所有工具类app都可以被ai赋能🤣
0
0
0
Riching
12月前
这么久了,评论里还是不能回复自己😠😠😠
0
2
0
Riching
1年前
鼓励平民创业确实不靠谱,但是茶饮品牌每年新出几百个,有关系有背景,背靠大树的多的是,做到霸王茶姬这个层级的也没几个。
如果下面评论说得是真的,富豪的女儿就算残疾,也不是随便谁想娶就娶的,就算娶到了也没几个能做出来霸王茶姬这种量级的公司。
平民创业的逆袭人生确实很少,但是有很多人通过“努力”脱离了原本的阶层,平民通过足够的努力做到霸王茶姬这样很难,但做到踏入普通中产阶级相较而言就简单很多了。
至于对外宣传什么,大家冲浪这么些年,懂得都懂
麦子肥肥: 哪里有啥平民创业的逆袭人生,都只不过是对外宣传罢了。
0
0
0
Riching
2年前
王帅真: 写了个很简单安卓的小组件,能看 b 站当前粉丝数,放在桌面激励一下自己,努力技术号冲一波千粉😼 (满足自己需求了属于是
1
0
0
Riching
2年前
Diiiii: 上海的生育率跌到了令人发指的0.6,又引起了不少讨论。大家都在感叹人口问题有多严峻,但我个人其实最好奇的是,为什么计划生育政策延续了这么多年?为什么不早点取消? 国内似乎没有太多与此相关的讨论,兽楼处之前写过一篇被封了,最近又解封了。去简单 Google 了下,初步看下来,似乎有学术界一言堂的问题。中国的人口政策是由这些“人口学家”们来把持的,人口学这个专业的开山鼻祖就是宋健,之后演变成了学阀,徒子徒孙们都不敢大逆不道。直到 2003 年以后学术界才开始出现零星的反面意见,到 2010 年才有初步证据。全面放开二胎政策是 2015 年出台的,找到一篇 2013 年路透的文章,可以看到当时学术界还没有形成共识,支持和反对的声音还是难分伯仲。当然,公平地说,也不能都归咎于一两个人,毕竟做这种长期的估计还是非常困难的。我个人理解是,在早年建模过程中的假设出了比较大的问题,尤其是没有考虑到多年的计划生育政策和激烈的竞争环境对生育意愿的压抑。之前的假设是,如果政策放开了,人口能够快速回升,但这里高估了生育意愿的弹性。 最终生育率 = 生育意愿(理想子女数) * 生育实现率(实际执行率)。中国最大的问题在于,生育意愿在这些年下降得太狠了。这可以从下图中看到,1995-2003 年出生的女生,“理想子女数”才只有 1.3,天花板就只有这么低... 相比之下,即便是韩国,至少人家还是想生的,“理想子女数”接近 2.5... 人口是个慢变量,有很强的后置属性。猜测建模、统计和跟踪的时候没有考虑到这些前置指标,或者至少没有放在足够的优先级上,以致于当发现最终结果出了问题之后,已经来不及了。 除了学术原因之外,计划生育部门的既得利益者们应该也会施加很大的阻力。但最主要的问题还是学术界的认知问题,以及政策的惯性问题。 总之,40 年前顶层设计的人口战略,如何逐渐过时,为什么没有被及时纠偏,其实是非常值得反思与复盘的。遗憾的是这方面的关注和讨论还是太少了。 相关链接: 《兽爷丨反对者的四十年》:https://mp.weixin.qq.com/s/ANjoCnAyBHxaVJIYh-rjKA 《A New Low—上海户籍人口生育数据》:https://mp.weixin.qq.com/s/8H2BV51e0SVxK89ESPHFgQ 《各国生育率都在下降,但是为什么东亚降到全球最低?|於嘉 一席第1043位讲者》: https://mp.weixin.qq.com/s/gFH7Rztkcvsy-ZR_KtfhsQ 《梁建章:人口经济学十五讲》:https://mp.weixin.qq.com/mp/appmsgalbum?__biz=Mzg2OTAzNTUwMA==&action=getalbum&album_id=1839876745768845316&scene=173#wechat_redirect
0
0
0
Riching
2年前
大黑天: 在《妈妈的工作越来越多》里,历史学家露丝·施瓦兹·科恩写道,当家庭主妇用上诸如洗碗机和吸尘器之类的家电之后,看似“节省劳力”的设备却根本没有节省时间,只会提高社会对干净的标准,抵消了使用家电带来的好处。既然能将丈夫只穿过一次的衬衫恢复到一尘不染,那你就会感觉应该这么做,以显示你有多么爱他。 效率工具也是一样的道理,看似“节省精力”,实际上并没有节省时间,只是你再次提高了标准而已。 你同样会告诉自己你多爱“它”
0
0
0
Riching
2年前
波点音乐居然可以分享到即刻
杨宗纬&张韶涵&夏日入侵企画 - 恼人的秋风(Live)
0
0
0
Riching
2年前
很有趣
晨然_: 突然get到采访的技巧,为了获取更多信息 询问他人一个问题,有时候不是为了听他的答案,而是观察他的first token latency 如果他思考过这个问题,他会非常流利清晰的表达清楚这个答案 如果他不关心这个问题、不在他的生活场域中,他会犹豫反复然后不知道怎么回答 接下来就可以对他思考过的问题中的关键词继续probing, lift up the air, 问出有价值的新鲜的他不曾看见的思考
0
0
0