大家好。
这两天,阿里林俊旸离职的消息,在圈内动静很大。
聊瓜我不太擅长,但这件事能折射出阿里一些问题,是值得思考的。
先说结论吧,我认为是:阿里AI战略上出了问题。
为什么这么说?我们不妨跳出离职事件本身,代入一下AI基座模型牌桌上那些还有大量筹码玩家的视角,阿里、腾讯、字节、Google、OpenAI、Claude等等他们在关注什么?
AI基座大模型有三个事情很重要:
01
模型战争,本质是一场长期战争
从2022年开始大中小厂一起卷模型,如今只剩少数玩家。24年、25年,我和投资人探讨一个问题:业界很多声音说Scaling Law带来的模型性能增长斜率已经放平了。我的判断一直没变:模型能力还有巨大的提升空间。
原因很简单:过去模型吃掉的主要是互联网上能被搜索引擎抓到的公开数据(也就是几家巨头手里的存量)。但还有海量“沉默的数据”尚未被消化,比如现在大火的龙虾,吃的是:用户本地数据、个人生活轨迹里那些未被电子化的信息,这些数据里当然也包括多模态。
那在这个前提下,大厂之间模型竞争“你追我赶”其实是很正常的事情。阿里通义千问的模型能力在25年时还是国内第一领先,但在后面逐渐被赶上且速度不及预期、甚至被反超,这并非不可接受。毕竟短期领先,从来不是最重要的。要知道OpenAI作为行业先行者并且资源也是数一数二的,模型能力也被反超过,直到现在在很多方面也落后Claude。
一时的领先落后没那么重要,关键在于清晰的战略和持续长久的投入,就像Google的追赶甚至反超一样。所以,我们完全可以期待通义千问半年、一年后的表现,因为出问题的不是基模本身。
02
AI行业最大的KPI误区:DAU
我个人一直不认同:用DAU作为AI相关业务的KPI,这非常传统互联网,尤其是做基模的公司。但很奇怪,很多公司都在这么做,比如24年的minimax当时1000万DAU的目标,甚至OpenAI现在还会去说。在国内就更明显:豆包、千问、元宝几乎都在看这个指标。
但对于基模来讲,真正应该看的KPI,一定是token消耗量(这点下面会说)。基模的愿景是成为AI大模型时代的水、电、煤,那token消耗量就是用水、用电、用煤量。追求DAU的KPI就会导致公司追求海量个人用户,但现实是:普通用户现在对AI的使用深度其实还不够。很多人只是问问题、写东西、偶尔生成内容。这确实能带来声量,但对模型的进化帮助有限,甚至可能是噪声。
也许大模型进化到下一阶段,载体就不是App形态呢?到那时,DAU带来的价值可能就只有品牌名字了。
所以,目前阿里千问App的DAU增长赶不上字节的豆包,在我看来现在没那么重要,全球60多亿人口,中国十多亿人口,AI应用才刚刚开始。
更何况微信都还没下场呢。国内大厂的AI竞争,严格来说才刚刚开始。
03
真正的胜负手:生态(即token消耗量)
真正决定胜负的,其实是生态。与其说林俊旸的离开是因为上面两点的短期乏力,不如说生态的失位,才是根本原因。
特别是龙虾火爆之后,minimax、moonshot、智谱接入之后带来的token消耗量暴涨,这意味着在全球开发者、自媒体中的影响力暴涨。阿里、字节、腾讯在干什么?没有第一时间去接入龙虾的生态窗口,这是很严重的战略失误。
大模型时代,全球开发者都可以创新,你无法预判下一个爆火的idea出自哪里。对基模来讲,重要的是能第一时间靠上去。
但可惜的是,阿里通义千问虽然在开源社区上做得很好,但是在生态连接上却不好。从24年到现在,巨大的基模相关的机会点:coding、agent、openclaw,可以说没有一个和通义千问是强相关的,这自然会导致在这些大机会点引发的token消耗量暴涨之时,模型能力增长变慢了。
生态爆发,会直接改变模型格局。Coding和Agent时期,带来Claude的暴涨,Gemini也乘势而起,给了OpenAI很大的压力,乃至现在美国大模型出现大乱战(最近马斯克狂批Claude的各种策略,何尝不是希望乱拳把老二拉下马自己上呢),而Openclaw这波生态,让minimax、moonshot、智谱的token消耗量直接完成了一次逆袭。当然从长期看,如果没有基模持续进化,这些公司很快也会面对大厂的价格战。
但是对阿里来说,真正的问题来自于战略判断:长期对生态机会的把握缺失,是比一个模型版本的落后、一个技术人才的流失,更值得警惕的问题。
写在最后:
AI行业有自己的优势,机会窗口出现得非常快,
也许半年、一年,巨大的机会就会出现。
只是窗口期越来越短,所有人都在拿放大镜看。
只因身在其中,你不能只做一个优秀的观众。
@Xinyang @yanjun @瓦恁 @kyth