即刻App年轻人的同好社区
下载
App内打开

科技圈大小事

今天科技圈又发生了什么重要事件?订阅该主题就能知晓。

100万+人已经加入

  • 阑夕ོ
    6天前
    好多人让我锐评Qwen基模负责人林俊旸离职,好吧。

    我要说句不意外,肯定有人又要说我马后炮,但其实我这几个月来在上播客和写稿子里不止一次的提到过一个细节:

    清华大学那场AI-Next峰会上,林俊旸邀请观众体验Qwen,用的是qwen.ai这个根本没有运营投入的实验室网址,而不是千问App。

    模型干模型的,产品干产品的,这当然是模型团队的舒适区了,只投身研究、不负责市场,Qwen在开源社区里的究级口碑就是这么打下来的,但产品团队就难受了,做什么事情都需要和自己平级的模型团队配合,只能协调,不能统筹。

    产模分离是阿里过去几年里最奇怪的地方,在千问App还没有被独立出来发展的时候,还可以说且行且珍惜,现在千问App要直接和豆包元宝打消耗战了,还让模型团队保持例外论,这肯定行不通。

    最新的形势就是,大厂在做DAU,豆包现在还在发红包你敢信,小虎在冲ARR,月暗智谱MiniMax三家给洋人卖Tokens卖疯了,那么Qwen的位置在哪里呢,你总得沾个边吧?

    事实上,AI一号位工程的调整,是这一年来几乎所有国内互联网大厂都在做的事情,字节和腾讯都干了,轮到阿里大家觉得很奇怪,主要还是Qwen模型本身没出太大问题,突然换将有些刺激。

    还是那句话,组织的方向很重要,不认同组织的判断,就会很麻烦,这和你是不是一个好人、你做的工作是不是很优秀,关系不大。

    就像没人会不尊重杨立昆的学术成就,没有他老人家的贡献,AI的发展指不定还要晚多少年,但大家也都心知肚明,继续让他带Meta的AI实验室,那Meta就真完蛋了,你不可能让一个不相信Transformer的人去带领大模型⋯⋯

    前段时间,因为诉讼披露,微软的CTO有一封2023年底发给老板的邮件被曝光,里面是他但是作为对接人看到并汇报的OpenAI宫斗事件,说以Ilya Sutskever为首的研究团队讨厌需要和产品团队争夺资源,how dare you,竟敢让我们排队等GPU!

    微软的CTO在此批注,表示自己内心都是崩溃的:「OpenAI的研究团队根本没有明白,如果没有Applied的商业成功,他们根本不可能拥有现在这么多GPU。」

    所以,从国内到海外的实践经验都说明,产模分离是一个田园牧歌的理想状态,它可以暂时性的存在,但前提是公司没有市场回报的预期,愿意千金买马骨,Qwen这几年过的的好日子,都是这么来的。

    新的剧本就是阿里不愿意了,作风依然很粗暴很阿里,但就形势来说,其实没那么大的争议。

    再说了,和OpenAI的11个联合创始人里走了9个相比,这才哪到哪啊⋯⋯

    记得马老师曾说阿里要每年定期给社会输送人才,结果都是些年满35岁后被优化出来的P7P8们,给接收方的牛马们带去了一点点阿里味的震撼,连山姆看似牢不可破的名声都差点被打崩了,不过这次林俊旸流入自由转会市场,就没得阴阳了,是真的大牛出圈,大厂们赶紧抢吧。
    39113
  • 阑夕ོ
    18:59
    忍不住了,先喷为敬。

    AI圈贩卖焦虑已经过于离谱了

    138
  • Max_means_best
    13:15
    “全国上下掀起一股龙虾热”
    144
  • Max_means_best
    4天前
    这太疯狂了吧!!

    腾讯云在深圳搞了个龙虾的线下装机活动。。。

    现场这得得来了几百人吧???

    不懂就问,这个东西需要去线下装吗?
    你用豆包都能帮你装呀。。。。
    4948
  • Zero君聊AI
    12:24
    感觉鹅厂基本不怎么给开源社区做任何贡献
    而遇到这种低垂的果实
    总是第一时间冲上来
    把流量吃干抹净

    之前deepseek一火,元宝马上火速接入
    这次openclaw一火,马上qclaw就出来了
    而且还可以把电脑已经安装好的openclaw给“截胡”掉

    这么赚钱的公司
    对我们是好还是坏?
    156
  • AGENT橘
    06:32
    miclaw 看了一下,还是原来那套小米的手机系统API来回调用的东西,只是换了个名字蹭热点。
    小米真是不行了,从硬件到软件,认知都太落伍。
    81
  • 阑夕ོ
    5天前
    看到晚点LatePost也更新了谈千问换帅事件的播客,深度依然是全网无出其右,确实单口播客这种媒介形式也更适合即兴的去跟一些热点选题,比文稿生产的效率要高。

    总之,光速听完之后,阑心一言咔咔启动:

    - 简单化的去理解林俊旸的离职,一定会被牵着鼻子走,比如我们看到投放的料五花八门,有把阿里HR挂成万恶之源的,也有对冲说林俊旸在搞独立王国的,这些都是噪音,不是说对错不重要,只是很多时候你很难用对错来评价所有事情,需要接受个人意志和组织生长之间的摩擦必然有概率发展到不相容的地步;

    - 三个需要厘清的事实是,其一,林俊旸不是被离职的,阿里不可能主动开掉这个级别的Leader,其二,DAU是和千问App的产品团队捆绑,这是吴嘉/智能信息事业群的工作,不太可能牵扯到从属于阿里云的模型原地,其三,今年1月空降的周浩,是接替已经确定要走的后训练负责人喻博文,并不是来管林俊旸的;

    - 所以林俊旸的离职,更接近于一种「道心破碎」的结果,晚点主播曼琪的用词很微妙——「 长期知其不可为而为之的付出」——最后被组织架构调整这根最后的稻草给弄崩了,宣布离职的整个过程,就是没考虑给阿里的管理层留太多反应时间,是铁了心不想干下去了;

    - 千问的模型团队属于通义实验室,而通义实验室又属于阿里云,最后阿里云再属于集团,这个嵌套关系已经很复杂了,在叠加了千问模型作为阿里全村希望的战略定位,资源匹配问题就很大了,所以才有了连阿里CEO吴泳铭也不知道千问模型团队被卡资源的说法;

    - 林俊旸这边的人马高度依赖阿里云的Infra支持,但实际上他们觉得阿里云在服务外部团队上甚至好于服务自家千问基模——这也太离谱了——于是去年年底林俊旸绕过阿里云直接找吴泳铭争取了自建Infra的权限,这个越级操作也为后来发生的事情埋下了伏笔;

    - 还有一个比较难绷的是,去年春节前后,o1带动推理模型开始崛起,千问在后训练方面遇到了瓶颈,然而转用字节开源的强化学习框架veRL来做训练,发现效果有了比较明显的提升,相当于通过控制变量,发现了问题是在Infra上,这才有了林俊旸对Infra一直不满意的根源,要做垂直一体化的建设;

    - 但阿里云的判断不是这样的,因为混合多模态已经是明显的趋势,把各个模态、预训练和后训练都拆出来搞单元制,是一定要做到事情,但对原千问模型团队来说,这就是在被收窄范围,尤其是时间点卡在Qwen 3.5训练完成后不久,大家都很疲惫,突然又得到了这种不太像是奖励的调整;

    - 千问在开源社区赢得的名声,到底怎么转化成阿里的资产,这个量尺很难找到,在2B市场,开源意味着很难卖API,在2C市场,开源⋯⋯好像也没啥意义,用户不会因为你开源了就来用你的App,然而林俊旸是一个相当理想主义的Leader,万亿参数的Qwen Max旗舰模型是阿里没有选择开源的,但他也想推动开源;

    - 千问的模型团队从创建之初就保有着一个相对独立的工作环境,少被拉扯和打断,这种专注力被视为千问模型屡出成果的原因,但是当AI行业进入一场谁也输不起的All In战局后,这种与真实市场保持距离的自驱型团队还能不能存在,是一个原则问题,也是一个选择问题。

    153: 阿里Qwen人事变动:误读、近况、伏笔和未来

    晚点聊 LateTalk

    2735
  • weiki333
    11:49
    WPS for pad上线啦,有需要可以体验
    41
  • 托马斯骆
    2天前
    “拟为开发者提供 OpenClaw 部署服务”。都开发者了,为什么需要被部署服务。龙岗这拨人应该是焦虑得抽风了。
    54
  • Ryan.eth
    2天前
    林俊旸居然是本科学英语的,太强了
    86