看了一财新皮层团队的《腾讯混元3年变形始末》,一些信息点:
1、腾讯在 2023 年启动混元大模型研发,但直到 2025 年底,才首次将大语言模型明确升级为“一把手工程”。
2、在姚顺雨入职前,混元先后由张正友、蒋杰负责,两人背景主要集中在计算机视觉和数据平台,而非自然语言处理。
3、混元早期长期以“虚拟团队”形态存在,成员分散在 AI Lab、TEG 等多个部门,职责与资源边界不清晰。
4、ChatGPT 发布的 2022 年,腾讯正经历游戏业务下行、降本增效与内部节奏放缓,大模型并未成为当时的战略优先级。
5、2025 年开始,腾讯对混元进行系统性重构:大规模高薪抢人、快速抬升职级、压缩汇报层级,并拆分出独立的 LLM、Infra、Data 团队。
6、姚顺雨于 2025 年下半年从 OpenAI 加入腾讯,成为国内大厂中最年轻的 LLM 一号位,并直接向刘炽平汇报。
7、在模型策略上,姚顺雨明确提出降低内部发版频率,从预训练数据和后训练体系重新打磨模型能力。
8、混元 2.0 于 2025 年 12 月发布,总参数量达 4060 亿,英文名更新为 HY2.0,被视为重视全球市场的信号。
9、行业层面,大模型竞争已进入“配方明确期”,Google、DeepSeek 等案例表明,复刻成熟路径比自行探索更具效率。
10、混元下一代模型将重点转向 Agent 方向,留给姚顺雨和腾讯验证成果的时间窗口,大约只有半年。
可能是目前市面上解读腾讯混元为什么落后最全面的文章。读完觉得腾讯这把真应该紧张了。和谷歌面对的OpenAI的冲击,迅速扭转的情况并不一样。谷歌在AI上的积淀是最深的,甚至不是之一。
谷歌很早就把一家巨头能在AI时代做的事情全做了一遍,芯片,无人驾驶,自主研发模型,基础设施和云平台,把AI能力融入从搜索到YouTube到办公工具的所有产品线等等,甚至重新捡起可穿戴设备。
腾讯没有谷歌这个先发优势,QQ孵化器魔法又在近5年失效了。近5年,整个中概互联光看着字在后发制人。