即刻App年轻人的同好社区
下载
App内打开
TomXu在减肥
2天前
大家总说字节的杀手锏是大模型、是推荐算法。但算法发展近15年,技术差距早已抹平,甚至不少公司的算法不比字节弱。2016 年张一鸣去西格玛大厦的腾讯 OMG(PCG 前身)分享,说字节不靠人工编辑、全靠算法驱动,腾讯只看到算法,却没看到字节早已养起上千人做数据标注、标签清洗、分类与过滤。结果腾讯新闻和微视都被带进了沟里。

到了AI时代逻辑没变:所有人都在吹基座模型有多强,却忽略最底层的数据壁垒。美国1997年华裔创始人创办的Scale AI,专注AI数据标注,被Meta以近150亿美元拿下49%股权,估值近300亿——这就是数据的价值。

字节至今仍保持上万人的标注数据人力,甚至花钱请各地中老年人录制方言,录一次给 400-500 元,把全中国方言语料做深做透。这种“脏活累活”,阿里千问大概率不做,腾讯混元元宝更不会做。

表面看是模型技术领先,本质是扎扎实实的数据投入,从量变堆到质变。算法可以抄,模型可以复现,但日复一日的标注、清洗、真人语料、长尾数据,才是别人抄不走的核心壁垒。
5962

来自圈子

圈子图片

科技圈大小事

100万+人已经加入