作为AI司马迁,这个春节是肯定没办法平静的度过了:
鉴于已经有两位朋友已经提前预约了我还没准备做,
但他们预判我肯定会做的春节期间的AI行业综述PPT 首秀,
所以我必须提前做些整理和记录⋯⋯
先记录当前最热的视频模型进展:
1、我在2月初的年度PPT里提及今年多模态领域的竞争会边际加剧,且这一波国内厂商会更加激进;
不曾想,这个说法直接被快手可灵3.0 和字节seedance2.0迅速实现了;
(所以我一次次强调为什么我的PPT都得赶紧做完,因为指不定哪天外面的世界就突然变了)
2.和去年的deepseek R1同样的路径:
春节前,
墙外墙内两开花,
普通老百姓都有明确的体感认知,
专业用户即便对之前版本有所了解,依然对新的大版本有强烈刺激到;
3.我在最近几个月一直有个观点是语言,多模态(包括最近很热的世界模型),coding并不是平行关系,最后肯定是“一桌”;
最新的可灵3.0和seedance2.0已经不单纯是在卷所谓的画质,一致性,生成速度这些“基础”的战术层面的功能;
视频模型能力已经进化到开始理解叙事方式,镜头语言,剪辑节奏这些真正意义上的人类这么多年所积累的所谓knowhow上;
4.模型能力发展到今天,本质上各家厂商在自己的模型训练上其实都出现了一定程度的分化,按照guangmi的说法就是大家到底在bet什么;
同样是视频模型领域的可灵和seedance在当前阶段其实已经有所区隔,甚至我们把veo和grok都放进来进行对比,这个结论依然成立。
可灵3.0或者说快手的可灵过去一段时间的版本更迭是瞄着专业用户的内容生产去的,所以我们看到了可灵之前公布的2.4亿美金ARR;seedance更想做的是帮助普通用户做表达,这其实也是字节这家公司底子里一直都在的东西的某种延续;
且这种选择目前看没有谁对谁错,只有阶段性需要各自厂商想清楚自己要什么。
5.上期播客我和快手的朋友聊内容行业的2025,首先聊到了AI漫剧这个市场;这是25年下半年突然开始暴涨的细分方向,完美匹配我之前总结过的6个月-破百亿流水-8个点毛利的定律;
这个领域的爆发第一要感谢的就是视频模型们在25年下半年的突飞猛进;这个案例也完全符合技术到达某个阈值直接引爆落地场景的规律。(年初这一波以OpenClaw为代表的个人Agent爆发其实也符合这个逻辑,但这个得单开一条,今天我就不展开了)
写在最后,多模态(尤其是视频)在26年的竞争加剧已经是“明牌”中的“明牌”,希望像快手,字节这样的中国厂商能够引领这一技术的边界拓展。