这几天Kimi突然在二级市场火了,做二级市场的朋友也开始跟我打听,“Kimi真的很厉害吗?区别在哪里”。
我蛮惊讶的,但不是很意外。
一直以来,无论是chatgpt还是sora两波浪潮,中国AI环境里各种要素有一种“弱者思维”:OpenAI做了,你为什么不做?/OpenAI都没做,你为什么要做?
这样的环境体现在中国AI创始人身上就是不太“敢”或是“能”去做创新的技术战略。在技术路线分散的时候,为一项技术路线赢取支持是一件太难的事情。大家都避免去“赌”。
比如sora赛道的几家中国公司,其实在Sora破圈前就已经自研出了类sora的架构-- diffusion transformer(U- ViT,CVPR2023)。
但是为什么直到sora出现之后,“长视频”这个点才引起了大家的追逐?
因为即使是在已知架构可以带来提升的前提下,“把视频长度做长”这件事在当时仍然是风险远远大于收益的一件事,谁也不知道60秒的视频生成会不会引起全民关注,进而给公司能带来多少资源以支撑自己进一步做下去。
但今天我们看到了什么?
虽然长文本在研究领域一直是比较热的话题,但在工业界,就像sora爆发前的“长视频”一样,大家都觉得这是一个“重要但不紧急”的事项。
去年十月份,月之暗面率先对外介绍自己的“长文本”战略,并且在机器之心独家详细解释了“为什么长文本是重要的”背后逻辑。
在Kimi指数狂扫A股的时候,百度、阿里、360开始紧急上线自己的“长文本”能力。
系统化的战略认知能为一个人带来战略眼光,坚定并真实的信念感能为一个人吸引到同频的支持者,脚踏实地的快速迭代能为一个人时刻校准方向。所有的一切形成了一种不偏不倚的理性勇气,勇气带来了创新,创新带来了领导者地位。
某种角度看,月之暗面已经成为中国的OpenAI。