即刻App年轻人的同好社区
下载
App内打开
虹口孙工
27天前
让大模型的风再吹一会

现在整个社会对大模型空前关注,互联网大厂,PE/VC(可能是找不到其他能投的),以及和算法、软件开发不相关的各行各业。说不上两句大模型都不好意思在上海喝咖啡。我对热度有比较敏感的警觉,现在的情况让我想起几年前的web3和元宇宙。刚好最近找工作也仔细考虑了一下大模型行业,于是决定总结一下自己的阶段性理解。

先看看大模型会带来什么改变。recap一下去年5月陆奇博士在奇绩创坛演讲时的一个观点:这会是一场范式革命,这次的革命是用模型对信息进行表达的能力从边际成本变成固定成本,因而可以大范围应用。它必须充分有效地表达信息,这种表达方式让它可以做推理、做分析、做规划。

举个例子,过去买一双鞋需要去各个实体商店去看、去比较;后来有了淘宝,商品货架这个形态被虚拟实现在了移动端,可以一次看几百几千双鞋,信息获取的效率得到了大幅提升;而大模型能做的则是在海量信息中告诉我具体该买哪双鞋,上班适合穿啥打球适合穿啥,信息决策的能力得到了大幅提升。这即是通过模型对信息进行表达。

说了很多有点抽象。大模型最终带来的范式革命是必然的,但往往周期很长,且最终形态是润物细无声的。现在大模型公司的估值已经高到离谱,对于现在整个行业、甚至部分非互联网行业都在密切关注大模型的盛况我其实想唱唱反调:不如让大模型的风再吹一会,让子弹再飞一会。对于想进入行业的人而言,这是一个长回报周期的事情,需要耐心和坚守;对于其他行业而言,先保持关注,不要在产品不成熟的阶段盲目尝试投入会更合适。

对于从业者,这次机会是中国互联网行业前所未有的:中国第一次和硅谷站在了同一起跑线上。OpenAI目前的技术领先是短暂的可被追赶的,而产品应用层面中国人则是很出色的。因为众所周知的原因中国和美国的大模型一定会分别自研并在各自的市场上应用,而在除中美外的国际市场上一定会真刀真枪的碰一碰。

机会固然难得,而更大的挑战是,如何创新对大部分当前这一批互联网从业者是陌生的。大模型最终带来的范式革新,并不会仅仅局限于在某个局部场景下的PMF,需要更多的深度思考。大部分现在这一批大型互联网公司擅长的是快速复制、打资源和流量战争,百度、淘宝、美团、滴滴这些在美国都能找到先发的同类产品。在产品成熟后固然有创新,但如何快速迁移到从起点探索方向的创新能力则是个挑战。他们擅长的事情是和别人赛跑,你要吃饭我就不吃饭跟你抢时间,最终卷成赛道里跑得最快的人;而在创新的探索中大家都不知道往哪跑,要一个一个试。在错误的方向上跑得越快,就离结果越远。

范式的创新至少需要两件事:一是极高的产品敏锐度和执行力来不断尝试,二是长期主义,沉得下心不断打磨,在探索完备之前不轻易宣发,忍得住短期诱惑。在这一波浪潮中,我看好以下两类创业者:一是在上一波互联网行业中真正做出过创新产品且获得成功的人,他们有深刻的行业理解和创新方法论;第二类是具有宏大愿景、理想主义,拥有极强业务直觉和探索精神,具备系统性思维,以及没有短期经济压力的年轻创业者。同时我不看好以下两类创业者:一是在成熟期加入大厂并工作5年以上的高管,二是前两年疯狂鼓吹web3,现在疯狂鼓吹AI的人。(如果表达太mean了,我反思。)

目前市场上的大模型公司主要有三类:第一类是做通用预训练语言模型的公司,即我们通常讲自研大模型的公司。这一类公司在市场上面临的难点是零和,即整个中文互联网世界只需要一个通用大模型。同时因为资源成本(买卡等)的原因,小团队在这个赛道是没机会的。如果产生了模型间较为显著的能力差异,其他输家将会被完全取代;即便换一个语种去重新投喂物料来训练,优势仍然是可延续的。

第二类是做大模型产品的公司,主要基于大模型在特定的业务场景下做后训练和agent,作为直接服务用户的垂类产品。这一类公司面临的困境是,底层大模型的能力本身在不断迭代中,因而这类公司会长期处于探索当中。这类公司也会不断面临市场诱惑:找到一个点就快速扩量盈利就失去了引领范式革命的机会,成为工具产品或特定垂类产品;不然就要熬过漫长的烧钱探索期,可能是5到10年。

第三类是做AI资讯和套壳工具的。这类显然是短期最容易赚钱的,利用短期热度和注意力,但并没有什么探讨价值。

长期主义是件很难的事。无论做通用模型还是做产品,需要克服很多阻力。大厂的大模型团队要面对什么时候能帮助我提升业务指标的压力,且需要应对群狼环伺:为什么这个负责人是你而不是我。高校团队需要定期交代经费用在哪里,做出了什么阶段性成果。创业公司要应对投资压力,天天说长期投入说了几年,什么时候能给投资人赚钱。以上这些都会导致实际操作变形,影响科研或产品探索的初衷。

以上是针对大模型行业自身来说,后面再说回到非从业者,普通人。引用某次字节all hands上提到的观点:大模型的落地最终会像大数据一样,今天几乎没有面向C端用户的大数据产品,但我们使用的每一个互联网产品几乎都用上了大数据。大模型同样如此,它最终会帮助各行各业提效、甚至改变形态,但一定是由行业自身来驱动完成。

假设回到过去,如果在小灵通时代预知到触屏手机在未来会广泛流行,这时候一个非从业者应该做什么呢?一定不是学习电路焊接进富士康,也一定不是拿着小灵通组织员工学习触屏手机如何给业务赋能并且让员工做demo写在周报里。回归到本质,行业知识和经验才是真正的壁垒。二维码收款会让卖包子的效率更高,却并不会让支付宝员工垄断包子市场,早两个月用上二维码卖包子也不会多赚多少钱。归根结底,还是要看包子好不好吃。

对于各行各业的普通人、非大模型从业者而言,其实不必把自己的职业焦虑cast到大模型上,你的工作更有可能被实习生替代,而不是大模型。一个成熟的产品必然是非常用户友好的,保持关注不必急于动手,静静等待果子成熟即可。
16

来自圈子

圈子图片

AI探索站

74751人已经加入