什么是OpenAI不会涉足的事情?前OpenAI开发者关系负责人Logan给出了他的看法。
这两天应该很多朋友都看到了Logan离职的消息,正好我看到有人在转发Logan三周前做客Lenny's Podcast的一期节目,认真听了下这期播客,没想到开头就听到了很有价值的信息,先摘抄我认为最有价值的一部分对话(为了便于阅读,对文本做了优化):
主持人:
「当人们考虑构建像TL Draw这样的产品时,他们应该考虑什么?OpenAI不会涉足的领域有哪些?OpenAI又会为我们做些什么?我们应该如何思考在哪些方面不会被OpenAI搅局,同时也要知道他们可能会改变主意?」
Logan:
「这是一个很好的问题。我认为我们深度专注于非常通用的用例,比如通用推理能力、通用编程和通用写作能力。当你开始涉及一些非常垂直的应用领域时,情况就有所不同了。一个很好的例子是Harvey,它是一个法律AI的用例,他们在构建定制模型和工具来帮助律师和法律事务所的人员。这说明我们的模型可能永远无法像Harvey正在做的那些事情一样有能力,因为我们的目标和使命是解决非常通用的用例,然后人们可以在此基础上做微调,构建他们自己的定制用户界面和产品功能。
我非常理解并为那些正在开发各种通用产品的开发者感到兴奋。我与许多正在开发通用助手、通用代理之类产品的开发者交流过,我觉得这很酷,也是个好主意。但他们面临的挑战是,最终会在这些领域与我们直接竞争。我认为有足够的空间让很多人都能成功,但当我们最终推出某种通用代理产品时,你们也不应该感到惊讶,因为我们今天就在用GPT构建这样的东西。不过,我们不会推出一些非常垂直化的产品,比如AI销售代理,那不是我们努力构建的方向。拥有某些领域专业知识并对那个问题空间真正感兴趣的公司,可以深入研究,利用我们的模型,继续保持领先优势,而无需自己投入所有的研发努力。
如果你想尝试解决非常通用的问题,如果你想构建能与ChatGPT这样的产品竞争的下一代通用助手,它必须有非常彻底的差异化。人们得真的惊叹说:"哇,这解决了我在ChatGPT上遇到的这10个问题,所以我要去试试你们的新东西。"否则,你就只是在投入大量的工程和研究努力去打造一个了不起的产品,而这只是创业时的常规挑战。要想与ChatGPT那样的产品竞争,实在是太难了。」
Logan的观点总结一下就是「OpenAI未来提供的将是通用化解决问题的能力,而不是仅仅面向某个垂直细分领域」。怎么理解这里的通用化? 我举两个例子来谈谈我的理解:
1. 如果把OpenAI打算提供的能力比做一个人,那么TA会是同时了解多个领域的通才,用芒格的话说,是个具有多元思维的人。但如果细分到某个领域,TA可能短期内无法超过最顶尖的那批人。
2. 如果把OpenAI比做是微信,那么他们可能会做的东西是小程序平台,但不会亲自下场去做拼多多小程序或者美团外卖小程序。
看完上面的话,有些朋友可能就会想,“那我不去做平台不就好了嘛,我就去做垂直领域”,但是,真的有这么简单吗?
让我们来假设这样一种场景:
创业者小北怀着只做垂直领域的想法,打造了一款面向创作者的AI神器。它可以根据用户提供的主题写出一篇视频脚本,然后根据视频脚本生成多张AI图片,再用另一个技术让图片动起来变成视频,最后将这些视频拼接起来,配上AI配音,生成一个完整的视频。这个产品最大的亮点是将复杂的视频创作过程自动化,用户需要做的只是给它提供一个主题。
然后这个产品上线了,一切都很顺利,很快就吸引到了很多用户,拿了更多融资,计划扩大规模,空气里洋溢着快活的氛围。
3个月后的一天,小北半夜里被投资人的电话吵醒,远在16个时区之外的CloseAI刚刚发布了TPG-6模型,可以输入文本、视频、音频,也可以输出文本、画面非常稳定的视频和内容清晰的音频。
接下来的剧情你大概也能猜到了,小北的产品被新模型降维打击,不久之后走向了结局。
刚刚这个故事想讲的东西很简单,既然通用化(AGI里的G-General)是OpenAI的目标,那么更高的推理能力、更长期的Plan能力、更大的上下文、更少的幻觉、更多的输入输出模态必然是他们的Top Priority,在规划垂直化领域产品的时候,一定要将未来模型演进的方向考虑进去,这样才能最大程度避免被降维打击。
如果想象未来的模型是什么样有点困难的话,你可以尝试从逆向角度去思考一个很重要的问题:
在模型一路狂飙进化的过程中,有什么东西是不变的?
当然,除了模型层面的降维打击,应用层面肯定也会存在降维打击,篇幅原因这里不再赘述,后面有机会再分享。
最后说点题外话,ChatGPT出现之后的这十几个月里的确是充满了兴奋与惊喜,在人类以前所未有的速度通往AGI的路上,祝各位朋友都能找到合适的座位,一起奔赴未来。
PS.这期播客的信息量很大,里面还有包括组织架构、产品未来演进等等方面的内容,推荐有兴趣的朋友完整听一下