《硅谷101》
@泓君Jane 对谈真格基金
@yusen 部分takeaway如下:
- 雨森使用AIGC工具的经验
- ChatGPT发布第二天使用就被惊艳到了,最震撼的是玩20问的游戏,见识到了ChatGPT能理解规则且有效利用二分法高效查找。
- 从2022年8月就开始使用Midjourney,到现在画了几千张,明确感受到了V4版本对于人物的优化,V5在很多细节和场景的真实度加强了很多;并且Midjourney最近发布了很重要的功能Describe,可以根据用户上传的图片生成几个可能的prompt,这个功能极大帮助到了用户创作。用户可以有效将一个构图不错的内容换一换建筑物。这也导致了游戏行业原画领域砍掉了很多美术。
- 雨森觉得ChatGPT哪里做得好?
- 语言相关包括自然语言和编程语言:很多人都用co pilot写代码,翻译、总结、改写、扩写的任务完成度都很高。
- 头脑风暴型任务:利用ChatGPT进行概括,列出来五个关键点灯类型任务。
- 真格在评估大模型做了哪些事情?
- 做出了一套评估模型大概300个问题,目前已经对外公布,但是还有很多暗题避免作弊。
- 比如,如何做麻辣螺丝刀?除了GPT4会告诉你不能吃螺丝钉,其他的大模型都胡编乱造一个菜谱。
- GPT3.5可以答对60题左右,GPT4可以答对70题,国内大部分创业公司是20-30分,商汤做到了50分。
- 对于创业公司来说,从20追到50很容易,但是50-80会很有挑战。
- 过去两个月大模型有哪些进展?
- 最开始的Chatbot本身已经很惊艳,但只相当于自动驾驶的L2。
- 第二阶段像Co-pilot, 协助人类完成一些工作,差不多是L3。
- 第三阶段像AutoGPT这样的产品会是接下来的趋势:识别一个大任务,分别拆成子任务,调动工具完成子任务,观察自己完成的结果,对结果进行反思,调整要做的任务。这个阶段相当于自动驾驶的L4。
- L5是什么呢?人给一个目标,AI也不需要监督就可以自主做完所有任务,冯诺依曼提出过类似的概念。
- 从创业的角度来说,晚做会不会比早做更有优势?比如晚做可能直接GPT4而不是3.5了
- 这是一个假设,很有可能3.5到4就是改一个api key的区别;而且从历史来看,科技领域先发优势还是占多数的。
- 对于早期创业来说,踩过坑非常重要,早期经验的差别是0和1,中后期可能是9和10。比如张小龙当年做微信的优势来源于QQ自己的技术积累,而米聊没有踩过这些坑就输了。
- 什么情况会有后发优势呢?
- 之前不知道能做出来,且花N人N钱就可以搞出来,那就很有可能很快追上了,也就是当前国产大模型的现状。当大家知道新大陆就在西边,并且一艘大船和2个月的食物就能到的时候,这些确定性信息就会显著缩减后发者的追赶时间。
- 国产大模型现在的情况是什么样呢?
- 因为现在没有一个国产的类似于ChatGPT的大模型,所以大家都在做这件事情。而美国已经不再有新的独立做大模型的公司了。以后的格局也会是三四家各有特点的大模型分割市场,可能一家擅长图像,一家擅长推理。
- 国内芯片短缺的问题是否会导致越落越远的战局?
- 是否大模型真的是百公里长跑?也可能现有算力就够了。
- 随着训练效率和方式方法提高,对芯片的需求会降低。
- 国内半导体工业还在发展,同时也寄希望于中美关系缓和。
- GPT3其实只是在一万块v100训练的,基础大模型对于芯片的需求可能被高估。但是,GPT4是在一台Azure为OpenAI定制的超算训练而成的。
- Yusen对于OpenAI的评价
- 虽然一开始是一家研究机构,但是很有PM的思维。GPT4发布的时候已经经过了几个月的合规训练,并且也没有着急发布text to picture/video的功能。如果单纯从研究机构考虑的话,OpenAI会很有动力抢头彩。
- 合规安全仍然是非常大的挑战,如果坏人利用GPT4干预大选,调用所有的语言学、心理学、逻辑的技巧去说服选民,很有可能美国总统就变了。
- 股权设置很有意思,Sam Altman是没有任何股权的,盈利主要分给了科学家。作为股东,只能从财务回报和投票权二选一。Sam选择了不要钱,要投票权。
- Yusen给年轻人的建议
- AI与前几轮的Web3 元宇宙浪潮不一样,AI就有直接的实际应用场景,提高生产力。
- 技术革命预测未来基本不准,2010年移动互联网开端很难想象到2023年字节、拼多多、小红书等公司。
- 技术革命的早期要尽早上船,技术比较成熟的时候有利于连续创业者,但技术比较新的时候有益于年轻人,保持冲劲,多用多探索。