即刻App年轻人的同好社区
下载
App内打开
杰克驾势说
18关注10被关注0夸夸
隐藏观察
杰克驾势说
25天前
今天听了晚点Auto采访小马智行联合创始人兼CTO楼天城的小宇宙播客——听播客我再看的《对话小马智行楼天城:只靠端到端无法通向 L4,模仿优秀司机令人绝望》这篇文章,要不然看不下去——非常有收获,简单记录一下:

1、做L4和做L2的技术路线完全不一样,百度在武汉只有400辆车跑、Waymo只有800-1000辆车路上跑,小马智行只有100辆车跑,就可以验证自己的技术,不需要像特斯拉和理想那么庞大的L2车队。

2、L4的公司在2019年就已经遇到了MPCI(平均多少里程接管一次)很难上去的问题,当时包括小马智行在内的L4企业都开始了技术转向、重构了技术路线,从Leraning by Watching 转为 Leraning by Practicing,也就是从L2的观察学习转变为实践学习。

3、在楼天成看来,特斯拉、理想、华为这些端到端技术依然是L2的技术路线,原因就是它们都还在使用观察老司机的开车方式,是一种模仿。模仿学习最大的问题是知其然不知其所以然,所以可以尽可能像老司机,但永远不能超过老司机,甚至模仿老司机太像之后会出现能力退化,因为老司机会有直觉驾驶,但是机器没办法。

4、楼天成认为L2技术路线一个的问题其实是会有人类的双标问题。就好像L2技术达到了几十几百公里接管一次,然后出问题了,人类会觉得机器不行、机器不可靠,但实际上人类司机也经常出错、也经常发生车祸,但是人类总是能原谅自己,觉得这可能是外界的问题,自己没办法避免事故。这就使得L2技术路线即便是做到500MPI、1000MPI也不行,只要有一次犯错,都是机器的问题。

5、L2不能做成L4,这个观点在理想AI Talk上理想也提到过。李想认为L3是L4的先导程序,而目前这个L3是按照端到端技术去做迭代的。理想的这个观点,前半截和楼天成的一致,但是后半截楼天成应该是不认可。采访中楼天成认为L2和L4的差别不是规则还是端到端的区别,而是Learning by Watching和Learning by Practicing的区别。但是earning by Watching有三个局限:1、只看摄像头信息开车,没有超视距信息;2、上面提到的双标;3、观察学习是“开环训练”。什么是开环训练?就是系统只能从观察来学习,无法判断自己是学得更好还是更差,就会放大和人类司机的偏差,最终导致反向优化。

6、楼天成认为本身1000MPCI的要求也是反人性的,因为1000MPCI意味着30次开车接管一次。但当你真正开了29次都没有接管的时候,你凭什么认为自己在第30次开车的时候就能够正常接管呢?所以L2技术是反人性的,也是L2不可能做成L4的原因。

7、他们现在的L4技术路线是一种“闭环学习”的方式,也就是所谓的AlphaZero的强化学习方式。这种方式就是“自己和自己下棋”然后来进步,而不用去看所谓的人类早期的棋谱。这种闭环学习的一个原理就在于,机器能够知道未来的自己这么做对不对,不对下次就不这么做——或者说当下就不这么做、相当于机器去循环判断未来几秒钟自己的驾驶策略对不对——以此来解决自动驾驶的问题。他举了一个例子“本质就是,向未来的自己学习:通过一个虚拟环境去模拟未来,就能反过来想当下的判断对不对。在驾驶任务里,5 10 秒后的决策对不对,单纯预测车的行为时不知道,但在环境里是可以知道的,因为可以模拟 5 10 秒后的环境。”

8、楼天成提出的闭环学习方式,反映到技术上就是搭建训练模型的虚拟环境,也就是“世界模型”,但是在Waymo那边称为Foundation Model(基础模型),本质是一样的。它是四个东西的组合:数据生成器生成的场景数据,驾驶行为好坏的评估体系,高真实性的仿真,最后是数据挖掘工具和引擎。也就是做一个虚拟世界的模型,然后在里面跑车端模型,只要这个世界模型的精度高,越像真实世界,再配合一个自我演进引擎的,机器就可以自我学习。所以这个世界模型更像是一个车端模型的工厂,车端模型不断在里面跑,然后不断生成车端模型,也就是所谓的Learning by Practicing实践模型。他说,Learning by Watching,数据量和算力是关键,Learning by Practicing,世界模型的精度是关键,这也是为什么 Robotaxi 现在公司很少说自己数据多,因为技术的关键不在这。

9、楼天成还提到一点是,他说之前做了 3 Learning by Watcing,已经达到一个不错的水平,然后做 Learning by Practicing ,也需要从零开始,这就是L4公司会比L2公司依然领先的地方。他认为不是说你L2做了多好,就可以转到L4上面。当然,他并不认为L2+是一个错误的技术路线,相反L2+提供的价值是给驾驶员的,而L4是一种移动出行的工具,两者的目的完全不一样。

10、他认为L2和L4的发展路线就如同一个 Y 字型,开始可能是共通的:一些基础架构、训练环境等,但真过了那个点,才会理解这两个东西原来有这么大差别。我们也是到后面发现,人类司机的驾驶数据没法共享。而且 L2 L4 要优化的重点场景刚好是不重叠的:L2 会主动提醒接管,而这些需要人类接管的场景,才是 L4 的主要任务。

11、楼天成的一个总结是,L2和L4是相互互补的需求,L4在成本上没办法替代L2,但是L2也没办法跃升至L4的要求。目前他给的一个L4的要求是10倍于人类司机的安全性,L4大概是10万公里级别的MPCI,而L2路线目前也就是300公里——只是L2在300MPCI上来说也完全够用了,毕竟还是说的目标不同。

12、最后楼天成延伸了一下聊AI,他认为现在大语言模型上的应用也会遇到L2和L4的问题,也就是说大语言模型还处于他们自动驾驶技术发展的早期,Chatbot或者co-Pilot类似于L2的辅助功能需求,L4可能就是智能体的需求,一个自动化解决方案。
00
杰克驾势说
2月前
《解密》:这部电影应该算是陈思诚拍的电影里面最好的一部,敢于走出自己的舒适圈也是一个很大胆的决策,应该要鼓掌的。

豆瓣上这部电影打分只有6分,我个人觉得就算有瑕疵,其实给个7.5分没问题,甚至考虑到风格类型的突破性,算个8分片也没问题。总之,这部电影明显被低估了,至少对得起一个国内那些电影奖的最佳导演提名,摄影和美术都是可以的。

先说说为什么我觉得陈思诚拍的不错。这部电影很有点诺兰的风格,但是和《奥本海默》这种追求纪实性的不一样,更像是诺兰早期的《记忆碎片》和《失眠症》两部。

虽然梦境的故事看上去有点像盗梦空间的点子,但是明显陈思诚的剧本不是那种硬核故事推进,讲得太东方玄学了,或者是类似于好莱坞意识流风格的手法(让我觉得有点像大卫林奇的《穆赫兰道》或者《双峰镇》风格)。尤其是最后破解黑密的那些环节,完全是跳脱拍摄的,尤其是把披头士的《我是海象》作为一个主旋律,放到1960年代的中国,那种冲突性太有意思了。

还有一些地方也很有意思,比如容金珍和教授在讲解海象和红色沙滩的梦、下棋时故意拿走一颗棋子这些,这场戏的镜头运用非常好,想法很巧妙。还有就是第一次在电影里面你能看到对环境的拍摄是直接透过车窗,带有一种和主角类似的观察感。还有第一次抓捕特务的时候有一个从室内摇到街上的镜头拍得也很细致。

当然,几处梦境的镜头也很棒,比如灯会游乐场的那个梦境,灯塔的那个梦境也不错,虽然被人吐槽金发美女太低端,但是想要表达的意思达到了。当然还有在火车上逃命那场也特别棒,给原本很枯燥的文艺片加入了爆米花电影的元素。

这些镜头我个人都很喜欢,感觉陈思诚是真的认真想过这些分镜,所以看起来真的是有大片气质的。

至于用采访手记的方式呈现,有想法但是效果并不好,感觉陈思诚想用POV的方式陈述,但是最后发现根本无法体现出效果,只能当做旁白了,非常遗憾。

另外就是风格化的拍摄有些没有衔接太好,比如瓦西里和郑局长的角色前面端起其实很好,后面突然就莫名其妙被加戏,缺乏了原本那种纸片人应有的立体感。同样还有吴彦祖那个角色,前面很立得住,后面突然下线太快了,少了一些应有的互动。唯一的贯穿的希伊思那个角色,最后被破解之后,感觉少了一点扣题的感觉。

表演上其实没啥太多说的,刘昊然还是太木了,前后呈现变化不大,导致对角色的深入表达不够。还有就是女主角实在是撑不起,感觉两个人的感情没有表现出来。倒是约翰·库萨克和陈道明的戏都很好看。不过这部戏本身也不是看表演,主角也就是工具人。

总之,这部电影虽然票房失败了,但是陈思诚证明了自己不是躺在沙发上的中年男人,至少还有前进的勇气。或许再过十年,他能比除国师之外的第五代、第六代导演们更成功一些。
00
杰克驾势说
2月前
《好东西》:这种电影真的是很妙的那种语言喜剧,喜欢的人会觉得很好,不喜欢人的觉得这算不上电影。

如果说冯小刚的电影是北方贫嘴相声集合、开心麻花是南派小品+肢体表演段子,那么邵艺辉的电影可以理解为“脱口秀”电影集合。所以这部电影豆瓣9.1分太夸张,最多也就7分。

在电影这种视、听、表演集合的艺术形式下,好东西的“视”部分其实很弱了,主要靠剧本和演员表演的演绎组合,没有什么很突出的影像呈现,画面说是平淡如水也不为过。大概比较好的一段视听呈现是小叶展示收集的音效、王茉莉的猜想和实际生活的场景那段蒙太奇,但是也仅次一幕。

这部戏还是写了好几场很好看的群戏台词戏,比如家里五个人吃饭雄竞的那场,还有就是日料店聊天的那场,其余一些零零散散的对话也有意思,就是没展开略微遗憾(特别是关于工作上的,自媒体账号编辑这个设定还挺有现实感)。这种完全台词驱动的情节还是很有意思,毕竟非常考验导演和编剧的呈现能力,不能拖沓和无趣,所以电影的几场群戏还是展现的很不错。

可是电影的问题也在于过于零散的段落,过于强调宋佳这个单亲妈妈角色的多面性,而忽略了人物弧光的建立。整部戏其实就是段子合集,包括生活、工作中各种段子,有些段子什么表现出来都和主线无关,感觉纯粹就是写的很爽。

由始至终宋佳这个角色都是类似于独立女性的一个展示面,又缺乏观众可能会预想的一种成长感。或许邵艺辉本身也怕去重复所谓的成长话题,所谓的自我的和解,干脆最后就直接躺平得了,成不成长关人物什么事情呢。尤其是最后反结局的表达,先是在天台上的两个人的对话,后面又是Live House的演出,最后以王茉莉的作文自述为总结“也就是顺利完成,没有什么高兴的”。这就成了全片最后的落笔点,那就是导演想说的,“没什么说教,看了就看了,别上价值”。

当然,这部电影还有一个好,是好在邵艺辉本身强调的是“女性主义”,而不是现在相当对立的“女权主义”。后者典型就是去年的芭比,说实话太难看下去了,而这部电影即便整个电影院只有我一个男的,至少我觉得这部电影没有对男性充满敌视,反而很解构主义的展示了所谓男性对女权主义的迎合,非常有意思的一段。

最后如果要和《爱情神话》相比,还是爱情生活更好一些。一个是爱情神话讲了一个更上海Local的故事,而好东西这个故事放到北京、成都也都能讲,其实地域性没那么强,可是同样又极力呈现了上海小资的所谓精英化生活。另外就是爱情神话最后的点题更好,好东西就弱不少。

不过还是很推荐各位看看,蛮有意思的,能够获得快乐的两个小时。
10
杰克驾势说
2月前
2024年广州车展漫谈,聊了聊为什么车企情愿高价请车模也不愿意请媒体。

Vol.20犀利复盘2024广州车展:车模、雷军以及谁熬不过2025年

驾仕说

00
杰克驾势说
2月前
聊下广州车展

Vol.19群聊2024广州车展:合资品牌告别“杂牌电动车”,尊界S800、iCAR V23是全场最大亮点

驾仕说

00
杰克驾势说
3月前
80后们又一次见证了历史。接下来就是等着8号公布财政刺激政策,80后的第三个康波机会,估计也是最后一个康波机会了。
00
杰克驾势说
3月前
大理的早中晚。
00
杰克驾势说
3月前
最近交易又进入垃圾时间了,看来最后美国大选一周时间交易会很谨慎。
00
杰克驾势说
3月前
首钢园,Photo by Huawei Pura70 Ultra
00
杰克驾势说
3月前
随手一拍
00