Tesla的自动驾驶目前已经做到什么地步了?这期播客里提到,某位造车新势力的试驾专员在五一期间,去美国开了3000公里的Tesla FSD,其第一手的试驾体验如下:
- 整体策略上,如果将“安全”、“效率”和“舒适”看做是自动驾驶的“不可能三角”,那么特斯拉的策略是绝对的“安全”优先,为了安全可以牺牲效率和舒适(个人对这个“不可能三角”的定义有点疑惑,为什么效率和安全、舒适是不能兼得的呢?);
- 某种意义上,Tesla的FSD已经实现了L3(“有条件的自动驾驶”,驾驶员的手可以离开方向盘区域,但系统有时会要求驾驶员重新接管车辆)。体验下来,前100-200公里适应了之后,在其余的2000+公里的行驶中,驾驶员不再需要接管。或者准确地说,如果将“接管”分为“安全接管”(再不接管就出事了,被动接管)和“舒适接管”(不接管可能会绕路之类的),那么目前的FSD已经能做到不需要任何“安全接管”,只需要“舒适接管”。极端一点,假如“驾驶员睡着了”,FSD也能做到绝对不出任何主动事故,最多是被其他车追尾。当然,目前的Tesla车内摄像头是不允许司机睡着的。总之,我理解车主想要表达的意思是,在安全性上,目前的FSD已经做到了极致,是可以被信赖的(Tesla官方的数据是,美国每百万英里的严重交通事故率是1.53次,而启用了FSD beta的特斯拉是0.31次,几乎是5倍,而Tesla的目标是要做到至少10倍);
- Tesla FSD提供的是端到端的驾驶体验,即从上车设置目的地开始,一路到达终点停车场。由于Tesla没有高精地图,在美国依赖地图商TomTom,它的导航比起GoogleMap之类的产品还差得很远,导致经常会走错。但自动驾驶带来的体验可以offset走错路带来的糟糕体验,换句话说,假设你有个专属司机帮你开车,你其实不太care他走的是哪条路,最后能到达就好了;
- Tesla的视觉很强,在弱车道线的场景下表现也很好。试驾员把车开进了一个废弃的农场,FSD可以根据草地上被大皮卡压过的车辙来跑,并且跑得很稳。当然,这个场景有些过于vision-specific了,我其实很想知道在黑夜、雨雪等Lidar占优的场景下,Tesla表现如何;
- Tesla FSD的舒适性有待提高。这里没有展开讲,我的理解是体验不够smooth,经常会有急加速或急刹车之类的;
- Tesla FSD或者说整个自动驾驶的一个很大的挑战在于非标的多车道复杂路口,中国公司的解决方案通常是case by case去做标注,而Tesla希望能够在底层拿出通用解决方案。这和Musk以及Tesla解决问题的风格有关;
- 结论是,试驾的同学表示,他认为尽管FSD离真正的full self-driving还很远,但辅助驾驶的战争已经结束了。目前的FSD价格是1.5万刀,如果这个产品放在中国卖3万块钱,会有很多人买。
Elon也在最新的访谈中表示,“(FSD)看起来今年就有可能发生。我们现在正处在这辆车只需要很少的人工千预就可以在高速公路上和城市里行驶。我能开好几天车在大奥斯汀地区,随机导航至一个地方,没有任何干预。在旧金山也一样,那里很难开车,所以这是一个很有挑战性的情况。讲到我更乐观的原因,这是我第一次遇到这种情况,能够连续几天,随机选择多个目的地,没有任何安全相关的干预措施。”
考虑到Elon Musk在FSD这个事情上一贯over promise的风格,我自己又去Youtube上搜了一些“FSD 11.4.1”的试驾视频。从好几个up主的视频中可以发现,在大多数正常的城市路况下,FSD的能力已经相当强劲了,如果给它足够的耐心,基本上可以放手让它去开,大约每5-10分钟接管一次,大多数接管的确也不是安全接管,而是舒适性接管。相比之前那些过于小心谨慎的“老太太”式的驾驶方式,这个版本在保证安全的情况下会有一些略激进的策略,比如会绕过前面临时停下的快递车,并且加速和刹车也要顺滑很多。但我也看到一些之前FSD版本在曼哈顿的视频(没找到FSD 11.4.1+Manhattan的视频),在纽约街头这种地域难度的复杂路况下,就能明显看出FSD的力不从心,很多时候常常会因为过份小心而举步维艰,接管次数明显高于其他“正常路况”。
前一段时间,Elon Musk发了一条twitter,说“FSD V12是为端到端的AI保留的,输入图片,输出转向、刹车和加速输出”。不知道FSD12.0是否是基于LLM的。李想在最近接受采访时也表示,要抛弃传统算法拥抱大模型,只有大模型才能实现真正的自动驾驶。目前的自动驾驶如果想做LLM,或许最大的挑战来自于数据量。目前Tesla累积的数据量大概是大几十亿张标记好的图片(大概2年前,CVPR2021 WAD的时候, Tesla 宣称自己有60亿张标注,1.5 PB的数据),而国内厂商的数据量大概会小1-2个数量级。未来,随着各家销量和每天活跃的数量不同,数据的差距或许会进一步拉开。另外,用专用场景数据训练一个端到端的模型,真的会产生类似LLM那样的通用智能或视觉常识吗?
但无论如何,自动驾驶离我们越来越近了。人们常常会高估科技2年的发展,而低估10年的发展,个人认为10年之后自动驾驶的普及将是大概率事件。届时,一些有趣的问题可能是:
1. 假如自动驾驶实现,人们还会买车吗?还是更多的会租车?RoboTaxi和Car的市场哪个会更大?这个租金的临界成本应该如何计算?
2. Elon勾勒的愿景是,自动驾驶实现之后,人们会将自己的车在闲置时间的运力贡献出来“拉活儿”,让目前车的使用率从20%提升到100%。这会成为现实吗?
3. 自动驾驶的生态会是怎样的?是类似Windows的一家独大?iOS和Android的划江而治?或者类似手机一样有5-6个品牌,各自有自己的OS?
4. 视觉能解决所有问题吗?是否需要Lidar的辅助?道路是否需要做特殊的改造?交通规则和事故认定需要做怎样的调整?
5. 自动驾驶会给社会带来怎样的变化?通勤时间能节省多少?人们省出来的时间会分配到何处?哪些行业或企业会因此受益/受损?
…
相关链接:
Vol.003 对谈 - 特斯拉股东大会重要的事
www.xiaoyuzhoufm.com特斯拉 FSD 大更新后过于激进 | V11.4.1路测
www.bilibili.com