即刻App年轻人的同好社区
下载
App内打开
AI产品黄叔
2月前
“别再被Demo骗了!”:Karpathy揭秘AI Agent从90%到99.999%的残酷真相

当整个科技圈都在为AI Agent(人工智能体)的酷炫Demo欢呼时,有一个人却泼来一盆冷水。

他就是Andrej Karpathy——一个履历堪称“AI界天花板”的人物。作为OpenAI的创始成员,他帮助构建了驱动ChatGPT的早期模型;作为前特斯拉AI总监,他领导团队埋头五年,只为攻克自动驾驶这个难题。

正是这段横跨“数字智能”与“物理智能”的独特经历,让他对当前AI Agent的狂热,有了一份极其冷静甚至悲观的判断:

“这不是智能体元年(the year of agents),而是智能体十年(the decade of agents)。”

为什么?因为他用在特斯拉5年、每天都在追求99.999…%可靠性的亲身经历,看到了所有AI产品从惊艳Demo到可靠Product之间,那条由无数个“9”铺成的、漫长而艰难的行军路。

一、2014年的“完美”幻觉:一个关于自动驾驶的故事

故事要从十年前说起。

2014年,Karpathy还在斯坦福读博,通过朋友关系,他体验了一次Waymo的自动驾驶汽车。那是一次“完美”的旅程,车辆在帕洛阿尔托的街道上平稳行驶,毫无差错。

“我当时觉得,这东西(自动驾驶)已经非常接近成功了。”

然而,十年过去了。自动驾驶依然没有大规模普及,甚至连Waymo自己,也只在少数几个城市的限定区域内运营。

问题出在哪?

Karpathy在特斯拉的五年找到了答案。他将其总结为一个概念:“九个九的行军”(The march of nines)。

一个产品在Demo阶段达到90%的成功率可能很容易,但从90%到99%,再到99.9%,每增加一个“9”的可靠性,所需要付出的努力和资源,都是指数级增长的。

“在特斯拉,我们每天都在为小数点后新增的那个‘9’而战。” Karpathy说,“而今天的AI Agent,就像2014年的那辆Waymo,它给了我们一个完美的幻觉,但实际上,它的‘九个九行军’才刚刚开始。”

二、AI Agent如何重走自动驾驶之路?四大挑战

Karpathy认为,今天的AI Agent,正面临着与自动驾驶当年一模一样的四大挑战。这四大挑战,构成了从Demo到产品之间的巨大鸿沟。

挑战一:高昂的失败成本

自动驾驶的失败成本是物理世界的人身安全,一次失误就可能导致严重事故。

AI Agent的失败成本是什么?是数字世界的业务安全。一个企业级的Agent如果出错,可能会错误地修改数据库、泄露客户隐私、或者给出一个灾难性的商业决策。

“在软件工程中,一个微小的错误就可能导致数百万用户的安全漏洞。这种成本,一点也不比自动驾驶低。” Karpathy强调。

当失败的代价极其高昂时,99%的可靠性是完全不够的。你需要的,是99.999%甚至更高。

挑战二:从90%到99.999%的艰难爬坡

为什么提升一个“9”如此困难?

因为现实世界充满了“长尾问题”(long tail problems)——那些极其罕见但又确实会发生的极端情况。

对自动驾驶来说,可能是突然冲上马路的行人,或是从未见过的交通标识。对于AI Agent,则可能是用户一句带有歧义的指令,或是一个系统从未处理过的异常API返回。

解决前90%的问题,靠的是模型的核心能力。而解决后面9.999%的长尾问题,则需要海量的数据、持续的迭代和近乎偏执的细节打磨。

“每当你觉得解决了一个问题,就会有一千个新的、更奇怪的问题冒出来。”这正是Karpathy在特斯拉的日常。

挑战三:看不见的“人”

很多人以为,Waymo的无人车里真的“无人”。但Karpathy指出,这是一种误解。

在你看不到的地方,有一个庞大的远程操作中心(tele-operation center),随时准备在车辆遇到困难时接管。

“我们并没有完全移除人类,只是把驾驶员从车里,移到了你看不到的办公室里。”

AI Agent同样如此。当一个Agent宣称能“全自动”完成任务时,其背后很可能有一个人类团队在进行监督、审核和处理异常。这种“人机协作”的模式,在未来很长一段时间内都将是常态。

挑战四:经济可行性

最后,也是最现实的问题:成本。

自动驾驶的研发成本是天文数字。Waymo烧掉了数百亿美元,至今未能盈利。AI Agent同样面临高昂的训练和推理成本。

一个AI产品最终能否成功,不仅仅取决于技术,更取决于它的经济模型。它能否在覆盖高昂成本的同时,创造出足够大的、让客户愿意付费的价值?

“你必须让产品在经济上是可行的,否则它就只是一个昂贵的科学实验。”

三、结论:乐观的技术,悲观的时间线

正是基于这四大挑战的深刻洞见,Karpathy才做出了“智能体十年”的判断。

他预测,未来十年,AI Agent不会像很多人想象的那样,以一种颠覆性的姿态瞬间取代人类工作。它会以一种更渐进、更务实的方式渗透到我们的工作流中。

他提出了一个“自主性滑块”(autonomy slider)的概念:AI会先从处理80%的常规任务开始,将剩下20%最棘手的任务交给人类。随着技术的成熟,这个“滑块”会慢慢地、一点一点地向100%自主移动。

“我对技术本身是乐观的,我相信这些问题终将被解决。” Karpathy在访谈的最后说。

“但我对时间线是现实的,甚至有点悲观。我之所以听起来悲观,只是因为当我打开Twitter时,看到太多毫无意义的、为了融资而存在的炒作。”

这或许就是Andrej Karpathy带给我们最重要的启发:在一个被AI浪潮席卷的时代,保持兴奋很容易,但保持清醒和耐心,才是一种更稀缺、也更可贵的能力。
58

来自圈子

圈子图片

AI探索站

100783人已经加入