和群里朋友聊 AI 学到一个洞察。
我们都知道人类的聪明分成 book smart 和 street smart。前者是做题家的长处,而后者在很多现实问题上更有用。
这两者的区别可以理解为训练方式的差别。前者是 instruction-following based 为主,训练的是模仿和把指令内化为习惯和技能。后者则不然,训练的环境是对抗性的,没有自洽的指令,只有彼此矛盾的约束。训练的是如何在一个混乱的环境里生存、协作和发展。
AI 天生就更擅长前者,因为 AI 比人类还要做题家——今天人们对如何用奖惩机制训练 AI 服从指令已经得心应手,但对如何让 AI 在对抗性环境里自己找到策略仍然不是很熟悉。棋牌类游戏是少有的能成功训练 AI 的领域,但棋牌类游戏的环境比起真实社会毕竟抽象得多,而且这些 AI 模型都不是语言模型,使用非常受限。
这就是为什么今天 AI 写起政府公文来一套一套的,你让它在街上开个馄饨铺子它就彻底抓瞎。归根结底,AI 是东亚小孩里的东亚小孩。