三万字长文,来自 2 年前怼「智能助理」的作者,这次怼的目标升级到了「对话 AI 」。干货很多,尝试总结一下。主要分了 6 个 part -
1)目前对话领域的 AI 依旧不具备智能
2)现阶段对话系统的本质是槽位提取 + 填充
3)人类对话是思维从高维向低维的投射
4)AI 产品的潜力在于通过设计弥补技术缺陷
5)对话领域的 AIPM 需要懂商业、懂技术、懂人
6)现有对话技术只是过渡方案,期待真正智能
前 2 part 不多说了。现有「人工智能」还停留在「人工·智能」。除了文中提到的填槽式的对话系统,我们还看到:去年星际 AI 大赛的冠军是来自韩国的三星 SAIDA (一个纯规则、无学习能力的 bot);现有虚拟偶像/主播都是基于幕后真人动捕/变声来实现表情/声音的;能登台的 AI 同声传译不是拿稿子预训练过就是偷偷用活人翻译。可见这些年来 AI 在需要「理解」的工作上,还一如200多年那个箱里藏人的伪·下棋机器人。
第 3 part 很有意思。提到人类对话的有效进行是依赖「共识」信息的。普适的「共识」就是「常识」,小范围的「共识」可以理解为「梗」。有了这俩之后,对话过程中就可以省略很多信息不用逐一交代。在此之上,每次对话还包含短期的「场景模型」和长期的「世界模型」。前者基于对话本身、后者基于人。上述信息和模型,现阶段 AI 都无法具备/学习,也是导致智障的原因。
后 3 part 算是对从业者的一些建议,也非常在理。希望可以认清技术局限,明确我们的目标是做出可以用的 AI 产品,而非实现通用人工智能。
总体是篇非常系统且相对通俗的智能对话领域科普文,有时间的话值得一读:)