AI学语言,和人类学语言具有本质差异:
1. Word2vec的语言学含义。虽然AI的Word2vec是计算机语言,但它来自语言学的「语义空间」概念。请注意,语义空间的思想意义,是词汇在「语义网络」相近性,而不是它的向量和数学意义。机器学习确实模拟了这点,所以,才根本解决冷战时代翻译无法想象技术的软件难题(至上而下的设计思想)。具体来说,AI模拟和计算啦语义空间内的所有词汇之间概率关系(但本质是模拟了真实世界的语义使用规律),但机器不真正掌握语言。
2. 我们人类学习语言和机器学习语言有着本质的差异。这点对于熟悉没乔姆斯基的「生成语法」会很熟悉(这是一个不亚于相对论的发现)。它改变人们的几千来的误解:儿童学习语言是后天的! 不,今天的语言学家都会告诉,儿童天生会语言和语法,有了这个根基,新词的学习在上面一层一层建构的,是依赖感觉和知觉,以及心理表征之上,一个词汇的「语义网络」。
3. 语言的最美妙的地方是,是具有羡余性和模糊性。如果总是坚持工程思维,就可能导致出现一个扎克伯格的精确性的错误:「在Facebook 一次问答会议上,扎克伯格还谈及了对未来人际沟通的一些看法,他认为:“总有一天,我相信我们能够实现使用科技将自己的全部真实想法传达给别人。当你脑海中想到某些事情的时候,如果你同意的话,可以将这些想法立即传达给你的朋友。这将是终极通信技术。」
以上基础概念有共识后,会区分一个基本事实:孩子们在3岁后进入「语言关键期」,他们天生的语言系统会解放出来:她们通常会给苹果取名叫「红红」和「脆脆」的类似表达,而不会再叫苹果「噗噗」。
语言的魅力就在于羡余和递归(才会衍生出复杂的社会性和人际博弈可能性),同时,这也是人文和哲学,在科技为王的时代依然无比重要的核心基石之一。