关于LUI的思考:
1️⃣ 交互是要有「目的」的 ,即完成用户的需求,脱离「目的」谈论交互方式(GUI或LUI)没有多大意义。(除了那些交互与目的是融合在一起的,如游戏或陪伴应用等)
2️⃣ 为了达成「目的」,需要用户与机器共同合作,并各自负责擅长的事情,同时由于机器不知道用户的「目的」是什么,因此需要用户进行「输入」。
例如,假设用户的「目的」是打车到某个地点。但操作系统并不知道,于是需要用户点击打车APP;打车APP不知道用户想去哪里,于是需要用户输入终点。当机器知道用户的「目的」后,一切交给机器就行了,用户不用关心背后是如何实现的。
最好的情况是,用户不太需要「输入」,系统通过算法等方式来预测用户的「目的」。例如,短视频产品不知道用户想看什么,但通过上滑下滑等用户行为的数据来刻画用户画像。(用户其实也不知道自己想看什么,这里的「目的」并不能具体到观看某个视频)
GUI的成功之处在于,它能让用户轻松地表达其「目的」,很多时候只需要点击和滑动就行了。但GUI的不足之处在于,它难以表达复杂和个性化的「目的」。
3️⃣ LUI 的特点在于,它能描述各种各样、大大小小、个性化、复杂的「目的」。(复杂并不总等于字数多)
不过LUI会给用户带来额外的认知负担,因此如果「目的」很简单及普遍,只需要使用GUI就够了。toC里面很多情况都是如此,例如打车用GUI就能应付大部分场景,少部分场景可能会需要用到LUI,但这仅仅只是锦上添花。(语音交互的场景是一个例外,这个以后再讲)
复杂和个性化的「目的」在工作场合最常出现,人与人之间大部分都要通过自然语言来交流协作。有复杂的「目的」,就可能有LUI的用武之地。
4️⃣ 语言可以用于描述无数的需求,意味着LUI没有多少限制。
但「能描述」不等于「能实现」,比如,你跟AI说你想长生不老,AI只能表示无能为力。
于是,LUI的重点其实不在于其交互本身,而在于AI的能力(图中蓝色部分)。AI的能力越强,能做到的事情越多,LUI也就越有意义。反正,AI能力不行,LUI则毫无意义。
当然,也可以通过Agent或其它方式扩展AI的能力,这一点也是很多创业公司的机会(图中绿色部分)。
5️⃣ 语言能描述的需求与AI/Agent能实现的需求之间是有gap的(图中黄色部分),而这个gap对用户来说是模糊的。
用户很容易知道AI不是万能的,但是用户不容易知道AI具体在哪里能,在哪里不能。这一点也会给用户带来困惑,带来更大的认知负担。
用户很容易通过对比GUI,来判断两个应用的不同和能力。但是两个采用LUI的应用,到底有什么不同就没有那么好判断了,就像你很难通过三言两语判断一个人。如何区分不同模型/Agent/GPTs的差别呢?
这会使得人们发现有用的应用难度增大,由此,开发者应当想办法让用户发现它与其它产品的差异性。