针对对话式交互的反思,还是之前的观点,对话不一定是最高效的信息传达方式。比如竖起大拇指👍比用语言表达更快。
一篇文章:
julian.digital作者观点:
会话界面作为一种技术趋势不断反复出现。每隔几年,新的AI技术诞生,人们就宣称自然语言交互将成为未来的计算范式。然而,尽管有虚拟助手、智能音箱和大语言模型的推动,这种预测并未真正实现。
案例:Siri、Alexa、Google Home等会话界面频繁登场,但人们仍主要依赖传统的GUI和快捷操作。
数据传输机制
自然语言本质上是一种数据传输机制,其速度和精度往往难以兼顾。相较于书写和口语,阅读和聆听的速度更快。因此,我们在交流时更倾向于使用手势和表情作为压缩形式。
案例:点头或竖起大拇指比说“同意”更加高效。
人机交互的演变
早期人机交互通过命令行实现,图形用户界面(GUI)则解决了发现性问题,让用户更容易通过按钮和菜单执行操作。当前的生产力工具多采用GUI和快捷键结合的方式,提高效率。
案例:Raycast和Superhuman等应用,通过键盘快捷键快速执行命令,避免冗长文本输入。
会话界面的问题
尽管语音识别(如语音输入)速度较快,但并不意味着更高效。相比打开天气应用,直接说“Hey Google, 今天天气如何”反而更慢。即使大语言模型(LLM)提升了输出质量,其输入效率却是一个倒退。
案例:与其描述操作,不如直接按快捷键完成。
会话界面的增强作用
作者并不完全否定会话界面的潜力,而是指出其作为增强工具的可能性。例如,在StarCraft II的黑客松中,团队通过Alexa将语音作为辅助输入,而不是完全替代键盘和鼠标。
案例:在生产力应用中,语音可以作为辅助操作,而非核心输入。
结论
会话界面并不能替代现有的生产力软件和操作方式,但作为补充和增强手段,其潜力值得探索。我们需要在生产力工具和对话式AI之间找到平衡,而不是盲目追求全语音控制。