超级赞的讨论,即刻的讨论氛围真是太好了。回应这三个点:
1. 产品设计要考虑是需要信息的丰富度还是效率,比如对于协同工具以文字为主,而娱乐场景需要更丰富的信息传递所以短视频+推荐是极好的被动信息消费方式
2. 输入门槛角度,语音是最低的,所以越去到低线城市观察,越发现大家使用微信主要是语音消息或视频通话。但是对于语音助手来讲,语音输入依然要被教育,体现在教育用户像给亲朋好友发语音消息一样发消息给“机器人”,不过在这一点上儿童和老年人是两个教育成本更低的场景。
3. 语音这一输入门槛的降低意味着意图识别的难度增高:背后的原因是语音的信息密度不如文字高,带有情绪等更丰富信息的同时也意味着信息密度的降低。所以产品设计上要根据场景选择主要输入方式,是否完成一件事语音输入是一定核心必要的,因为如果需要准确完成某件事,语音输入可能不如文字输入来得准确高效 //
@HugeMandy发现满地: 语音是一个蛮不错的切入点,即友的分享超有启发的,聊几个个人的观点,期待讨论:1、信息丰富度:视频>语音>文字,信息本身也分为语言信息、非语言信息(比如情绪、场景、肢体动作等)
在语言信息获取效率上,文字的信息密度是比语音和视频高的,有一类人比如我就喜欢看语音转文字和视频转文字,需要更多文字信息之外细节的时候才会去听去看。
在设计产品的时候,信息输出方式需要考虑用户的需求与场景,是追求效率还是丰富。
2、用户输入门槛上,语音>文字>视频。一个产品如果追求用户规模,一定要考虑到非精英群体的文化水平与表达方式,所以微信语音输入是很早就上了。在观看“精神小伙跟拍”系列短视频的时候。发现很有意思的点,精神小伙和精神小妹们的沟通基本都是纯语音,遇到不明白的地方他们也会使用微信的【语音搜索】。高德导航也对无线场景、开车场景做了语音搜索地名的适配。
3、对产品和模型而言,用户输入门槛的降低对于意图识别、语音识别能力的要求越发高,毕竟随时随地都能说意味着:
信息输入非常碎片模糊/非结构化/甚至前后矛盾
有口音和歧义(汉语有多音字,英语也有读音相同的词)
暂时想到这些,解法只能从产品和模型上去迭代,毕竟用户教育(尤其结构化思维能力的提升)是更任重道远的事情,而产品的目标是活下去,活下去的前提是有用户基数