即刻App年轻人的同好社区
下载
App内打开
TomXu
7月前
主要是能有逻辑叙述内容的用户凤毛麟角。ps, 今天豆包就给我理解错了 2 处信息(我语音三分钟给豆包输入,有环境音打扰)。 //@Kenny_肯尼: 受你启发,补充一下,A用户脑子想的,B用户表达的,C模型理解到的,这三层都存在gap,我们希望尽可能A和C对齐,减少信息折损,传统的一个方式是sug词,在大模型早期的产品甚至今天依然会采用sug词的交互形式来降低用户输入门槛,但这个问题是sug词补全的不一定用户真实的想法,用户可能就是下意识点了,然后看到模型给出的结果,又觉得不符合预期。其实有办法让模型基于用户破碎凌乱的表达,反推出真实意图,然后再进行输出

Kenny_肯尼: prompt是非常高门槛的交互,比搜索框还难,这目前基本是圈内共识,那它未来会不会成为大众的主流交互呢? 这个还挺有争议 回顾历史,PC互联网的用户门槛其实非常高,核心交互是鼠标和键盘,而键盘上手很难,记得小时候练打字练了很久,尤其记住键盘字母排布,不亚于记日语五十音,而且打印店的一个重要业务是把手写稿打字为电子文档。 而早期上网一个重要消费形式是论坛,需要打字交流,所以用户知识层次较高,后面形式泛化,有淘宝、豆瓣、贴吧、知乎、门户、爱腾优,搜索依然是重要交互。新上网人群,都要学会打字,否则无法接触那么多信息、服务和娱乐。PC互联网巅峰的PC网民应该三亿左右。 移动互联网交互是触摸屏上点击滑动,门槛大大降低,微信语音消息,抖音上下滑,小孩子不用教都会用,网民数量扩张到10亿多,但是对没有经历pc互联网且数字化能力弱的中老年人,使用门槛依然高,我们很多年轻人都要教爸妈使用微信,他们基本也就微信抖音,不会装太多app,淘宝都可能不会用。 他们必须学习使用手机,尤其微信,否则他们在社会上寸步难行,14亿人口都主动被动的学会了手机上网,哪怕当中还有文盲。 现在与大模型的核心交互是对话,而大部分人都没有清楚表达需求的能力,目前的解法有: 1. 把高频常用的prompt或workflow简化为一个按钮,用户点击即可获得对应结果,比如一键翻译、一键润色、一键总结。 2. 语音模式,闲聊陪伴为主,说话比打字容易很多,当然内容也浅很多。 3. 把用户的各种中间产物作为context给模型,比如figma的草稿给模型生成网页,不需要用户用文字描述网页长什么样子。 4. 依赖对话式表达,比如各种agent、copilot、chatbot,目前还是服务Pro C端用户,没有真正进入大众,这种交互的好处是,可以发挥模型的泛化能力,并且随着模型进步,产品的效果和体验会越来越好,突破了预设workflow和一键式的限制,坏处是对用户门槛很高。 去年我对这套交互还是悲观的,觉得prompt主路径的用户规模就在一亿左右,但今年deepseek的热潮,带上家国情怀因素,让三四线用户都开始学习用大模型,甚至deepseek的书籍都成为各大书店热销榜,短短几个月人群就扩张到3亿左右。 有可能,年轻的AI native用户起来,他们成为主流,那么剩余的用户都要学会对话的交互。或者,可能最终有新的交互范式会取代对话式的中间态。 年底再看看。

00