主要是能有逻辑叙述内容的用户凤毛麟角。ps，今天豆包就给我

即刻App年轻人的同好社区

下载

TomXu在减肥

11月前

主要是能有逻辑叙述内容的用户凤毛麟角。ps，今天豆包就给我理解错了 2 处信息（我语音三分钟给豆包输入，有环境音打扰）。 //@Kenny_肯尼: 受你启发，补充一下，A用户脑子想的，B用户表达的，C模型理解到的，这三层都存在gap，我们希望尽可能A和C对齐，减少信息折损，传统的一个方式是sug词，在大模型早期的产品甚至今天依然会采用sug词的交互形式来降低用户输入门槛，但这个问题是sug词补全的不一定用户真实的想法，用户可能就是下意识点了，然后看到模型给出的结果，又觉得不符合预期。其实有办法让模型基于用户破碎凌乱的表达，反推出真实意图，然后再进行输出

Kenny_肯尼: prompt是非常高门槛的交互，比搜索框还难，这目前基本是圈内共识，那它未来会不会成为大众的主流交互呢？这个还挺有争议回顾历史，PC互联网的用户门槛其实非常高，核心交互是鼠标和键盘，而键盘上手很难，记得小时候练打字练了很久，尤其记住键盘字母排布，不亚于记日语五十音，而且打印店的一个重要业务是把手写稿打字为电子文档。而早期上网一个重要消费形式是论坛，需要打字交流，所以用户知识层次较高，后面形式泛化，有淘宝、豆瓣、贴吧、知乎、门户、爱腾优，搜索依然是重要交互。新上网人群，都要学会打字，否则无法接触那么多信息、服务和娱乐。PC互联网巅峰的PC网民应该三亿左右。移动互联网交互是触摸屏上点击滑动，门槛大大降低，微信语音消息，抖音上下滑，小孩子不用教都会用，网民数量扩张到10亿多，但是对没有经历pc互联网且数字化能力弱的中老年人，使用门槛依然高，我们很多年轻人都要教爸妈使用微信，他们基本也就微信抖音，不会装太多app，淘宝都可能不会用。他们必须学习使用手机，尤其微信，否则他们在社会上寸步难行，14亿人口都主动被动的学会了手机上网，哪怕当中还有文盲。现在与大模型的核心交互是对话，而大部分人都没有清楚表达需求的能力，目前的解法有： 1. 把高频常用的prompt或workflow简化为一个按钮，用户点击即可获得对应结果，比如一键翻译、一键润色、一键总结。 2. 语音模式，闲聊陪伴为主，说话比打字容易很多，当然内容也浅很多。 3. 把用户的各种中间产物作为context给模型，比如figma的草稿给模型生成网页，不需要用户用文字描述网页长什么样子。 4. 依赖对话式表达，比如各种agent、copilot、chatbot，目前还是服务Pro C端用户，没有真正进入大众，这种交互的好处是，可以发挥模型的泛化能力，并且随着模型进步，产品的效果和体验会越来越好，突破了预设workflow和一键式的限制，坏处是对用户门槛很高。去年我对这套交互还是悲观的，觉得prompt主路径的用户规模就在一亿左右，但今年deepseek的热潮，带上家国情怀因素，让三四线用户都开始学习用大模型，甚至deepseek的书籍都成为各大书店热销榜，短短几个月人群就扩张到3亿左右。有可能，年轻的AI native用户起来，他们成为主流，那么剩余的用户都要学会对话的交互。或者，可能最终有新的交互范式会取代对话式的中间态。年底再看看。

5 00