即刻App年轻人的同好社区
下载
App内打开
Vela_pika
185关注1k被关注3夸夸
🌟 AI产品极客
technical PM|上海or硅谷
喜欢语言、物理和哲学
vx:la_vela
置顶
Vela_pika
10天前
沉淀了三个月关于做语音产品的思考,回答下面五个问题:

1. 语音是一种怎样的信息模态?
2. 口语对话?人类最早的交流方式
3. 语音产品(Voice-first),有什么特点?
4. 语音产品(Voice-first),为什么是现在?
5. LUI 还是 GUI?如何做一款 Voice-first产品?

文字是线性的,思想是网状的。用线性的文字把思绪记录下来,也算是对思维的梳理。

Now is the time to reinvent the phone call,
是时候重塑传统的电话体验了。

Voice-first,闭关做一款语音产品的思考

1114
Vela_pika
6天前
back to old Palo Alto
继续每天清晨跑步去看看乔布斯老宅
吸氧 吸灵感 晒太阳
11
Vela_pika
10天前
超级赞的讨论,即刻的讨论氛围真是太好了。回应这三个点:
1. 产品设计要考虑是需要信息的丰富度还是效率,比如对于协同工具以文字为主,而娱乐场景需要更丰富的信息传递所以短视频+推荐是极好的被动信息消费方式
2. 输入门槛角度,语音是最低的,所以越去到低线城市观察,越发现大家使用微信主要是语音消息或视频通话。但是对于语音助手来讲,语音输入依然要被教育,体现在教育用户像给亲朋好友发语音消息一样发消息给“机器人”,不过在这一点上儿童和老年人是两个教育成本更低的场景。
3. 语音这一输入门槛的降低意味着意图识别的难度增高:背后的原因是语音的信息密度不如文字高,带有情绪等更丰富信息的同时也意味着信息密度的降低。所以产品设计上要根据场景选择主要输入方式,是否完成一件事语音输入是一定核心必要的,因为如果需要准确完成某件事,语音输入可能不如文字输入来得准确高效 //@HugeMandy发现满地: 语音是一个蛮不错的切入点,即友的分享超有启发的,聊几个个人的观点,期待讨论:1、信息丰富度:视频>语音>文字,信息本身也分为语言信息、非语言信息(比如情绪、场景、肢体动作等)
在语言信息获取效率上,文字的信息密度是比语音和视频高的,有一类人比如我就喜欢看语音转文字和视频转文字,需要更多文字信息之外细节的时候才会去听去看。
在设计产品的时候,信息输出方式需要考虑用户的需求与场景,是追求效率还是丰富。

2、用户输入门槛上,语音>文字>视频。一个产品如果追求用户规模,一定要考虑到非精英群体的文化水平与表达方式,所以微信语音输入是很早就上了。在观看“精神小伙跟拍”系列短视频的时候。发现很有意思的点,精神小伙和精神小妹们的沟通基本都是纯语音,遇到不明白的地方他们也会使用微信的【语音搜索】。高德导航也对无线场景、开车场景做了语音搜索地名的适配。

3、对产品和模型而言,用户输入门槛的降低对于意图识别、语音识别能力的要求越发高,毕竟随时随地都能说意味着:
信息输入非常碎片模糊/非结构化/甚至前后矛盾
有口音和歧义(汉语有多音字,英语也有读音相同的词)

暂时想到这些,解法只能从产品和模型上去迭代,毕竟用户教育(尤其结构化思维能力的提升)是更任重道远的事情,而产品的目标是活下去,活下去的前提是有用户基数

Vela_pika: 沉淀了三个月关于做语音产品的思考,回答下面五个问题: 1. 语音是一种怎样的信息模态? 2. 口语对话?人类最早的交流方式 3. 语音产品(Voice-first),有什么特点? 4. 语音产品(Voice-first),为什么是现在? 5. LUI 还是 GUI?如何做一款 Voice-first产品? 文字是线性的,思想是网状的。用线性的文字把思绪记录下来,也算是对思维的梳理。 Now is the time to reinvent the phone call, 是时候重塑传统的电话体验了。

02
Vela_pika
19天前
最近“语音”方向的几个信号:

三个月前我在硅谷沉浸式泡了两个多月把产品上的整体感受和几个趋势简短写在了这里,在不同的创业者交流研究了40多个产品后,最终回归到了“语音”这个方向,写下“Voice is a big thing”。

“语音正在成为一个较稳定的接口扩宽人们与产品交互的物理边界,可以重点关注的几个方向:语音for 搜索、情感疗愈、社交、音乐等内容创作。”

我写完这篇文章,算是给自己的汇报后就迫不及待地投入到了一款很有意思的的语音产品建设中。这三个月经历了闭关与起起落落,对现在的实时语音交互能力边界和语音更适合做什么样的事有了更深入的理解。

今天看到 Bland.ai 官宣融资再次支棱起来了,下面是最近语音方向的几个信号:

1. 做ai call centor的bland.ai今天宣布完成了2200万美金A轮融资,YC、Paypal Twillo 创始人、11labs CTO参与投资。

2. 最喜欢的Suno也成为了a16z公布的近半年增长最快的ai产品。在过去六个月中,从第 36 位增长至第 5 位。

3. Superwhisper是最近看到最喜欢的一个产品,Voice to text for any tasks,通过语音输入进行转写来嵌入到各种桌面和手机端流程。

趁回湾区前争取多输出点最近做语音产品的思考和一些有意思的产品研究。

硅谷两个月手记,AI 和其之外更重要的

1620
Vela_pika
1月前
🍃 我们是否忘记了如何遗忘?

拿起手机拍照 or 只体验当下,我们每个人一定经历过这种场景,犹豫是否拍照📷。

信息革命的本质是为了产生对抗人类遗忘的工具。从图书、相机、手机,从物理存储空间到云端服务器,人们发明一个个“存储假体”来记录、传递信息。 就连文字最早被发明其实也是为了人们去记账,所以目前发现最早的文字记载不是诗歌、悲剧而是账本。

我们渴望记录下生活中、脑子里的东西是因为害怕未来它们被遗忘、流连于过去的美好,而忘记了活在“当下”的体验里。所以有的人出门玩碰到美景喜欢用摄像头去看,打卡美食的方式是相机先吃。

然而,人们碰到美好的时刻渴望去记录,我觉得记录本身没有问题,但关键是“记录”本身和“体验”当下是矛盾的,就像一个人只能在一个时刻活在一个时空里。

现在出现的趋势是,“存储比遗忘便宜”。我们花时间去纠结要删哪些照片开始比保留所有照片要贵。到现在不仅是存储成本,推理成本也大幅降低,人们可以通过佩戴 friend 即ai 项链、戴 ai 眼睛来和软件交互。

🌟

当记录不再是一件需要做功的事情,而眼前听到看到的随时随地都可以记录时,我们应该重新找回的是遗忘的能力。
40
Vela_pika
2月前
今天咖啡时刻突然想明白了什么才是Voice first

对于一类新产品,不应当从引入新概念—>概念教育的角度想问题。新交互是要自然发生的,被教育的应当是新概念的反面。

好的Voice-first产品不需要用户教育
新概念下的好产品不需要用户教育
61
Vela_pika
2月前
以前研究产品、写文章的视角是平视。最快乐的是写的过程,当文章发布出来后很容易陷入流量陷阱。

流量意味着话语权,追逐流量则意味着偏离输出走向,甚至形成俯视视角。所以一直觉得流量危险。

现在创业后,视角从researcher到builder到creator,从旁观到参与其中,得到了更多更向内探索的快乐。

现在交流的对象聚焦到用户,每天思考的是今天给他们创造了什么价值。心向用户无限敞开,心态也随之变化。

平稳、丰盈且扎实。
21
Vela_pika
2月前
分享最近看到 aha moment的产品 Snipd

作为一个重度podcast爱好者,podcast在海外其实内容信息密度极高,一直很需要这种听播客且可记笔记、分享的产品,也鼓励身边的朋友做,现在他终于有了

Snipd: AI podcast player
AI 播客总结
一键生成可分享的播客视频

在推特landing后收到founder的推,
论什么是成功的用户landing🫡
33
Vela_pika
2月前
进YC有感

As a builder, the level of unfair advantage at YC is CRAZY. Once you are in YC, so many doors just opened for you instantly.

进YC前:时常怀疑自己(但坚定
进YC后:每天都收到yc community和potential adopter的强烈正反馈,甚至Openai都可以来帮忙调prompt了。

随着最近yc program正式开始,最近也进入了到高强度的building阶段

自我重建之路
别一番体验
11
Vela_pika
2月前
很巧合的是最近陆续交流了在伦敦和法国做AI的人

对比之下感受到美国、法国、英国的AI创业和投资生态,以及不同的人在做相似的事情的神奇之处

忍不住和大家分享!

今天最值得的一笔投资是成为了descript的付费会员,原来descript现在也是在认真打磨产品的,30美金支持🫡

🌟

‘All you need to do is try to make this world better than you came before. It’s not something trying to leave this world with my reputation, it’s trying to make anything in the world better.’
00