即刻App年轻人的同好社区
下载
App内打开
Ian在AR行业
106关注483被关注0夸夸
👓 6年XR产品经理,Building AR OS
👓 WX:hyr878,欢迎加我交流~
Ian在AR行业
2月前
1、最近在思考一个问题,今天的AI眼镜为什么要加上视觉信息,而不是仅考虑听觉信息。

这个问题很难,难的不是这个问题是否是伪命题,难的是为什么要在今天就要加上显示。

长期来看,信息已经以视觉的方式走进每个人的生活,我们习惯以视觉的方式获取信息,无论以直接还是抽象的方式表达现实世界和抽象世界,都能给我们带来精神价值。今天,AI眼镜大行其道,Meta Ray-ban2先行做了一个用语音就能和AI交互的榜样,看似就不需要显示了,也能体验闭环,但其实Meta Ray-ban2没有证明纯声音输入输出的AI交互是OK的,至少这个AI语音交互的功能没有成为核心卖点。

单模态声音输出的缺点就不说了,比如声音时间线性,效率低,还有OWS设计天生的信噪比不可控等,但多模态的AI输入就应该搭配多模态的信息输出,最高「到达」效率的(指的是用户接收到了信息且高保真吸收)依然是视觉,生而效率使命的智能眼镜,必然搭配能走向使命终点的硬件方案,Day1就得思考公司在显示上能做到什么程度。

其次,我们在今天就需要显示,的的确确在系统和应用的实践中和与客户的交流中感受到加上显示有多迫切。

是不是在我们需要获取信息时手机已经解决得很好了?是的,但那仅针对过去十多年移动互联网以APP的数据分发方式和拿起手机的意图交互范式,你有意图时你去拿手机找信息,而加上显示的眼镜能在部分手机生活的基础上,转移到显示眼镜上得到满足,迎合懒的本性。再有,眼镜能产生新数据,就如智能手表的健康数据和实时数据我们没必要打开手机看一样,就不展开了。

供应链也差不多了ready 了。

至于那个在眼镜上发挥显示的killer app是什么,我也在探索中,但这个killer app一定离不开提效二字。

2、最近跟朋友聊天,问到如何看待最近的AI眼镜热。我的看法是,下半年到明年,都是产品定义试错年,没有所谓的绝对正确和错误,每家都根据自己对Meta Ray-ban2成功的理解、对AI应用在眼镜上的理解、对加不加显示模块的理解、对目标客群和产品定位的理解、对眼镜和时尚的理解,其实都不太一样。

我们都知道一副眼镜从轻做就要有取舍,但取舍看似容易,其实是最难的。我之前在博客就说过,非常考验产品经理对用户需求的理解、考验定力、考验简单的取舍背后是否有复杂的系统性思考来构建独特的优势。

就拿Meta Ray-ban2的取舍举例,时间上来看,Meta Ray-ban2大概率是在22年立项的,彼时的光学显示系统如光机体积、波导一致性和良率、光学模组成本和多模态大模型都处于不够好的阶段,我是Meta Ray-ban2的产品经理我也不会上显示。

需求上来看,Meta Ray-ban2落地在发达国家,而且是全球最大的经济体,人均GDP高达七万六刀,一副299美金的Meta Ray-ban2占了人均GDP的0.00448,用福格行为模型来分析,就是虽然买这幅眼镜的动机不是很明确(拍摄+Ray-ban+AI尝鲜可能是),但行动成本低,除了299刀的财务成本和挑一款喜欢的款式,没太多的决策因素,加上Ray-ban除了Asia的2228家门店外,北美和欧洲加起来有近一万五千家门店,「触发」的点也够多。

我想说的是,Ray-ban满足的是物质需求阶段之后的精神探索阶段的精神需求,并没有在解决某个痛点问题,并没有在解决某个痛点问题,并没有在解决某个痛点问题,照搬在国内落地,且把拍摄和语音的交互能力作为卖点,会非常困难。

所以,在Meta Ray-ban2的亮眼表现的背景下,独立思考,切中某个群体的某个痛点,找到他们真正关心的事情,不管是显示、喇叭、Mic和多模态交互的哪种组合,都有机会PMF。
115
Ian在AR行业
2月前
Chatbot➕音频眼镜似乎有点意思,但不适合创业公司,在今年晚些时候的某个时间点会有某个重量级产品出现,对创业公司是不是毁灭性打击不知道。
40
Ian在AR行业
2月前
AI眼镜产品还很早期,这个行业也还很早期。

1、在技术的早期做产品,做能用技术满足的产品很重要。换句话说,智能眼镜是智能+眼镜,智能眼镜是用户需求的集合,眼镜功能是用户欲望的集合(没软件功能的眼镜买后无任何欲望)。也就是说,在技术早期,TPF和PMF很重要,熟悉技术特性、了解用户需求的产品经理很重要。
在技术成熟的时期,Idea很重要,因为互联网的网络效应能帮你构建你的护城河。

2、在技术的早期,要避免拿成熟时期的一套方法论来做或看待现在的产品。很多时候,我们经常职业惯性地拿移动互联网和智能手机在成熟时期的产品方法论来做处于早期阶段的智能眼镜产品,往往走不出已有产品的价值框架或巨头公司建立的已有范式,比如,智能显示眼镜的视觉原型为什么还是用Axure、墨刀这样的工具来设计?应用使用状况为什么还是拿访问、点击、停留来评价?硬件卖点为什么还是比拼芯片制程、性能参数?对一个能胜任某个岗位的人的要求为什么还是工作时长、学历和前司背景,有没有可能优先级更高的是岗位垂直能力、学习能力和行业热情?没有正确答案,唯有敢于突破已有范式的创新和可控的失败。

3、新技术出来时,往往是在解决老问题,比如AI出来时,解决写文章、写代码的问题;互联网渗透率到达一定程度了,比如当买家卖家都上网了,才有了淘宝;当有了4G和蓝领工人都上网了,才有了滴滴打车,这些公司都是创业公司做出来的。
先有渗透率,然后才是商业模式。
智能显示眼镜,一边解决移动互联网和传统眼镜在解决的老问题,一边让手机等智能设备变得更好,也一边让人获取信息、沟通交流和创造力变得更好。
03
Ian在AR行业
2月前
眼镜带个摄像头、阵列mic和高响度且人声清晰的喇叭,做AI的嫁衣,再合适不过了,最终卖给大模型高频使用者、科技尝鲜者和时尚前沿追求者,这也是大部分AI眼镜公司的归宿。这类眼镜出货量天花板就是踩着KK线,今天Rayban Meta 2的销量就是大部分AI眼镜品牌的天花板。(没看到在听觉的输入输出、视觉的输入这两个维度上创业公司能明显超越Rayban Meta 2和华为eyewear 2的可能)

说到喇叭,我认为眼镜再怎么追求轻薄和接近传统眼镜,喇叭作为AI处理结果和手机旧信息搬运的输出是非常必要的,毕竟当前的光学方案鲁棒性没有那么强,眼镜FOV视锥下的物体稍微亮点,眼镜虚拟元素的可读性立马下降,再有就是,现代社会眼睛真的无时无刻在被占用,读书、敲电脑、开车、看剧、社交等等,眼睛都占了我们信息输入的主要带宽。

所以Even G1眼镜追求无限接近传统眼镜而阉割了喇叭,个人不是很看好,如果加一对喇叭加5g-8g,但带来的是用户体验完整性、移动互联网内容的兼容性和开发者的可扩展性。如果在软件能力一样的情况下,且整机绝对重量没有重到五六十克,力矩平衡都做得优秀的情况下,我相信用户会选择一副有听觉反馈的眼镜。Even在软硬件整体的取舍是做得不够的,软件功能要得太多。硬件“轻”,软件“重”。

硬件设计、软件功能、产品定位、产品价格和品牌,都是相互权衡的结果,这个行业有这个全局视野的产品经理不可多得,有这个全局视野的创始人更是寥寥无几,大部分都是缺乏软件视野。
40
Ian在AR行业
2月前
Even G1硬件初印象很好,好几个朋友看第一眼都觉得喜欢,但这是意料之中。(Even G1是啥可见我知乎)

但这不能作为公司的核心竞争力,也借此给因为Rayban Meta2眼镜小火而盲目冲进场的朋友泼泼冷水。

眼镜ID设计是成熟供应链,难的是源源不断的创新;智能眼镜的五腹六脏小而精妙,难的是供应链的小型化动力,否则动则上百万的开模费用,创业公司很难出手阔绰;光机、波导、电池的成熟需要时间涓涓细流,谁也急不来;舒适、轻便、可长时间佩戴是眼镜产品自我评价的幻象,没哪个眼镜产品不追求这些;品牌、渠道、拉新留存促活非一朝一日之事,需日拱一卒。

智能眼镜这个赛道,眼镜本身一定不是创业机会,这点我非常坚定。

所谓的对智能眼镜的基本认知,比如先上眼、轻便、舒适、美观,在这两个月和将来一年会迅速拉齐,也就是进入部分共识的阶段了。

真正有机会的还是软的部分,为什么?智能显示眼镜需要新交互、新场景、新信息(AI),创造出新的范式;旧需求、旧用户(智能设备原住民)、旧用户习惯,需要新体验带来新动力。况且,还有多模态大模型不断变强这一确定性极强的事情伴随智能眼镜的发展。模型越强,用户能力越强。

这才是不满足于early adopter阶段的创业者要去思考的事情。
22
Ian在AR行业
3月前
Meta和Rayban合作的第二代眼镜这么火,其实波导眼镜品牌要去反省下为什么不是自己。
核心原因我觉得是大部分公司没找到TPMF,也就是技术匹配上产品,产品匹配上市场。
也就是说,波导和光机也刚在最近两年完成从科研到技术,而从技术到产品,其实大部分公司都没有验证清楚,也就是回答“用户为什么需要一副可显示的眼镜”。
不是因为光学技术有进步而把光学显示放在眼镜上,而是因为用户需求恰好是一副光学显示眼镜满足得最好。
所以,当前,智能显示眼镜行业其实正处于TPMF的阶段,找到答案然后才是市场化的阶段,如果两者倒过来,就容易被市场反噬。反噬的结果,就是拥有OWS和相机的智能眼镜因为多模态模型的成熟可落地、低延迟的语音交互以及未来可见的小参数量的端侧模型非常好用而最快落地。
世上本无需要显示的眼镜,需要各位创业者回答TPMF,只有认知领先了,配套的动作不变形,才能做出领先行业、领先客户需求的产品。
41
Ian在AR行业
3月前
顺着晶姐这个在出租车上跟Meta AI交互的视频(from 视频号湾区A姐),梳理下一天中不适合语音交互的场景

追求隐私或无法交互的公开场合
1、公共交通-1h
2、办公室-8h
3、中午餐厅吃饭、晚上餐厅吃饭-1-2h
(以上至少10h不适合语音交互,加上睡觉的8h和个人学习/午休等2h,共20h是不适合语音交互的)

信息类型
1、个人隐私信息
2、需精确交互、连续交互,如音量调高至51%
3、复杂需求,一句话不可描述

性格类型
1、I人

一天中20h不适合语音交互,但20h中的公共交通、办公室、餐厅我们却经常在获取信息(当前是用手机获取信息),所以需要一种核心交互来覆盖全部场景。语音交互作为手、眼不可用时的补充。

所以,当前AR眼镜,是因为有近嘴拾音的优势而有AI眼镜这一品类,还是因为有了智能眼镜而让语音交互变成好用高频的交互方式?
00:30
13
Ian在AR行业
3月前
关于智能显示眼镜要轻,我有两点不一样的观点想要分享:

1.Meta Rayban的眼镜50g,卖了几十万副,追求极致轻薄的智能显示眼镜(民间说法:必须在50g以下)各c端品牌卖了两三年预计不超过十万副,当然也有显示不够好的原因。

我一直有个反行业主流观点的看法,智能显示眼镜眼镜不是越轻越好,那么衡量一副智能显示眼镜技术含量的公式就应该是:眼镜越轻,性能、续航、对外感知、对人反馈的表现越强,眼镜技术含量越高。

行业的光波导显示方案之一——树脂光波导,不是为了让整机极致轻而存在的(至少在整机所需的器件没有定型前不是为了整机极致轻而存在),而是为了把核心器件的重量降下来后能让硬件产品经理放更大容量的电池、音域更宽的喇叭、更多样的CMF和造型,以及更合理的前后力矩位置设计而存在的。

那些在售前用户更在意的,比如ID,才是智能显示眼镜渗入广泛人群的圣杯。

2. 光波导材料,树脂不树脂不是入眼显示问题的本质,问题的本质是承载对用户来说是透明显示屏的材料是安全的。需求侧需要的是安全,其次轻不是用户需求,因轻和人因设计带来的舒适感才是用户需求。

我配了副眼镜,整个过程完全没意识屈光镜片是什么材料,但我向销售表达了一个需求:轻一点,要戴着舒服。

基于用户需求的安全和舒适,树脂能奔向这个目标,或许也有其他材料可以,在技术导入期的阶段,谁带来更好的性能,谁就能出奇制胜。(当然不能无视价格因素)

导入期之后的走向早期大众阶段,不牺牲性能的安全材料,才比性能导向的材料更重要。

所以,不管是To B还是To C,眼镜既然是戴在人的头上的,用户视角就要永远要站得比技术视角要高。
83
Ian在AR行业
4月前
智能显示眼镜这波,大部分投资人其实不知道下游有什么清晰的机会,创业者也不知道除了大模型+还有什么能做深的机会,光波导的体验有没有达到体验阈值也没被市场数据证明,但一窝蜂都来了,这就有意思了。
20
Ian在AR行业
4月前
Rayban-Meta glass2

Rayban-Meta glass2的更新频率感觉变高了,如此默默地积累能发挥眼镜优势的功能的广度,一年一两次迭代多模态大模型的深度,在没显示的时候默默打磨语音输入和听觉输出的功能和体验。

今天使用了刚更新的Calm,也是用户一句话调起SDK,如“Hey Meta,play the Daily Calm",这样我就能在工位上做十分钟的冥想,随时随地放松身心。

但OWS耳机的开放性通病让需要听觉愉悦和低环境熵的冥想类应用的体验很难有体验上的质的飞跃。

语音调起SDK的优势依然是折叠步骤带来的效率,但劣势还是人脑记忆的容量和准确性,需要人脑记忆已接入的SDK和对应唤醒指令,难免有点反人性。

能想象到的是,即使Rayban-Meta glass3加上了显示,那整机也不是Meta拉开创业公司差距的地方。在看不见的Meta生态互联(一句话就能把拍摄的视频分享出去,在Facebook instagram WhatsApp等社交平台有百万用户帮忙裂变)、视觉摄像头的防抖 畸变处理 美颜、近场拾音ANC并支持上传拾音数据来通过深度学习来改进、AI助手功能所需的听觉情感化体贴,以及藏在Reality Lab里分割(Segment Anythin)、语义理解(SceneScript)和巨无霸Llama3等等云端算法。

好在行业还早起,留给创业公司的机会依然非常多,如落到光波导视觉和空间视觉设计上就有非常多的know how。

Ian在AR行业 的想法: Rayban-Meta glass2 | Rayban-Meta glass2的更新频率感觉变高了,如此默默地积累能发挥眼镜优势的功能的广度,一年一两次迭代多模态大模型的深度,在没显示的时候默默打磨语音输入和听觉输出的功能和体验。<br>今天使用了刚更新的Calm,也是用户一句话调起SDK,如“Hey Meta,play the Daily Calm&#34;,这样我就能在工位上做十分钟的冥想,随时随地放松身心。<br>但OWS耳机的开放性通病让需要听觉愉悦和低环境熵的冥想类应用的体验很难有体验上的质的飞跃。<br>语音调起SDK的优势依然是折叠步骤带来的效率,但劣势还是人脑记忆的容量和准确性,需要人脑记忆已接入的SDK和对应唤醒指令,难免有点反人性。<br>能想象到的是,即使Rayban-Meta glass3加上了显示,那整机也不是Meta拉开创业公司差距的地方。在看不见的Meta生态互联(一句话就能把拍摄的视频分享出去,在Facebook instagram WhatsApp等社交平台有百万用户帮忙裂变)、视觉摄像头的防抖 畸变处理 美颜、近场拾音ANC并支持上传拾音数据来通过深度学习来改进、AI助手功能所需的听觉情感化体贴,以及藏在Reality Lab里分割(Segment Anythin)、语义理解(SceneScript)和巨无霸Llama3等等云端算法。<br>好在行业还早起,留给创业公司的机会依然非常多,如落到光波导视觉和空间视觉设计上就有非常多的know how。#Rayban-Meta glass - 知乎

44