十年后,苹果找到了 Google Glass 的正确打开方式。
怎样做好虚拟世界和现实世界之间的连接?
苹果选择重新审题。
Vision Pro 不是大众产品,而是重新开始跨越鸿沟,面向Innovator 和Early Adopter的早期产品。
这是个只有苹果能做出来的产品。
为什么?
做产品就是一个接一个的关键决策。
苹果的价值观影响了这些决策和取舍。
换了别家公司,别说做出来,光是这套方案就不知道要层层说服多少遍,最后在体验和预算之间选择大幅妥协。
在沉浸式头显的赛道里,有几个关键战略决策,如同分岔路口,一旦决定,悔棋代价很高。
硬件产品,迭代周期相对互联网产品来说,慢而漫长。而且贵。
Vision Pro 这项目,磨了七年。
苹果最终选择了一条又贵又大胆的路径。
在这几个关键分岔路口,苹果几乎都选了追求卓越,砸钱来换取「理所当然」的体验。
---------
1、VR, AR or XR?
纯虚拟空间,增强现实空间,还是都要?
苹果不愿意牺牲掉现实世界。
苹果不相信元宇宙。
要有现实世界和虚拟空间同时出现,那意味着头戴要搭载面向外部的视野前方的摄像头。而且,内部显示外部世界时,要营造真实感,这样你才会有「你的视线穿过眼镜往外看」的感觉。 (”see through”)这个穿透,意味着眼前的显示精度得高。
再者,这带来对算力的要求立刻飙升。
同时产生一系列自然需要处理的问题:看软件还是看世界,跟虚拟空间和跟现实世界之间的过渡和切换的交互。
那就是高成本。成本翻上去了,售价也得上去。
还有,计算量上来了,随之而来又得处理散热问题。
换了别家公司,就得在「想做好点儿」和「这么好回头太贵不好卖咋办」之间纠结、辩论,最后大概率处处妥协出一个「行吧」的产品。
苹果选了:尽善尽美地做。
而且,多年积累的技术此刻都派上了用场。
自家芯片:放眼望去没有对手。
显示精度:放眼望去没啥对手。
品牌:不用说了。
面部追踪、眼动追踪等等专门技术:自家工程师还不够厉害那就买它几个公司。
制造和供应链:造不出来员工进厂诊断,改生产流程。
从高管、关键技术、供应链、后期内容,处处都砸预算,未雨绸缪。
这就给了决策很多底气和信念:
不要怕,哪怕贵,只要够好。
于是12个摄像头,5个传感器。
眼动仪盯你,正前方的摄像头替你看世界,斜侧前方的摄像头时刻侦测你手的动作——
---------
2、交互靠手势,要不要实体辅助?
对,这样又砍掉一个实体,你就不用手套指套手柄啥的了。(奥卡姆剃刀,如无必要,勿增实体)
更有甚者,盯你眼睛,听你声音,研究如何通过你的生物信号,学习预测你的意图。(如图)
---------
3、保重量,还是保续航?
其实这题之前,还有一道更根本的题,2019年就得拍板:
这个机器是单机能用,还是就是个子母机,强大主机连头显外设?
(比如坡坡空军教战斗机飞行就有个这类的:
m.okjike.com )
(反正有钱)团队两个方向的尝试都做了。
最后,当时还在的 Jonathan Ive 观点获得了高层的认可:这应该是个单机。
好,单机。
电池。一直都是老大难的问题——放头显上吧,要保续航时间,它就重,体验不好。不放头显上吧,轻是轻点儿了,那本机续航时间太短。外接电源吧,移动便携怎么办?
这题选一次就折腾一轮工业设计和内部结构设计,看着事儿小,其实牵一发动全身。
苹果这样答题:
先保基础体验:首先不能重,不能因为电池重得让人头疼。
外接电源,线和电源要有随身方案。
第一代先这样,等再过几年,等电池界再发展一下科技树。
既然如此,也先别给用户「这货用来玩游戏」预期。
没有希望就没有失望。
这样,在算力足够用来玩游戏的情况下,哪天你玩上了游戏,就是个惊喜。
去强调看电影这类偏静态体验。去强调眼前投影,3D呈现于增强现实空间中。
看上去出人意料,又理所当然。
-----------------------------------------
然而,这只是刚开始。
一位在苹果工作了三年半的项目组成员在美国蓝即上提及了已公开的相关专利。
看完他的说明,我只感到大为震惊。这些对于生物信号的捕捉和应用是如此之合情合理,可光是想到「能这么用」,就让人肃然起敬。
我把关键段落机翻放在这里:
(引用开始)
> 因此,用户处于混合现实或虚拟现实体验中,人工智能模型试图预测你,是否感到好奇、走神、害怕、注意力集中、回忆过去的经历或其他一些认知状态。 这些可以通过眼动追踪、大脑电活动、心跳和节律、肌肉活动、大脑血液密度、血压、皮肤电导率等测量来推断。
> 要使特定预测成为可能,涉及很多技巧,我提到的少数专利对此进行了详细说明。 最酷的结果之一是预测用户会在他们实际点击之前点击某些东西。 这是一项艰巨的工作,也是我引以为豪的事情。 你的瞳孔在你点击之前做出反应,部分原因是你预计在你点击之后会发生一些事情。 因此,您可以通过监视用户的眼睛行为,并实时重新设计 UI 以创建更多这种预期的瞳孔反应,从而创建用户大脑的生物反馈。 这是一个通过眼睛进行的粗糙的脑机接口,但非常酷。 而且我随时都会接受侵入性脑部手术。
> 其他推断认知状态的技巧包括以用户可能察觉不到的方式向用户快速闪烁视觉效果或声音,然后测量他们对此的反应。
> 另一项专利详细介绍了如何使用机器学习以及来自身体和大脑的信号来预测您的注意力、放松程度或学习情况。 然后更新虚拟环境以增强这些状态。 因此,想象一个自适应沉浸式环境,它可以通过改变您在背景中看到和听到的内容来帮助您学习、工作或放松。
(引用结束)
我想起当年的 Google Glass,十年时间如同白驹过隙。
#WWDC23 Vision Pro
这时你再看真人测评视频,会不会也对苹果这家公司肃然起敬?
b23.tv延伸阅读
教主遗孀整理的教主自己的书信和碎碎念集
m.okjike.com