即刻App年轻人的同好社区
下载
App内打开
17号冷锋
33关注10被关注0夸夸
游戏+电影+故事+不能停下的思考,组成了我
17号冷锋
3月前
今天看完了最近因为CES上的发布而变得热火的rabbit R1的keynote。首先必须说他们的广告拍的让人一头雾水,继而必须去看完keynote才明白到底发布了一个什么硬件。

从第一印象来说,这是一个去掉了键盘的手机(触屏上可以唤出虚拟键盘,但显然仅是紧急备用),增加了一个更像是玩具的滚轮和可旋转的相机,以及一个push to talk的对讲机按钮。从形态上让人一下子就联想到了电影SHE里面男主角每天带着的小设备。

表达一下两个主要的感受:

第一个是语音交互+滚轮的效率存疑。看得出那个滚轮主要是用来在列表里做选择的,主要的指令都是语音。但偌大的屏幕上主要就是一个兔子头和语音字幕,用户的输入也没有字幕予以辅助,我觉得交互效率是个倒退。因为从keynote上demo的日子看,它等于是把场景的视觉信息全部剥离掉了,作为用户在AI把最终结果信息呈现在这个小屏幕上之前,都是一个独自等待的瞎子。更进一步,从多模态信息渠道的角度说,这个AI对场景信息的了解几乎等于零,即便是那个相机也只有在用户主动启动且指向目标的时候才能生效,一点proactive的能力也没有。

第二个是信息流通和服务流通的局限性。我一开始看了宣传就在好奇,这个独立运行的小设备,如何访问众多的互联网服务,以及用户的数字信息?结果原来是要跑到网页浏览器上打开一个rabbit hole然后一个个的授权,内心是十分崩溃的,这不是随时被大厂屏蔽和垄断的节奏。不过这个也是现在互联网的一个问题所在,各家的服务,各家的用户登录,各家的信息都在不同的账户系统下相互封闭。但撇开这个不说,即便把各种支持的服务都绑定上了,R1似乎也没有能够自动抓取信息,理解之后并根据内容自动组合消化的能力。我记得之前有人用LLM魔改了Google home mini,升级之后的Agent会把用户的各类信息放在一起组合理解并对指令进行自主的消化,比如「帮我把昨天晚上我在电脑上读了一半的文章发给Johnny」或者「前天上午开车去上班路上经过的那家餐厅是什么来着?帮我找一下呢」这样包含有多个模糊指代的命令,我之前提过的一个例子是「帮我去FB上看一下今天的航空飞行表演还有没有,没有的话就导航回家了」,R1依旧搞不定。

所以最后扒到本质的话,R1其实是一个依赖网络端rabbit hole服务的语音终端,本地跑的是LLM和用户对话,云端跑的是LAM通过爬网页模拟用户输入和点击,这样的数据连接,我并不看好。到头来,它并不是Agent,而居然只是一个与云端Agent通话的对讲机。
00
17号冷锋
3月前
潜水太久了...大概都在炫各种live music,但还是没忘了用pixel 拍拍照感受计算摄影的能力
00
17号冷锋
3年前
有,有影响的;不同代的pixel策略不同,1代仍然享受永久无限量原图上传,234代能够享受的时间长度不一样,我这里原画质上传不限量对4代是到今年6/1号,3代是到明年2月1号;但是高画质上传都仍然无限量;其他具体看你收到的官方通知邮件

Lolicon小新: 请问pixel用户有影响吗🥲

00
17号冷锋
4年前
春晚模式开启,WWDC每年都不能缺
00
17号冷锋
4年前
好看的徽章从不错过,即使差点把自己拉断 #Apple Watch Yoga Day
00
17号冷锋
4年前
有人说「现在人的注意力不超过140字,思考能力不超过5条系统自动推荐」;所以我感受了下一个周末拿大块的时间只做一件事情,于是我写完了一份报告,做了一个网站,写了几封信(同时还“修了”一台点唱机和一只Gameboy)同时意外地几乎没看过微博,没怎么发过微信;美中不足的是 这个周末没人和我一起享受,下一次应该叫上朋友一起
00
17号冷锋
4年前
我已经笑出腹肌+腹肌抽筋

店長: _

00
17号冷锋
4年前
为了WWDC,我专门准备好了一只备用iPhone专门第一时间刷iOS14beta1!现在就缺一台备用MacBook刷macOS beta了;这么看来,我还缺备用apple watch,备用apple tv....
00