即刻App年轻人的同好社区
下载
App内打开
zhijie
361关注2k被关注3夸夸
Less sure about everything
zhijie
1月前
当搜索轮子的效率低于生成轮子的效率,人们就会不断地重复造轮子
01
zhijie
2月前
交互会限制或释放计算能力。

电脑在有图形界面之前,有很多任务原本是可以通过计算解决的,却因为交互不便,被限制和封印了。

而图形界面的出现,释放了计算能力,电脑可以完成的任务急剧增多。

在多点触控之前,手机的计算能力也是被限制了的。计算能力被释放后的手机,解锁了无数新的场景。

今天的apple watch ,计算能力也被交互限制了,发条消息都很费劲。

---

新技术除了带来新的计算能力,也可能会带来新的交互,而新的交互会释放更多的计算能力。

图形界面是一个非常有用交互方式,但是它并没有完全释放出计算能力。换言之,有些任务原本可以用计算解决,却因为只有图形界面,而被限制了。

AI让语言交互成为可能,而语言交互可以用来表达图形界面无法或不便表达的需求。

这些原本不便表达的需求,现在可以表达了。不过,能表达,不意味着能被满足。

事实上,大部分需求,在今天都还不能被计算解决,只有一小部份是可以被计算解决的。

当然,这些可以被计算解决的需求,也会解锁更多的计算场景。而有一部分今天不能被计算解决的需求,也会因为技术的进步变得可以被解决。

---

用语音在小屏幕(apple watch)上发消息,就属于 图形界面不便表达,计算能力被限制 的需求。

甚至那些没有屏幕的设备,或许也可以借助语言交互而释放新的计算能力,比如,当你可以和你的apple pencil 说话时会怎么样?

即便是可以充分利用图形界面的大屏幕,也有一些无法用图形界面表达的需求。当然,解决方案不太会是老罗的TNT。

从交互的角度看,TNT的失败在于它没有合理的利用图形界面和语言交互,它把图形界面可以很轻松解决的事情,转给了语言交互。而不是用语言交互来释放原本被限制的计算能力。

---

人类的需求的无尽的。随着技术的发展,我们可以表达更多的需求,而计算机也将可以解决更多的需求。

未来的一天,当我们乘坐自动驾驶的车辆时,不会仅仅让它从A点自动行驶到B点。我们可能会跟它说:带我回家吧,不过我不想走昨天的路线,带我走一条能看枫叶的路线吧。
33
zhijie
3月前
刷到一个盲人点外卖的视频,他借助iOS上辅助功能当中的旁白,来理解屏幕上的信息和操作。

他的手指从上到下触摸潜在的信息,听着语速极快的旁白,通过这种方式一步步操作直到下单。

整个过程看起来还是挺流畅的,大概也是经过了许多次的训练。但还是比普通人繁琐太多了。

这个时候突然想到computer use的一个用例,就可以帮助盲人群体更方便的获取信息操作电子设备,大概会比旁白的体验好很多。

computer use可以成为盲人眼睛和手指的延伸。
22
zhijie
3月前
computer use的上限不在于AI对界面的理解,而在于AI对用户意图的理解。

即便AI能理解界面上所有的信息,可以准确做出操作,但只要它不知道当前用户想吃什么,它就无法帮你点外卖,除非用户不在乎吃什么。
00
zhijie
3月前
「夜晚只是地球的影子落在你身上」
41
zhijie
3月前
优秀的交互设计在于准确预测用户的意图。

1. 在Figma中,如果想要修改的文字是在图层的底部,用户就要点击多次鼠标,才能选中文字。

但是当你改了一个地方的文字后,再把鼠标移动到其它地方的文字时,就无需点击多次鼠标了,可以一次选中文字,这是因为Figma预测了用户当前想要编辑文字,因此可以快速选中。

2. 手机上的虚拟键盘,按键的热区很小,用户很容易误触,如果完全根据用户实际点击的热区来确定按键,会导致很难打出想要的字词。

用户想要敲击的按键,可能在实际点击的按键周围,为了准确预测用户的意图,输入法会对周围几个按键赋予一定的权重,然后再去预测用户想要输入的词。

3. 当用户在一个文本框打了一大段话后,接着长按删除键,系统一开始会慢慢删除字符,然后加快删除句子,再加快删除段落。

这是因为当用户长按时,系统预测用户想要删除很多文字,而不是一两个字符。

---

以上这些例子都是一些人为设定的规则,那么AI是否可以预测用户的意图,来提升一个产品的交互体验呢?

毕竟 语言模型是在预测词语,就像交互设计在预测意图。而意图可以通过词语表示。

Cursor给了一个很好的例子。在写代码的时候,Cursor会时不时地预测用户想要的代码,然后出现一个“Tab”按键提示,用户点击“Tab”按键后,就能让AI快速完成代码补全或修改。

以后应该可以看到越来越多类似的交互。
05
zhijie
4月前
如果有一项技术可以让人类以光速传送到指定地点,互联网还会有多少价值?
92
zhijie
4月前
生成式AI是比特世界的3D 打印机
00
zhijie
4月前
把你的个人主页丢给 NotebookLM,你就可以收获一段奇特的体验。

听两个AI主播饶有兴致地谈论着你,听他们解释你写下的文字。

感受自己被理解,同时也在被误解。
32
zhijie
5月前
精确的计划通常是一种安慰剂
10