即刻App年轻人的同好社区
下载
App内打开
杨兄
804关注827被关注9夸夸
AI 教育
Attention is All I Got
置顶
杨兄
17天前
我不是有勇气
或者有可能
讲我所有想讲的话
但是我绝不讲一句我不想讲的话

——锺书河
00
杨兄
6天前
冬至
00
杨兄
8天前
It's not the life you want, but the life you need.
00
杨兄
9天前
ImageFX 创作的壁纸

当之无愧的版权之神
01
杨兄
9天前
也是人生轨迹
要努力
00
杨兄
10天前
20
杨兄
12天前
小时候学骑车,很难。

先用四轮学,后轮两侧各有一副轮,与主轮平行。

骑顺溜了,便以为两轮不在话下。遂拆轮,上车、抬脚、蹬;摔倒、惨叫、哭,一气呵成。随后是爸、妈、姐、妹,在后轮流扶车。我很小心,总慢下来,便摔得更惨。

七八次后,方能行数十米。一两月后,骑车上路,还算顺利。

学游泳更难。

我妈高薪聘请专业教练一位(500 元一年,因为很专业)。

游泳馆中,只见一通体黝黑八尺巨人立于岸边,池中瘦弱男孩着泳帽、泳镜、泳圈、泳板和泳裤,装备之齐全,水平之低下。

男孩游于巨人影子中,他往前,影子也往前。同龄人还在求阴影面积时,他已游在阴影面积里。待吃不下水,男孩就佯装抽筋(也有几次真的),逃避练习。

两年下来,游泳水平纹丝未动,演技练得炉火纯青。

于是又高薪聘请非专业教练一位(0 元一年,因为是我爸)。

一声令下,将我装备全部除去,仅留泳裤一条,丢入泳池,扑腾两下,呛得七窍贯通,险些溺水。幼小的我在水里悟到,父权不仅是压迫,还是溺爱。

游泳也好。挑食如我,总算找到爱吃的——青椒肉丝。游完回家,我妈已炒好菜:周一青椒炒肉丝,周二青椒炒肉丝,周三肉丝炒青椒,周四炒青椒肉丝,周五炒肉丝青椒。

如此半年,泳技和身体突飞猛进,多次婉拒了菲尔普斯拜师之请。

回头想,骑车和游泳,难在戒不掉拐杖,成在青椒肉丝太香。
60
杨兄
12天前
“2P已经从那个存在于观念中的从属者逐渐成长为与1P平等协作的伙伴,从单一的功能性角色转变为承担着重要叙事与机制展演的功能性主体。”

这个洞察确实精准。

我有个延伸思考:目前1P与2P所提供的叙事视角仍然趋同,反倒是单人游戏通过切换叙事主体,为同一世界提供了多重观察维度。

以《战神5》为例,大量剧情以儿子为主视角展开。尽管存在一些不够自然之处,但玩家能轻易地理解并代入角色的行为动机,这正是主体切换带来的叙事优势。

又如《漫威蜘蛛侠2》,即便不谈双主角设定,玩家通过操控MJ的片段,得以体会普通人在面对星球级灾难时的恐惧与勇气。

那么,2P是否也能提供差异化的叙事视角,从而开创新的游戏体验?

我不确定是否已经有这样的游戏,就形式而言,《Keep Talking and Nobody Explodes》是一个范例 —— 双方在游戏开始就处于信息不对称状态,唯有合作才能破解谜题,成功拆除炸弹。

耿游子民丨“你开啊,我开不了!”——双人电子游戏里的2号玩家

00
杨兄
13天前
41
杨兄
13天前
看好了,三句话让 Gemini 陪我一整局

上午,我共享屏幕,深度体验了最新的 Gemini 实时通话。你可以想象成给朋友开个腾讯会议,让她(因为我选的女声)看你操作电脑。

🟠 第一件事,让 Gemini 陪玩《英雄联盟》极地大乱斗。

“你是英雄联盟解说员,我在操作角色,解说你看到的画面”

尝试让她实时解说战局,以及教我一些元素对应的英文表达,速度超快,基本等于大司马在你耳边念咒。另外数据很新,尝试问他一些新英雄,最新可以到纳亚菲利。有一种教练督战的感觉,相当惊喜。

AI sutdio 里对于实时通话的上下文可能存在限制,每次超过一定对话轮次,就会出错,只能重开一个会话。

顺道说一下,谷歌官方宣传片里,也使用了游戏《部落冲突》来演示这方面能力,称之为“game agent”。


🟠 第二件事,让她扮演“用户”体验产品。

“你来扮演用户,参加一款产品的测试,使用大声思考的方式讲出你直觉下的操作,我来为你执行操作”

Gemini 会“思考”:“嗯这看起来是一个工具界面,我想先点这个绿色的按钮……”

“你为什么不点上面的红色按钮?”
“感觉绿的更显眼。”

这种扮演模拟了用户视角,能帮我放下“设计者 & 开发者”的成见,发现产品设计中的问题点。

🟠 几个不足

我们的老朋友“幻觉”,在多模态上感知更明显。他会一本正经说着不存在的按钮、英雄。我玩的是雪人骑士,它硬说是萨勒芬妮 —— 有一种“眼睁睁看着他指鹿为马”的感觉。其实像英雄联盟这种单屏幕中信息密度高,动态单位又多的游戏,可能更适合通过底层接入而非多模态的方式来向大模型传递信息。

这个实时对话模式更偏向于“启发式”,啥是启发式呢,就是问啥答啥,戳一下动一下,这可能是为了满足当前实时响应的效果,对输出长度做了一定限制。


多用一会儿,你就能感受到在 AI studio 里这个 gemini 被设置成一种“观察者”视角,他总是在尝试客观描述“你做了什么”,“你想做什么”,而非“对话者”视角。

触发回复的方式仅靠语音。在仅支持文字或语音交流的时候,一问一答的形式看起来没什么问题。但进入到多模态阶段,只有通过语音才能触发对话就略显奇怪了。理想中触发方式也应该是多模态的——例如我打出一个五杀,虽然一个字没说,那 AI 是不是该给点反应呢?或者我在摄像头前挥挥手,AI 是不是也该向我打招呼?

🟠 聊到饱
最后试了打开摄像头(视屏输入只能二选一)和她聊天,一不小心就聊了半小时。

怎么说呢,要不是她有点过于客观冷淡不近人(工智能)情,我能一直聊下去,不过就当练口语也是非常合适的。

从技术角度,这已经跟和人视频聊天非常接近了,可惜内置在 AI sutdio 里这个 Gemini 在感情上极为克制,且目前还没有试出有效果的提示词,可能是 tempreature 被默认设置得非常低。

这样要是开放 API 之后做成应用,有多少人会抱着手机和 AI 视频聊上一整天,不敢想。
01
杨兄
13天前
表达越多,表达欲是在增长,还是被消耗?
72