即刻App年轻人的同好社区
下载
App内打开
dexteryy
69关注930被关注1夸夸
Web平台/SDK@PICO。Web/XR/元宇宙/AI/Web3/游戏开发者。用软件技术超越生物物理的局限。游戏玩家,投资者,热爱奇幻科幻
dexteryy
7天前
夸克AI眼镜(m.okjike.com)跟 Rokid Glasses(同类AI眼镜,也是绿色衍射光。其实镜腿更小,但感觉夹头,近视镜片是附加的,重心感觉靠前)、XREAL Air(反射光,既非 AI 眼镜也非 AR 眼镜,其实就是一个外接「安卓电视机顶盒」或手机的便携屏幕)、小米拍照眼镜(Google 的偏振分光棱镜方案,也是反射光)对比
00
dexteryy
7天前
拿到阿里的夸克AI眼镜了,是我买过的第一款感觉可以全天穿戴的AI/AR眼镜

之前那些眼镜的近视镜片都是附加的,波导光机不管反射还是衍射都在镜框上,电池在整个镜腿上,除了视野里有多层边框不舒服,整个重心也是靠前的,前侧有重量感(感觉往下垮/滑)

阿里这个是双眼单色(绿)的衍射光波导,光机在 镜腿上,电池集中在腿脚,可替换,近视屈光度是一体化内置在基底镜片(树脂)上,不可替换。镜片和镜框部分没重量感,视野中也没有额外的边框和反光,跟普通眼镜一样,夹头感也不明显,整体50g的重心是靠后的(耳朵周围感觉也不明显)

缺点就是没法挂闲鱼

功能除了跟Meta AI眼镜一样的拍照摄像,跟AI耳机一样的音乐和播客,其他「AI+GUI」的功能有:千问的控制、问答和实时翻译,高德导航(还不支持公交和打车,适合步行/骑行)、录音

纯GUI功能有提词器(可以用来偷偷阅读)、备忘、日程、手机通知

AR功能目前只有支付宝二维码支付,还没有其他多模态AI功能(AR+AI)
00:08
05
dexteryy
10天前
赛博朋克和辐射的TTRPG都要出中文版了,其中Cyberpunk RED是Cyberpunk 2077原作的新版,19-20年出的,设定在前两版(88-90 年出的,当时还有一个孪生兄弟Shadowrun,都受到80年代科幻比如银翼杀手、神经漫游者、阿基拉的影响)的2020年和PC游戏的2077年之间。后4张图是今天参加的游戏展会的战锤区和兵击区
00
dexteryy
10天前
诶,Pickle眼镜里这些好像都是Web App😍

Pickle OS实现了基于本地+全网记忆(图3)的很多AI/AR功能(图2),隐私架构如下:

- 主密钥只保存在眼镜里的「浏览器扩展」中
- 隐私数据加密后传到服务器端持久化
- LLM需要使用加密数据时,会在AWS Nitro Enclaves(隔离的虚拟机)里用主密钥(需要通过验证,浏览器扩展才会用Enclave的公钥加密传输这个主密钥)临时解密,解密后的数据只会临时出现在这个云端虚拟机的内存里,用来构造prompt,发给LLM API(跟这些LLM供应商签了零数据保存协议)
- 眼镜里的Web App只接受LLM的结果渲染UI,所以不开源
- 其他实现开源接受审查:github.com

图4是架构图
Pickle眼镜官网:pickle.com
12
dexteryy
11天前
不喜欢VR但追求极致的Apple在做MR的过程中可能无意中积累了一堆关键的VR技术

比如也许有天可以干脆全部用点云而不是网格来构建游戏里的场景和人物(高斯溅射的场景+类似AVP persona的avatar),既方便AI动态按需生成游戏内容,还能在游戏过程中由AI按需做各种动态调整(比如衣服被环境中的树枝勾住),不用预先做动画和绑定

另外这个技术(图5)即使把「交互输出」部分(avatar)去掉,只留下「交互输入」部分也很有用,相当于把面向agent的多模态输入又推进了一步,通过来自传感器的视觉信息,进一步从用户所处环境中推断出更丰富信息(而不止是让用户能「透视」现实环境)

在AI快速演进的时代,Apple仍然专注在这些交互输入输出的细节上,但这其实就是Apple正经该干的事情,Apple的企业基因就是GUI和人机交互,就算做AI也应该发挥自己的优势(比如前面说的多模态交互输入)。无论XR行业还是AI行业,都需要Apple在这些方面的引领(特别是需要在GUI/交互的设计模式上形成行业共识的时候,Apple的影响力难以取代)
00
dexteryy
12天前
囧,网易云音乐说我今年听最多的歌是Sex Shooter……好像确实是我坐在电脑前进入心流觉得天下无敌时的BGM

分享歌单: dexteryy的2025年度歌单 music.163.com
00
dexteryy
13天前
a16z的消费者AI年终总结中的这张图,正好可以体现agent产品的token补贴如何持续减少、收入如何持续扩张

Agent产品跟古典互联网产品是反过来的

古典互联网产品是「Tool」,靠海量轻度用户贡献广告收入或小额付费,商业模式由这些占多数的轻度用户决定

power user之所以能从产品中获得更高的用户价值,是靠更长的工具使用时间和更高的工具掌握程度。这些都是用户自己的付出,产品没资格为此收费更多,无法从中捕获价值增加收入,因此会把更多资源投入在流量/销售和用户获取上,产品的使用效果只要good enough能维持一定的用户留存率或续订率就行

Agent产品的商业模式则可以靠这些占少数的power user来建立,这些用户的NRR(净收入留存)可以大于100% ,意味着他们给产品带来的收入不但不会随着时间逐步流失,反而越来越多

因为Agent产品不是「Tool」而是「Tool的使用者」本身,「更长的工具使用时间和更高的工具掌握程度」都是Agent产品自身的服务能力,power user从产品中多获取到的每一单位用户价值,都对应了更多的agent使用量(token消耗)或更强的agent能力(完成任务的单位token成本下降),产品可以从中持续获得收入增长

dexteryy: 自古以来,套壳者得天下 Manus都被Meta收购了,很多人还是没理解「套壳」的本质——套壳就是在模型之上增加抽象层,而模型之上的抽象层就是agent 最早期的三方AI客户端被认为是纯粹的套壳,是因为它们只做个转手,把用户输入转给LLM,再把LLM输出直接转给用户 但这种「转手」其实就是agent的基础 在得到用户主动输入、转给模型之前,可以结合来自客户端传感器的多模态数据、来自软件虚拟环境的上下文、来自记忆和其他个性化数据的上下文,补全成agent需要的、真正完整的交互输入 在输出结果给用户之前,可以在服务器端或客户端做大量主动的Tool Use(包括Tool Search、Skill/领域知识召回)、多agent协作和多次反馈-行动循环,产生side effect(对外部虚拟软件世界甚至现实物理世界产生影响) 最后在输出结果给用户的时候,可以像浏览器引擎的输出那样,提供丰富灵活多样的可交互UI,不仅限于「文字聊天」,其中既可以包含按需动态生成的第一方UI,也可以包含Tool提供的第三方UI 最早期的套壳是「纯函数式」的、无副作用的,内部业务逻辑少,只是很薄一层额外抽象,发展到现在,套壳已经变成了有副作用的、非常厚的抽象层,这个抽象层已经是新的发展前沿,比模型层的发展更快更活跃,是scaling law新增长曲线的主要来源 自古以来,得最高抽象层者得天下 就好像PC时代的最大赢家不是造PC的IBM,而是做编译器和操作系统跑原生应用、掌握PC硬件之上这个当时最高抽象层的微软 就好像桌面互联网时代的最大赢家不是做桌面系统的微软和苹果,而是引领浏览器技术标准、做Web分发入口(搜索引擎)和大量Web App/SaaS、掌握操作系统之上这个当时最高抽象层的Google 就好像移动互联网时代的最大赢家,最初是掌握移动OS和应用商店这个最高抽象层的Apple,但很快就变成了做超级应用、提供内容/功能分发入口(微信、抖音、Instagram)、掌握这个新的最高抽象层的Meta们 Meta收购Manus,就好像互联网早期,随着Netscape(相当于ChatGPT)如日中天、Windows捆绑IE(相当于Gemini),不想受制于人的Apple基于已有的KHTML项目(Manus?)发展出了Safari(Meta的AR眼镜和MR目镜都需要基于通用agent的交互中心和分发中心) 附带说下,像Manus、ChatGPT这样的agent平台,并不是SaaS,跟SaaS的本质和商业模式都完全不同: SaaS是Tool,商业模式是卖软件授权,按软件工具操作者的席位付费 Agent平台提供的是「Tool的使用者」,商业模式是卖「人力资源」,按劳动量和劳动产出(类似研发团队的绩效评估标准)或解决问题的量(类似产品/业务团队的绩效评估标准)来付费 SaaS补贴用户是不可持续的,如果自身作为Tool的使用价值和更新维护需求无法支撑起定价,用户就不会再续订 而像Manus这样的agent平台中,补贴来自用户付费和整体token成本的差额,token成本持续下降,面向付费用户的定价却不变甚至随着能力增强而增加(比如ChatGPT Pro和Claude Max的档位),而补贴的真正来源——免费额度/免费用户——相当于拉新和用户习惯培养,需求会逐步减少。整体的差额很快会转正 图3里让AI计算了Manus的补贴成本,以及token成本降到什么程度不用补贴

00
dexteryy
13天前
关于「agent不像SaaS那样卖席位而是卖人力资源」,补充解释下:

AI agent跟原始模型的输入输出相比,多出来两个能力,一个是「副作用」(对外界施加影响的能力,因此必须使用工具),另一个是「主动」,这个主动不是传统的「自动化」,「自动化」只是用预制好的程序或流程把任务自动执行,agent 的主动能力是主动规划、主动采取行动、主动根据反馈做改进调整、主动使用工具、主动跟其他agent协作

虽然由于agent没有自我意识、没有「需求」,需要真人来发起最初的任务,但后续解决问题的整个过程趋向由agent自主完成,并在这个过程中使用多种第一方/第三方的软件工具

「工具」是需要操作的,所以SaaS是对操作权限(席位)收费,而真人对agent的「使用」趋向没有操作过程,目前表面上跟SaaS一样收取固定的订阅费,这只是一种简化和平摊,背后由于单位token的成本下降和能力增强,其实商业模式还是被用的越多就赚的越多,本质上都是基于单位token代表的「人力资源」收取费用

dexteryy: 自古以来,套壳者得天下 Manus都被Meta收购了,很多人还是没理解「套壳」的本质——套壳就是在模型之上增加抽象层,而模型之上的抽象层就是agent 最早期的三方AI客户端被认为是纯粹的套壳,是因为它们只做个转手,把用户输入转给LLM,再把LLM输出直接转给用户 但这种「转手」其实就是agent的基础 在得到用户主动输入、转给模型之前,可以结合来自客户端传感器的多模态数据、来自软件虚拟环境的上下文、来自记忆和其他个性化数据的上下文,补全成agent需要的、真正完整的交互输入 在输出结果给用户之前,可以在服务器端或客户端做大量主动的Tool Use(包括Tool Search、Skill/领域知识召回)、多agent协作和多次反馈-行动循环,产生side effect(对外部虚拟软件世界甚至现实物理世界产生影响) 最后在输出结果给用户的时候,可以像浏览器引擎的输出那样,提供丰富灵活多样的可交互UI,不仅限于「文字聊天」,其中既可以包含按需动态生成的第一方UI,也可以包含Tool提供的第三方UI 最早期的套壳是「纯函数式」的、无副作用的,内部业务逻辑少,只是很薄一层额外抽象,发展到现在,套壳已经变成了有副作用的、非常厚的抽象层,这个抽象层已经是新的发展前沿,比模型层的发展更快更活跃,是scaling law新增长曲线的主要来源 自古以来,得最高抽象层者得天下 就好像PC时代的最大赢家不是造PC的IBM,而是做编译器和操作系统跑原生应用、掌握PC硬件之上这个当时最高抽象层的微软 就好像桌面互联网时代的最大赢家不是做桌面系统的微软和苹果,而是引领浏览器技术标准、做Web分发入口(搜索引擎)和大量Web App/SaaS、掌握操作系统之上这个当时最高抽象层的Google 就好像移动互联网时代的最大赢家,最初是掌握移动OS和应用商店这个最高抽象层的Apple,但很快就变成了做超级应用、提供内容/功能分发入口(微信、抖音、Instagram)、掌握这个新的最高抽象层的Meta们 Meta收购Manus,就好像互联网早期,随着Netscape(相当于ChatGPT)如日中天、Windows捆绑IE(相当于Gemini),不想受制于人的Apple基于已有的KHTML项目(Manus?)发展出了Safari(Meta的AR眼镜和MR目镜都需要基于通用agent的交互中心和分发中心) 附带说下,像Manus、ChatGPT这样的agent平台,并不是SaaS,跟SaaS的本质和商业模式都完全不同: SaaS是Tool,商业模式是卖软件授权,按软件工具操作者的席位付费 Agent平台提供的是「Tool的使用者」,商业模式是卖「人力资源」,按劳动量和劳动产出(类似研发团队的绩效评估标准)或解决问题的量(类似产品/业务团队的绩效评估标准)来付费 SaaS补贴用户是不可持续的,如果自身作为Tool的使用价值和更新维护需求无法支撑起定价,用户就不会再续订 而像Manus这样的agent平台中,补贴来自用户付费和整体token成本的差额,token成本持续下降,面向付费用户的定价却不变甚至随着能力增强而增加(比如ChatGPT Pro和Claude Max的档位),而补贴的真正来源——免费额度/免费用户——相当于拉新和用户习惯培养,需求会逐步减少。整体的差额很快会转正 图3里让AI计算了Manus的补贴成本,以及token成本降到什么程度不用补贴

00
dexteryy
13天前
自古以来,套壳者得天下

Manus都被Meta收购了,很多人还是没理解「套壳」的本质——套壳就是在模型之上增加抽象层,而模型之上的抽象层就是agent

最早期的三方AI客户端被认为是纯粹的套壳,是因为它们只做个转手,把用户输入转给LLM,再把LLM输出直接转给用户

但这种「转手」其实就是agent的基础

在得到用户主动输入、转给模型之前,可以结合来自客户端传感器的多模态数据、来自软件虚拟环境的上下文、来自记忆和其他个性化数据的上下文,补全成agent需要的、真正完整的交互输入

在输出结果给用户之前,可以在服务器端或客户端做大量主动的Tool Use(包括Tool Search、Skill/领域知识召回)、多agent协作和多次反馈-行动循环,产生side effect(对外部虚拟软件世界甚至现实物理世界产生影响)

最后在输出结果给用户的时候,可以像浏览器引擎的输出那样,提供丰富灵活多样的可交互UI,不仅限于「文字聊天」,其中既可以包含按需动态生成的第一方UI,也可以包含Tool提供的第三方UI

最早期的套壳是「纯函数式」的、无副作用的,内部业务逻辑少,只是很薄一层额外抽象,发展到现在,套壳已经变成了有副作用的、非常厚的抽象层,这个抽象层已经是新的发展前沿,比模型层的发展更快更活跃,是scaling law新增长曲线的主要来源

自古以来,得最高抽象层者得天下

就好像PC时代的最大赢家不是造PC的IBM,而是做编译器和操作系统跑原生应用、掌握PC硬件之上这个当时最高抽象层的微软

就好像桌面互联网时代的最大赢家不是做桌面系统的微软和苹果,而是引领浏览器技术标准、做Web分发入口(搜索引擎)和大量Web App/SaaS、掌握操作系统之上这个当时最高抽象层的Google

就好像移动互联网时代的最大赢家,最初是掌握移动OS和应用商店这个最高抽象层的Apple,但很快就变成了做超级应用、提供内容/功能分发入口(微信、抖音、Instagram)、掌握这个新的最高抽象层的Meta们

Meta收购Manus,就好像互联网早期,随着Netscape(相当于ChatGPT)如日中天、Windows捆绑IE(相当于Gemini),不想受制于人的Apple基于已有的KHTML项目(Manus?)发展出了Safari(Meta的AR眼镜和MR目镜都需要基于通用agent的交互中心和分发中心)

附带说下,像Manus、ChatGPT这样的agent平台,并不是SaaS,跟SaaS的本质和商业模式都完全不同:

SaaS是Tool,商业模式是卖软件授权,按软件工具操作者的席位付费

Agent平台提供的是「Tool的使用者」,商业模式是卖「人力资源」,按劳动量和劳动产出(类似研发团队的绩效评估标准)或解决问题的量(类似产品/业务团队的绩效评估标准)来付费

SaaS补贴用户是不可持续的,如果自身作为Tool的使用价值和更新维护需求无法支撑起定价,用户就不会再续订

而像Manus这样的agent平台中,补贴来自用户付费和整体token成本的差额,token成本持续下降,面向付费用户的定价却不变甚至随着能力增强而增加(比如ChatGPT Pro和Claude Max的档位),而补贴的真正来源——免费额度/免费用户——相当于拉新和用户习惯培养,需求会逐步减少。整体的差额很快会转正

图3里让AI计算了Manus的补贴成本,以及token成本降到什么程度不用补贴
33
dexteryy
15天前
ChatGPT里有了Replit的MCP App(m.okjike.com)之后,在手机上随手创建小应用(m.okjike.com)更方便了,身兼PM和Tech Leader的ChatGPT会结合前面上下文里的专业分析把你的一句话要求变成完善的产品需求发给Replit里的Claude去做执行,结合Replit的Serverless/PaaS基础设施直接得到正式部署好可分享的web app

示例1(图1-3):扣除本金中来自贷款的利息成本,得到实际年化收益
real-profit-calculator.replit.app

示例2(图4-7):汇丰中国app的财富管理界面只能查到每个基金的总收益和当年(YTD)的收益率,需要快速计算出当年到底赚了多少
profit-share-calc.replit.app
01