即刻App年轻人的同好社区
下载
App内打开
Allen仍将梭哈XR
559关注6k被关注12夸夸
XR+AI 应用创业失败 暂时打工
前腾讯 XR、抖音商业化产品
相信 XR 与 AI 会改变世界
欢迎加微信 allenxiang888
置顶
Allen仍将梭哈XR
3年前
MR+AI 互动娱乐应用融资创业了两年,失败后一直在找更多人交流【信息与效率】,欢迎各位加我微信聊聊天 allenxiang888

也欢迎对虚拟与混合现实感兴趣的朋友,来逛逛我的博客:【Allen在XR大道上的探索-Blog】

https://ps4zaq9q3u.feishu.cn/wiki/wikcnL00yQXFhAlalTxL0NZsU1d

3439
Allen仍将梭哈XR
7天前
我发自内心的真诚的认为,我直到现在还没有找到那个我最感兴趣的,属于时代的关键问题是什么。我只知道模糊在了一个泛C应用的赛道,可能是信息流动,也可能是内容加工,可就算找到了,很有可能时代目前也缺了一些关键的低成本前置技术。

但任何事情想要做的正确,必然是一个需要长久有耐心的难题,在不知道最终题目之前,还是可以认真再多刷一些模拟题的,写写答案先练手。
82
Allen仍将梭哈XR
13天前
每个时代的驱动马达主题可能都是「连接」,上上个时代是工具与网站连接,上个时代是社交生活与内容推荐连接,这个时代的AI要为人类需求连接什么服务?连接的马达是什么?Agent不够具象化,到底如何把Context、SystemPrompt、Plugin、Action、Feedback等等转子线圈都组装起来,如何把技术与需求整合连接成“应用技术”,以及用在哪个赛道是最有效的,这是我想寻找的事情,或许也是智能最大的应用场景。

目前用户功能生态过于反API化(网页人机验证门槛高,交互APP化的问题),如何打破现状可能会是让我们的社会走向新便捷高度的方式。我有好多想研究清楚的问题,比如:

- 在解决了支付安全和信息隐私的前提下,Agent到底能不能取代我的滴滴和美团,Agent交互需要新硬件/OS吗?

- 兴趣社交信息和目的社交信息,能否被LLM高效分类管理,社交信息分发是否需要Agent作为推荐引擎?

- 人与人之间的沟通能否因为Agent的存在而更加高效,Agent能不能成为更好的小区业主群会长和行动代理人?

- 超长上下文的Context场景理解力和超长记忆RAG回溯细节大海捞针,究竟要靠技术解决还是要靠架构设计革新?

- 有没有可能存在一个AI和人类共同维护共同可见的高质量Context流动知识库,包含世界上一切有价值的信息?
00
Allen仍将梭哈XR
14天前
两年的创业真正划上了句号,账上剩下的钱也按比例退回了,发自内心的感谢所有投资人彼时和此刻信任,以及创业的兄弟们的支持。
​商业与时代的残酷狠狠鞭笞了我的各种 ego,但我还是希望未来能再次给予大家悦耳的回响。
152
Allen仍将梭哈XR
19天前
愈发的感受到了 AI 在全行业落地的局限性。
只有 LLM 的智能快合格了,相当于猿人拥有了高智商大脑,而 VLM DiT 的人类常识理解力缺失,相当于这个聪明猿人还只是个盲人,也不会写字。

​这两个技术如果有了突破,那么像之前 4o的看懂心肺器官 CT 片,并且能够画出轮廓图的 case,有逻辑的圈圈点点,那就无敌了。
21
Allen仍将梭哈XR
23天前
社交媒体为什么一直在演化?

我觉得是社交产品里还没有实现真正的实现个性化。如果有产品做到了,所有社交产品有没有可能固化成三类或三个?纯私域熟人im通讯,纯公域内容分发,半熟人排列组合人群&工具&内容。

LLM和Agent出来之后,第三类应该有产品形态最优解最优解,因为人群可以被AI理解和归类,工具可以被Agent智能调用,内容分发已经被机器学习证明过可行性了。进而未来就不会再有Bereal/Twitter/Discord等新产品形态出现了,因为人群和社交模式的颗粒度都可以被拆解排列重组后,千人千面的提供给每个人。

且这种产品容器,本身就是:1-圈层流动性的土壤,2-社交内容的最高效分发底层,3-工具与玩法的自适应分发的平台。如果有了更加自更新的能力(AI)后,理论上未来将不再会被颠覆。

微信现在就有这样的影子:1-微信群的新建与折叠,2-视频号的社交公域转发,3-微信小程序的系统权限。但现在微信光有这样的影子,还不够适应AI时代的“自由”。

社交产品目前有两个痛点没被解决好:半熟人关系链维护效率低,和社交的衍生内容信息流动效率不够高。
社交关系链在微信群和QQ群中流动性过强,发现新圈子的社交路径过长,老圈子的自然存活时间又不长,历史上加过的老圈子又会造成垃圾信息泛滥阅读管理成本高,社交注意力被频繁拉扯。

社交衍生内容过于极致的在卷内容本身,无论单双列的容器都对内容本身的质量有太高要求和模板范式,社交和内容的主次关系太固化了,内容评论区和弹幕里的个体只能通过共鸣得到很模糊的圈层认同感。

纯内容社区产品和纯im熟人通讯工具不是痛点,目前既有产品都满足的很好,但兴趣社交和需求社交不是这样,兴趣爱好群,小区公告群,行业交流群等既有明确信息目的,又有半熟人圈层认同目的,还有内容消费目的的社交产品而言,微信群和贴吧对于这些半熟人社交关系的处理却是两个极端,都没处理的很好,对纯内容性产品的兼容与社交流通性也砌高墙。

如果AI时代的产品形态来解决这个问题:LLMcontext理解➕mcp信息沟通与交易闭环➕auto Agent tool use/AI coding垂直需求功能实现➕im/feed流的个性化身份平衡社交内容与社交交流。

有可能就可以让AI来管理自己的社交关系链➕社交内容,用户留下的是自己对“眼熟人名”的信任和“tag身份”的认同,还有丰富的“挑选信息/吸收信息/收藏信息”的context知识库大脑。

那么这个形态应该可以吃点80%的微信时长(非熟人群➕朋友圈),留下泾渭分明的定位切割是,微信只用来跟熟人聊天,内容产品只用来刺激多巴胺,而社会意义的关系链和朋友圈,都用这个新形态的产品来交流。
如果非要类比的话,我觉得更像是推特➕Discord➕动态拼装无数tag/Groups➕个性化推荐feed。

对应的Agent需要新时代的OS才能真正释放权限上的潜力,手机和XR眼镜如果有更AI native OS 后,这样的社交产品形态一定会出现,但现在在手机有限的生态空间里,这个命题作文似乎也有局部解题思路。
82
Allen仍将梭哈XR
26天前
视频就是目前通用意义上最好的载体,为什么,信息维度覆盖周全且基础信息量还可以,而且好理解,离用户心智近,所以做离视频近的AI产品目前也都更赚钱,且ARR体量更大。

相对应的,AI coding和Agent才是资本组局形态的垄断工具,不是水电煤的费用在社会主义国家可以很便宜,在战乱和资本主义国家可以很贵,nocode这样的工具无论如何演进,它就像一把做事情的武器,总会被一小撮更聪明的人加速迭代的用起来,磨的比另一批的大多数人更锋利,整体是倾向于内卷和熵减的残酷。

AI内容范式的新工作流如果真拆明白了,那不仅仅是视频制作的美观和效率问题了,是真的能有“改故事”和“与故事互动”的能力了,虽然精神鸦片不好,但人类社会历史总有这种文娱精神消费产物的存在必要之处,且通常来说是对人类社会文化产生关键影响力的媒介,媒介用的好,是四书五经和辩证思想启蒙,媒介用的不好才是玩物丧志破坏社会良俗。
00
Allen仍将梭哈XR
27天前
这 4 个形态总结很精辟 hhh,除了 PICO 的形态有点大而全的重度场景,其他三个落到需求上我觉得都可以归类为「信息助理」,既然是助理,那就是不助也能自己上,不是不可或缺的东西,那销量就不会是爆炸式的增长,而是渐进式的。 //@1个鹿: 先等待一个让大家愿意佩戴的、有自己的核心场景的、厂商也不赔本赚吆喝的 XR 产品。
候选:
1. Apple 的 AR 眼镜
2. Meta 的带屏 AI 眼镜
3. PICO 的分体 MR
4. 大模型公司深度定制的多模态 AI 眼镜

Allen仍将梭哈XR: XR场景究竟有多大? 又到了周期性触发的时间点来纠结这个问题了,虽然最近几个月在搞完全跟XR无关的AI,但还是会从朋友那里听到XR的各种声音和讨论。 比如谷歌IO大会的眼镜、比如昨晚刚发布的雷鸟一系列新品,BB产品继续下探价格底线,AI眼镜产品继续出slim款细分用户,AR眼镜产品开始尝试新的技术组合方案(第一次用上自研Xcube光机配合JBD的MicroLED屏),行业有我没我都在稳步前行,现在缺的就是硬件的进步,软件产品能干的事情确实有限。 两周前Quest开放了VST视频访问权限,VisionOS 3也宣布会公开VST视频访问权限,且支持端到端视觉模型理解环境。停止XR创业状态后再看这两件事,才能旁观者清的意识到VST权限根本不是什么“重要节点”,一切体验都受制于硬件本身的形态,Twitter上那些demo也都将一直停在只是demo的状态无法规模化toC见用户,现在做游戏和体验仍然是Quest生态在这个时间点最合理的事情,not app。 刚刚听了下AK的这个采访,感慨良多:对话雷鸟创新CEO:X3 Pro才是真的遥遥领先「SIGNOW」_哔哩哔哩_bilibili。 相比于有些超前科幻但模糊不清的场景,在当下这个教育市场的阶段,体验还没发酵,售前参数更关键,有性价比就是王道。 明年可能才是真正的XR关键技术变革年,除了21年的Quest2销量暴涨以外,之前的几年都有点“纯技术突破”的意思,离用户都有挺远的距离,消息仍只在小圈子内流转。明年关键的技术点有这三个: 1.分体算力终于成为共识,AVP日活用户普遍选择开放式头戴来缓解重量和余光VST的体验,成为了最后push一把的动力,PICO和苹果的估计还得再憋一憋,而万有引力和Meta将先声夺人,看看供应链上千万的订单赌注,最后究竟是唬人还是真能解决需求,只要先有了分体,颈环成为下一步共识就不远了; 2.单色光波导有机会开始量产了,整机成本低至500元以下,且重量控制的非常不错,显示带来的这一点点交互feedback,在经过产品经理对垂直场景的打磨后,会比现在干巴巴的AI眼镜要生动很多; 3.明年AI辅助视频转3D,或者高斯3D/4D可能有些学术界的突破,让3D观看体验和渲染效率有巨大飞跃,可能可以看到XR娱乐内容的新变量与新机遇。 在这些技术成熟度和硬件工程形态的限制下,量产产品能cover多大的场景,才能摆脱地心引力一飞冲天呢?算了,不想这个了,我去看《悉达多》解脱下自己,搞XR的哪有不疯的。

00
Allen仍将梭哈XR
28天前
XR场景究竟有多大?

又到了周期性触发的时间点来纠结这个问题了,虽然最近几个月在搞完全跟XR无关的AI,但还是会从朋友那里听到XR的各种声音和讨论。

比如谷歌IO大会的眼镜、比如昨晚刚发布的雷鸟一系列新品,BB产品继续下探价格底线,AI眼镜产品继续出slim款细分用户,AR眼镜产品开始尝试新的技术组合方案(第一次用上自研Xcube光机配合JBD的MicroLED屏),行业有我没我都在稳步前行,现在缺的就是硬件的进步,软件产品能干的事情确实有限。

两周前Quest开放了VST视频访问权限,VisionOS 3也宣布会公开VST视频访问权限,且支持端到端视觉模型理解环境。停止XR创业状态后再看这两件事,才能旁观者清的意识到VST权限根本不是什么“重要节点”,一切体验都受制于硬件本身的形态,Twitter上那些demo也都将一直停在只是demo的状态无法规模化toC见用户,现在做游戏和体验仍然是Quest生态在这个时间点最合理的事情,not app。

刚刚听了下AK的这个采访,感慨良多:对话雷鸟创新CEO:X3 Pro才是真的遥遥领先「SIGNOW」_哔哩哔哩_bilibili。

相比于有些超前科幻但模糊不清的场景,在当下这个教育市场的阶段,体验还没发酵,售前参数更关键,有性价比就是王道。

明年可能才是真正的XR关键技术变革年,除了21年的Quest2销量暴涨以外,之前的几年都有点“纯技术突破”的意思,离用户都有挺远的距离,消息仍只在小圈子内流转。明年关键的技术点有这三个:

1.分体算力终于成为共识,AVP日活用户普遍选择开放式头戴来缓解重量和余光VST的体验,成为了最后push一把的动力,PICO和苹果的估计还得再憋一憋,而万有引力和Meta将先声夺人,看看供应链上千万的订单赌注,最后究竟是唬人还是真能解决需求,只要先有了分体,颈环成为下一步共识就不远了;

2.单色光波导有机会开始量产了,整机成本低至500元以下,且重量控制的非常不错,显示带来的这一点点交互feedback,在经过产品经理对垂直场景的打磨后,会比现在干巴巴的AI眼镜要生动很多;

3.明年AI辅助视频转3D,或者高斯3D/4D可能有些学术界的突破,让3D观看体验和渲染效率有巨大飞跃,可能可以看到XR娱乐内容的新变量与新机遇。

在这些技术成熟度和硬件工程形态的限制下,量产产品能cover多大的场景,才能摆脱地心引力一飞冲天呢?算了,不想这个了,我去看《悉达多》解脱下自己,搞XR的哪有不疯的。
125
Allen仍将梭哈XR
1月前
最后一句已经点名方向了,分体颈环,启动!

1个鹿: 2025 年,不温不火的 MR 领域中,轻量化高清显示器作为新的趋势正在酝酿。 将 Vision Pro 的显示效果保留,对着 Soc、传感器、电池砍几刀,直到把重量砍到 200g 以内,一个可以「长时间配置」的合理重量。 Bigscreen Beyond 2 系列采用 Pancake 光学和 2.5K 的 Micro-OLED 显示技术,视野范围增加到 116 度,重量降至 107 克,成为市场上最轻薄的 PC VR 头显。歌尔 XEO BIG 拥有单目 4K 的显示屏,机身重量控制在 189g,还支持 6DoF 追踪。小派最新发布的 DreamAir,单眼 4K+内向外 SLAM+手势和眼动追踪,重量不到 180g,参数非常漂亮。 这产品可以理解为 1. 对于 PCVR 的供应链刷新:HTC Vive、Valve Index 都垂垂老矣,随着 Pancake 和 MicroOLED 技术被一体机 VR 催熟,PCVR 也终于享受到了轻量化的体验。 2. 对于 Apple Vision Pro 佩戴舒适度问题的纠偏:精致的外观、细腻的显示、沉浸的内容都无法拯救顶着 600g 重量的 Vision Pro 用户,保留其高清显示这个最关键的特性,砍掉其他功能换取舒适的佩戴。 所以,对于还在坚持 PCVR 的硬核玩家来说,这类产品具有充足的吸引力,譬如 Bigscreen 一代兼容 Value 的基站和手柄,可以让他们无缝更新装备。 但这终究只是一个老市场,对于一体机/移动设备来说呢?轻量化高清显示器的意义可能是通往下一代设备——分体式设备。

00
Allen仍将梭哈XR
2月前
Context 真的很重要,重要到要当做油田来抢夺。我想简单粗分为三大类:
1.个性化生活信息(衣食住行事件时间戳,居住地址,车牌车型,电商记录,用户偏好历史记忆)
2.情绪化视频信息(生活中感动的记录瞬间,麦克风ASR与社交关系链,用户情绪的分析感知)
3.资产类结构信息(房产银行账单,电脑截图,工作知识库,工作日报/滴答清单/flomo数据)

其中情绪化信息的部分,如何打通context获取到落地?我觉得小米有最大优势,配合小米 AI 眼镜补全第一视角,剩下的用米家AI监控摄像头,真AI那种。

做上两个摄像头,一个常规低分辨率记录,一个 1 英寸高画质摄像头堪比手机。当家里发生一些生活中的小趣事,比如狗狗按按钮,下班后的拥抱,乃至烛光晚餐生日派对,然后借助本地的 NAS 本地 PC 显卡算力,定期跑跑视觉模型分析任务,配合Agent tool use模型,把视频自动剪辑输出,这不比iphone里的那年今日感动多了?

甚至如果高斯技术成熟,共视范围更大的多视角摄像头监控,还能还原4D高斯场景,这些都可能是下一个智能时代硬件厂商要卷的“新影像赛道”。
42