即刻App年轻人的同好社区
下载
App内打开
Kenny_肯尼
457关注2k被关注3夸夸
剪映&Capcut PM
内容创作者和观察者
探索AI带来的革命性创作工具
Kenny_肯尼
2天前
刚刚下班回家,第一次打车遇到了听障司机,想到 AI 的软硬件结合,可能对他们会带来很大的帮助。

我在车里一坐下,习惯性的说了手机尾号,但司机很奇怪的,把手机给我让我自己输入,我以为他没听清,于是又重复了一遍手机尾号,然后他指了自己耳朵,我才意识到他听不见。

我赶紧道歉,然后输入手机尾号,他比了 OK,就开始出发,可能这种场景他也遇到很多次,哪怕在车里其实放有提示,大晚上我也看不到。

在行驶过程中,我注意到几个细节

1. 车比较干净,没有异味,因为他是弱势群体,就在这些方面更加用心,才能跟健全司机竞争

2. 车里有 3 个屏幕,而且导航的显示屏比较大,方便他看路线,大概 5-10 秒会看一次导航,因为他听不到语音播报

3. 到了之后,我一下子不知道怎么跟他说直接大路边停就行,不用拐进小路,但他应该通过后视镜看到我的姿势和表情,就停了下来,并给我打手势
[图片]

整个过程,他的服务并没有比其他健全司机的差,但是全过程对他来说,其实要付出更多努力,他的工作体验并不好,以及可能他会遇到一些不明事理的乘客。

想到如果我们的 AI 眼镜能做成,可以实现

1. 看到我入座,多模态理解,发出声音提示我输入手机尾号,或者直接把我报的尾号输入到司机端 app,类似智谱的 auto GLM 模型能力

2. 镜片显示导航地图,就不用频繁低头看大屏幕的导航也更安全

3. 快抵达目的地,可以辅助跟乘客沟通具体下车点,乘客的声音转成字幕显示到镜片上

4. 可能还有其他的沟通场景,从当前技术发展看,是有可能实现的

查了一下,中国有 2780 万听力残疾人,这也是一个挺大的市场规模,更别提更大范围的残障人士群体,但他们都隐身了,社会基建因为成本也没做好

马斯克的 neuralink 成功让一个瘫痪病人重新可以生活,一年后,他说,他最害怕的是马斯克把这个收回,因为他已经无法接受自己瘫痪在床的日子了。

AI 对我们可能是锦上添花,但对某些人可能是完全两类人生
106
Kenny_肯尼
4天前
张小龙第一次对腾讯全员描述自己对电商未来的想象:商品信息应该成为一个原子化交易组件,能自由地在微信里游走。

其实原子化能力也是我们内部常提的概念,把各种大模型小模型固化包装为原子化能力,让创作者在编辑器内对AI与非AI原子化能力进行创意的叠加,沉淀为模板,普通用户使用后,做出有趣酷炫的视频,在内容平台成为爆款。

这是原子能力与创作者生态、大内容生态之间发生的化学反应,对应的是乘数效应,增长飞轮,而非一个简单的工具产品。

长期看,模型没有壁垒,功能没有壁垒,但生态有壁垒,因为人比工具更重要,效果比效率更重要。

腾讯重做电商,以微信的方式

06
Kenny_肯尼
8天前
在内部看到的都是问题,模型某某维度不是第一梯队,某某能力还不支持,满眼望去,一堆要优化的。

但神奇的是,二级市场竟然都开始有字节AI概念股,连朋友们都来打听,寻求投资建议。

内部看到的都是问题,外部看到的都是颠覆,可能都不客观。实际上,没那么糟,也没那么好。不过这是两套行业逻辑,一个是非常严谨的实际的考核从模型到应用到收益,另一个是看市场的信心。

想起几年前在腾讯,眼看着股价从四百涨到七百多,而公司业务根本没有什么突破性进展。也想到互联网巨头的早期员工都拿不住股票,早早卖了股票去买空调,电视机,汽车…

字节跳动,紧急声明!

23
Kenny_肯尼
9天前
弯路在大力出奇迹面前,不值得一提

字节定义AI发展新范式:全面平推

20
Kenny_肯尼
9天前
Kenny_肯尼
11天前
多刷内容case,多找用户调研,多体验产品,是又笨但又最有效的办法。

过去这两年,有大收益的项目,基本都是以这个感性认知作为起点的。当要做创新项目,如果单纯基于理性的逻辑和数据,大概率只能推导出不犯错而平庸的方案(当然我说的也不一定对)

比如你看这个即梦AI生成中文字体,可以用来做海报,好牛逼,要颠覆 canva 了。但一问商家,人家最关心的是,这个字体有没有商用版权,用了会不会被告

10秒钟用AI一键直出中文海报,我们终于等到了这一天。

35
Kenny_肯尼
11天前
Pika 2.0支持多主体一致性视频生成,导入多张图,比如衣服、模特,环境,就可以生成模特穿着衣服在特定环境里的视频。

应用在营销场景会比较明确,今年做营销项目的时候,发现中长尾商家更痛的不是剪辑,而是缺素材。

商家手头更多的是图片原始素材,可能手机拍的很粗糙的,而非多分镜的视频素材,不够生动;

目前AI的成熟解决方案,就是图生图做精致美化商品图,比如美图设计室、photoroom这些

把静态商品图转动态视频,有Vids_app等一些小产品在做,简单的动起来,还没有规模化

另一个动态化解决方案是,是通过数字人做口播讲述,边讲边插入静态商品图来解决,算是跑出来了,比如creatify.ai。但是没法解决模特和商品的互动,调研时不少商家就问能不能实现。

Pika的多ID组合,从case看,比Vidu好很多,能用了,但画质和稳定性还是不如实拍的模特和商品互动视频,所以不一定短期能在营销场景替换传统的商拍方式

但是胜在有趣味性和脑洞,所以可能营销场景要再过一段时间,等用户上手后,做出完全不一样的创意营销视频,比如「马斯克」开着「特斯拉」,在「星舰」上一起冲向太空
01:06
44
Kenny_肯尼
15天前
跟某厂商谈合作,强烈感受到爹味带来的不适感,开会静息心率飙到 95

习惯了平等和互相尊重的互联网行业年轻人,真的很难忍受某些传统硬件的中年人“我是你爹”的傲慢
121
Kenny_肯尼
17天前
这是今天 Sora发布以来,我看到最眼前一亮的视频,通过「Blend融合」功能,实现两个视频片段的无缝衔接,是更高维度的首尾帧,也是我个人认为sora最创新的能力。

看到外网有博主说,打赌2个月内中国大模型公司就会抄过去并加以改进,Sora没有护城河。让我们拭目以待,中国的可灵,海螺,即梦,vidu, pixverse,混元,阶跃,智谱等啥时候跟进上线
00:18
74
Kenny_肯尼
17天前
考虑到大家可能都没办法上手用sora,非常推荐youtube的头部博主Marques Brownlee的Sora测评,有大量的测评case,现在不少国内博主是把他的case切片后进行传播的 www.youtube.com

核心结论

1. 有些画面真假难辨

2. Sora不懂物理——目前没有一家解决这个问题

- 运动轨迹不符合逻辑
- 运动速度奇怪,可能突然加速
- 多个主体交互会混乱
- 火焰、液体可能不符合流体力学,但还挺好看的
- 物体有时候突然消失

3. 适合玩抽象——是AI的优势
- 搞迷幻风格的动态壁纸
- 做一些夸张的、艺术性的片头
- 做动画片
00:16
15