老灰机的个人主页

即刻App年轻人的同好社区

下载

App内打开

老灰机

347关注103被关注0夸夸

关注AI，带娃，多喝水

老灰机

9月前

最近跟非核心大模型厂交流，大家依然不清楚大模型PM的价值。
是我的认知有问题吗？

0 00

老灰机

12月前

没有失败，只有反馈

2 00

老灰机

2年前

财富会流向不缺财富的人，爱会流向不缺爱的人

0 12

老灰机

2年前

再接上条。
因此如果想做直播，当前只能用视频驱动模式，单图驱动的效果只可以离线生成。

如果想做短视频，用单图和视频都是可以的。
单图的用户成本和推理成本明显更低，但当前效果仍不如视频驱动。

因此，当前类似产品的商业模式是，使用单图驱动版本让用户免费体验，使用效果和成本更好的视频驱动作为付费功能。

但未来随着单图驱动的效果达到视频及格线，那么以上产品设计模式可能会改变。

2 00

老灰机

2年前

接上条，再聊聊单图驱动和视频驱动这两种模式的优缺点。
————————————————————————

单图驱动优势：
明显用户成本比视频驱动低。

视频驱动优势：
1. 多视角一致性会更好，因为显式建模了人脸的3D结构。
比如单图驱动的人脸在不同的角度，可能五官和配饰，头发会发生位移。

2. 头发、胡子等高频信息的时序一致性更好。VASA-1本质是单图生成，生成的头发、胡子细节有肉眼可见的抖动。

3. 可控性强：这种视频驱动方案是和3DMM的mesh绑定的，理论上可以直接控制人头的转动、情绪变化，并有利于二次编辑；而大模型GAN方案的情绪控制、头部运动很难直接控制，或有直观的解释

4. 速度快：Synthesia这种3D方案，应该能达到100-400fps，且支持任意高清分辨率的生成；VASA-1这种大模型或GAN的方案，一般帧率不会高于40fps，而且分辨率上升后，模型推理压力会大很多，帧率下降明显。

附Synthesia效果。

1 10

老灰机

2年前

数字人作为生成式 AI 的小众方向，其实进步速度也很快。
——————————————————————————
单图驱动模式：业界也叫做 talking head 方向

当前优秀案例，如：
1.微软VASA1
2.阿里 EMO

上传单图人脸，可以生成更自然逼真的说话人脸，同时头部也会自然运动。比起大家熟知的 Heygen 效果好很多。

视频驱动模式：常见于 2D 数字人直播和短视频产品，比如剪映，硅基，Heygen 的付费版本。

当前最优秀案例，是Synthesia（Heygen 国外竞品之一）
是目前能看到的第一个有情感表现力的AI avatar，能表达情绪，并能刻画微表情。

00:14

1 00

老灰机

2年前

对数字人行业来说，好消息是数字人业务明年大概率会大爆发。

2 00

老灰机

2年前

最近极客公园邀请傅盛和方汉，关于 AI 搜索的对谈，很有一些信息量。

1.LLM 搜索的成本和盈利
①传统搜索引擎成本：
固定成本（爬虫存储集群）+ PageRank（规模服务成本）
以谷歌举例，单次搜索成本为 0.2 美分，单次搜索收入是 5 美分。
②LLM 搜索
固定成本（爬虫存储集群）+ LLM 推理成本
单次搜索成本务必要＜5 美分才可能盈利。
③端侧模型可能是变量
比如 LLM 推理在用户AI 终端上跑，可以大幅度降低搜索成本。
④秘塔搜索用的自己训的百亿模型，推理成本降低。

2.关于 LLM 效果，幻觉和最佳产品实践
①RAG 类搜索，技术上基本可以规避幻觉，忠于搜索到的结果
②使用多智能体方案，也许可以提高 LLM 搜索的效果上限（比如根据你的 query 调用不同的智能体，针对性的提供解决方案及展示效果）
③端侧模型落地后，搜索形态可能会发生变化，有可能siri变得很高频。
④LLM 搜索最大的作用是降低了用户的搜索时间，以及提高准确性。

3.对 openai 的看法
① openai 即将发布的搜索并不会对海内外所有的搜索引擎产品，形成碾压，可能会让用户有一点增长，但不会让用户翻倍增长。
②openai内部话语权，PR ＞技术＞产品

OpenAI，为什么没敢推 AI 搜索

7 71

老灰机

2年前

理想的创作产品应当是模型作为用户创意的副驾驶（copilot），通过交互设计和创意发散来降低用户创作第一个作品的门槛，并通过生成可编辑的输出辅助用户完成迭代的全过程，最终实现某种形式的自我表达。

说的真好

0 00

老灰机

2年前

北方的农村，有的盖了大房子，有的还是跟三十年前一样，灰色的砖墙，土和水坑组成的院子。
每户之间的差距很明显，有的定居到了北京，有了几千万的房产，有的留在了县城，县城的房价也到了七八千一平。
村里的房子一般是按照用途划分的，一般会有个厨房，也会有一个放粮食的地方，很小的一个屋子，就可以储备几万斤粮食。土灶大锅菜特别好吃，我每年都惦记着这一口。
一般会在北屋和厨房的中间，搭着一个梯子。我小时候经常爬梯子到屋顶。北方村落的屋顶是小孩子探险的乐园，屋顶挨着屋顶，高度又相近，胆大的孩子可以从村东头屋顶跑到村西头。不过近些年，有些人家换了瓦房，爬屋顶的难度变高了。

10 30