统一回答一下我所测试的 Veo 3 抽卡率/废片率,结论在最后
首先说一下我对抽卡率的看法:
视频生成的抽卡率没法笼统来说(区别于图像),我个人认为对于一个稳定版本的模型来说:
1)取决于你的要求:
这里的要求包括了你对画面、画风、动作、语言、声音、音乐、镜头及语言、细节等的设想和预期;
以及你是否接受发散式的结果,或者你对收敛程度的接受程度:如果你需要模型所生成的结果一定要达到/完美符合你脑海中所设想的样子,那抽卡将没有上限,即使你自己手工来做,或者雇佣人类来做,也很难实现
2)取决于你的目的:
是探索、测试、整活、好玩 还是 定向出片/商用出片
不同目的决定了你对结果的接受程度,这直接决定了抽卡率
拿定向出片来说,需要人物、场景、特征、画风连贯,需要结果严格按照脚本/故事情节发展,这就需要很多定向收敛式实现,其中一项不达标就会抽卡,那抽卡率将没有上限
拿商用出片来说,需要很多严格控制的东西,那抽卡率就直接由模型指令跟随、特征保持、控制能力所决定,其中一项不达标就会抽卡,那抽卡率将没有上限
3)取决于你对模型的掌握程度:
这决定了你所写的提示能否达到你自己的要求,然后才是模型生成的结果是否能达到你的要求
模型能力越强,对人的要求越低,对指令的包容性越强,但是无法替代你自己对自己想象的表达
4)聚焦于我自己对 Veo 3 的使用:
我的目的:测试 + 探索
我的要求:我接受发散式结果,我对各项指标的设想和预期为开放式,不能接受的是质量差(比如出现明显错误,或者驴头不对马嘴)
我对模型的掌握:我可以比较准确表达我的要求,我对模型智能水品和能力边界有比较清楚的认识
由此得到我在什么情况下才选择抽卡:没生成声音、质量差(明显错误)、驴头不对马嘴
抽卡方法:我先确定提示词是否有问题,是否超过模型能理解的程度,否则直接抽卡,抽到我认为达到我自己的标准为止
5)由此得到的结论:Veo 3 在我的使用情况下
在声音正常生成的情况下,一般不需要抽卡直接一次过,需要抽也不超过 3 次
在声音无法正常生成的情况下,抽卡率没有规律,有些一直抽都没有声音,有些3-5次就有声音了
由于质量差或驴头不对马嘴(提示词没问题的情况下)导致的抽卡非常低,Veo 3 在生成质量、指令跟随、理解能力、画风画面、镜头、音乐、律动、音画同步、细节都很到位
至于定向出片和商用出片,我暂时无法判断抽卡率,因为这主要取决于人的要求、目的和掌握程度,模型占比不是太高(因为生成质量已经很好了),这可以请问各位用 Veo 3 出片的工作室/老师们