提前试了一下可灵刚发布的 2.5 Turbo 视频模型,太顶了!
刚好前几天看到刚结束的世界渲染大赛
于是就测试了一下现在的 AI 视频模型距离顶级 CG 还有多远,没想到给了我很多惊喜
感兴趣可以看看,长文里面有具体的提示词,这里只说每个的评价:
mp.weixin.qq.com先总结一下可灵 2.5 Turbo 有哪些提升
提示词理解强了非常多,尤其是涉及到开始之后包含复杂因果和时间关系的提示词。
另一个高速动态视频的表现,涉及到超高速战斗和复杂运镜的时候更加稳定。
同时生成视频的风格稳定性更强,图生视频的时候风格保持相当稳定。
最重要的是这次可灵 2.5 Turbo 的价格非常划算,高品质模式下5 秒视频从 2.1 模型的 35 积分降到了 25 积分。
我们先看几个基础的测试
基础案例 1:我这个提示词相当复杂,先是规定了运镜方式,之后是一连串的动作。在这期间,人物执行转身和复杂动作的时候完全没有变形溶解等问题。
另外图生视频的时候首帧图片里面的怪物其实是相当不清晰的,但是可灵可以根据左侧稍微有点清晰的怪物脑补出其他怪物的样子,直到最后被怪物包围的时候每个怪物的形象都非常清晰完整。
基础案例 2:然后是为了测试不同风格的一致性保持,就将一张图片改为了三种风格,同时用上了不同的视频生成提示词。
第一张是CG 风格的巨龙站起来咆哮,然后是日式赛璐璐风格在天空中飞翔,最后是星月夜风格的巨龙飞翔。
可以看到三张的风格保持都非常好,而且在第二张第三张视频模型都需要补全原有图片没有的信息,周围环境和剩下的巨龙身体,都非常稳定,尤其是梵高画风的第三张近距离视角相当震撼。
基础案例 3:这个也是考虑复杂的时序提示词和变化的测试,图片本身只有一个穿着便服的女孩,她的服装需要顺畅的在后面几秒不断变换。
可以看到处理非常顺滑,公主长裙和披风出现的时候是用一种生长动画的方式,然后宇航服出来的时候又是类似蒙版的方式,整个过程跟原来的人像一致性非常高,跟周围环境的交互也很自然。
顶尖AI视频模型可以战胜CG吗
前几天刚好第十一届世界渲染大赛刚刚结束,能在这里获奖的人尤其排名靠前的已经是 CG 制作里面的中上层了。
于是我就在想,可灵 2.5 Turbo可以跟这些作品掰掰手腕吗。
说干就干,我找到了前几届世界渲染大赛 Top 100 的视频,然后找到几个我喜欢的作品,截图拿到首帧,然后让 Gemini 2.5 Pro 根据原始 CG 拿到提示词,可灵 2.5 Turbo生成视频跟原始 CG 进行对比。
CG 对比案例 1:这个作品好像还是那一届 Top5 的作品,主要的亮点就是照明弹扔下去以后场景的水晶全部变亮的效果非常震撼。
可灵生成的时候很好的把握到了这个特点,同时提示词加上水晶生长之后整个场景的张力变得更丰富,而且镜头确实被拉远了,如果精细度再强点,角色不要跳崖的话可能真能跟原作掰手腕了。
CG 对比案例 2:如果说刚才那个稍逊一筹的话,这个真不相上下了。
这个画面其实非常复杂,有视频多个飞机,还有岩浆环境,基本上可灵对于画面视觉的分析相当到位,所有应该运动的都在运动,同时运镜也模仿了原来 CG 的运镜。
CG 对比案例 3:这里人物奔跑的动作相当自然和流畅,在躲避石头人的大手摔倒的时候也没问题。
后面还加上了一点踉跄的步伐已经相当超出预期了,石头人的动作受限于提示词和首帧图片过于糊,没有表现出来,不过也很好了。
CG 对比案例 4:这个就太惊喜了,在前半段基本没啥问题,尤其是变狼的的动作处理,几乎跟 CG 已经同步了。
而且在人物和狼的运动及动作切换都没问题,背景的士兵和烽火也都在运动。
CG 对比案例 5:这条由于首帧龙身不全,可灵把龙变成了长翅膀的西方龙,但是在其他部分的表现可以说是完美。
最后的城市看起来也非常清晰,然后在龙的运动和镜头调度上,可灵转了两圈,绕过了两座山,我觉得甚至比原来的 CG 表现还要更好。
CG 对比案例 6:这个应该是这几个里面还原的最好的。如果我在飞在空中的时候给他加一个变速的话就更像了,在汽车落地之后的可灵甚至还加了一个甩尾的漂移,镜头跟在车的旁边,太顶了。
好了这次的可灵 2.5 Turbo测试就到这里了。
从上面的这些案例可以看到,在一些特定场景下 AI 视频额内容质量真的可以跟 CG 掰一掰手腕了。
目前 AI 视频距离替代 CG 肯定还有一段距离,但是在整个 CG 流程中 AI 已经可以一定程度上承担动态的部分了。
推荐 CG 大佬们可以试试场景摆放好之后将动态预览的部分交给可灵 2.5 Turbo试试,在前期方案探索和预览上肯定比直接渲染要迅速和方便的多。