腾讯下场做AI视频了,测试了小一周后,先说说结论,混元AI在超写实风格、镜头切换、连续动作、语义理解都有相当的效果,足够成为我工作流的一环。
镜头切换和语义理解单拎出来讲讲,之前能够实现效果比较好的镜头切换的是即梦AI的Pixeldance。现在,混元也上桌了。
只要提示语中写了“镜头切换到xxxx”,就会生成对应的效果。
而对于“几何对称构图”“万花镜光影”“90度俯瞰镜头”“圆形构图”等等这些有点抽象的词语,混元的理解和生成效果更加接近我想要的。
还是目前参数最大的开源文生视频大模型,感觉Sora再不发就没必要发了。。。