今天Runway Gen3向所有用户开放,用之前Sora的那批翻车prompt做测试,并与luma和快手可灵进行不严谨横向对比,发现Runway没有拉开显著优势。
具体测评case见飞书文档 《Runway,Luma,可灵大战Sora|同prompt比拼》
ix5mo5od606.feishu.cn亲测大量case后,总体感受如下:
一、Runway,好看的人犯错,当然可以包容
1. Runway的美感,即电影感最强,这跟Runway定位相关,想切入影视
2. 物理逻辑不如可灵,犯错更多,并且为了避免处理复杂逻辑而犯错,就把prompt给简化了
3. 运动幅度和创造性不如luma,但好于可灵
二、Luma,冒险小伙,不稳定但会有惊喜
1. Luma运镜幅度大,很有想象力,可以做出上限比较高的甚至真正有消费价值的视频
2. 但效果不稳定,物理错误多,人物一致性差,不忠实于prompt,依赖大量的抽卡
3. 运动幅度很大,创造性很强,但是不稳定,容易翻车
三、可灵,靠谱老实人,尽可能不犯错
1. 极少犯物理逻辑错误,但偶尔也会犯,说明不是底层模型的进步
2. 但因为过拟合,创造力会差,运动幅度小,小心谨慎如中国传统好学生
3. 会忽略prompt中复杂的元素,不会做,老子就不做了
四、Sora,渣男,只放demo,不放产品
1. 要不是那几个翻车视频,真的以为Sora实现了物理世界模拟器
2. 审美、画质、细节、物理逻辑都是第一,但不知道到底抽卡多少次才能实现这种效果
综上:
如果你要做偏好看的,选runway,综合最强;如果做偏好玩的,选luma,它不稳定但是可能给你惊喜;如果做真实感的,例如需要跟拍摄类素材拼接一起的,选可灵,最真实可靠。