《倒春寒》MV - 即梦 OmniHuman-1 测试作品
这玩意确实标志着视频生成的新阶段
从单一的画面运动变成了整体整体输出
你可以直接将一张图片变成,带语音、音乐和唇形同步、表情的视频
制作过程:
音乐生成:即梦
视频&唇形同步:即梦
歌词生成:Deepseek R1
脚本生成:Deepseek R1
图片生成:Midjoureny
多模态视频生成介绍:
最低只需要上传图片和需要说话的文字
可以直接生成全身动作、表情、口型
支持各种风格的生成比如水墨、皮克斯、动漫
支持所有类人主体的生成
时间限制为15秒
支持上传歌曲音频
即使是图片在嘴部和面部有遮挡、侧脸也可以流畅生成
现存问题:
在音乐生成的时候面部表情有点用力过猛,可能跟音频响度有关
如果音频模糊、快速演唱或者说话的时候,嘴型生成可能会不准确