卧槽,来了Meta发布Meta Movie Gen视频音频生成模型系列,剪辑模型也太牛了。
具体包括:
Movie Gen Video:30B DiT 模型,单个文本提示生成高质量、高清晰度的图像和视频。
Movie Gen Audio:13B transformer模型,可以接受视频输入以及可选的文本提示用于可控性,生成与视频同步的高保真音频。
Personalized videos:使用生成或现有视频以及附带的文字说明作为输入,可以执行本地化编辑,如添加、删除或替换元素。
详细信息:
ai.meta.com