2024年8月3日,快手推出的LivePortrait模型更新了动物模式,通过对约23万帧各种动物(主要是猫和狗)的数据进行微调,实现了动物动画生成。推特用户@Kijaidesign分享了他使用ComfyUI插件测试新模型的体验,称效果可以补充出猫的牙齿和舌头。虽然目前用于动物面部检测的X-Pose插件尚未支持,但已有的face-alignment功能仍能使用。
该模型采用了基于隐式关键点框架的策略,在计算效率和可控性之间实现了平衡。具体来说,LivePortrait能够在单一形象上进行动作重演,还支持不同形象间的交叉动作重演,适用于各种艺术风格和尺寸的静态图像。在技术细节方面,LivePortrait的核心在于其拼接和重定向模块。这些模块允许将动画面部无缝集成到原始图像中,并对眼睛和嘴巴的运动进行控制。通过扩展训练数据集和设计拼接模块,模型在生成质量和泛化能力上得到了提升。在RTX 4090 GPU上,生成速度缩短至每帧12.8毫秒。
用户体验方面,LivePortrait的应用场景非常广泛。内容创作者和影响者可以利用该工具从单个图像生成动画视频。电影制片人和动画师可以创建角色动画。市场营销人员和广告商可以利用LivePortrait创建视频广告。教育工作者和电子学习开发者可以通过动画肖像使学习材料更加互动。游戏开发者则可以创建角色动画。
在技术对比方面,LivePortrait与其他肖像动画生成工具相比具有优势。与基于扩散模型的方法相比,LivePortrait在生成速度和计算效率上具有优势。基于隐式关键点的框架使得LivePortrait能够在保持动画效果的同时,实现更快的生成速度和更低的计算资源消耗。
竞争对手方面,腾讯的AniPortrait是一个值得关注的竞争对手。AniPortrait同样是一款肖像动画生成工具,能够基于音频和一张参考图像生成动画人像。该项目在GitHub上获得了广泛关注和好评,Star数已经突破2800。AniPortrait的创新之处在于其Audio2Lmk和Lmk2Video两个模块,前者用于提取Landmark序列,后者则利用这些Landmark序列生成人像视频。