今天本机试了下这个 ai 克隆语音生成。在 b 站找了个自己关注的 up 主,下载视频,ffmpeg 生成并切分 wav 语音包,大概一分钟的长度的样子。然后使用网友提供的 synthesizer 模型,输入要合成的文本。最后的语音效果虽然不是 100%一样,但是也有 90%,相当可怕。以后借钱不仅不能只听语音,连视频也不行,除非是真人🌚
GitHub - babysor/MockingBird: 🚀AI拟声: 5秒内克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time