即刻App年轻人的同好社区
下载
App内打开
Frank.Lin
1年前
周末做了个AI动画工具雏形(源码:github.com),让GPT按格式输出脚本,prompt大概是这样:

写一段场景对话,角色为A和B,内容是A给B提了一个问题(其实是个脑筋急转弯问),输出格式为csv,每行为『角色,表情,谈话内容』,表情只能从『cry/peace/pround/shy/stupid/wronged/cheap/contemptuous』选择一个,举例:
A,peace,"你吃了吗"
B,pround,"吃了,你呢"
A,cry,"没有,好饿"
B,peace,"那赶紧去吧"

这其中的角色、表情必须按照预先做好的模板来。把GPT输出的结果粘贴到项目中的script.csv文件,按运行就可以了。程序会自动把脚本通过Azure的TTS语音合成API转换成MP3格式,并设置好帧数,然后再用PYgame引擎播放出来。

这个项目最终的愿景是成为一个不需要调节时间轴的动画编辑器。Runaway的Gen-2有着宏大的模板,这就导致了连一个简单的对话场景都很难做出来,而我的想法是退一步,准备好多种模板,让AI生成脚本并套模板生成动画。

最近AI方面的热度下降不少,大部分开发者也还是在做非常的同质化的chatbot文生图/音/视频,而我认为这恰好是有创意的开发者和产品设计师的机会。

第一版很粗糙,还有帧数的bug,不过我还是很开心又落地了一个idea:
46

来自圈子

圈子图片

AI探索站

77858人已经加入