我刚刚体验一下最近的缅因猫模型,速度很快,难以想象这么短时间做出来,目前还是裸模型,很多优化没来得及做,受邀小范围内测
模型效果
1. 基于 prompt,可以快速生成音画同步的 IP 形象 talking video,不用怎么等待,继续输入 prompt 也会随之响应
2. 初始prompt会很大程度上影响效果,猜测是目前的数据量还不够多,所以在某些形象上表现更好,某些表现差一些,后面补更多数据应该可以解决
产品设计
1. 目前的放映厅设计得很不错,精致感,又有短demo的预期
2. 后面真的做产品,做C端和卖API感觉都可以搞,卖API一方面是赚钱,另一方面也是从API的调用里看看有哪些场景值得做和优化模型,电商直播、秀场直播、二次元直播、教育等
3. 自己做C端,初步看适合偏AI陪伴,直播互动之类的形态,这块我想象力还没打开。可能做几个初始直播间,然后其他用户都可以进来发弹幕,丢图片之类的,然后画面针对性变化。或者让 AI 形象做 reaction,给它看一些热门视频,让它边看边评价。
好久没关注这个赛道了,感觉自己想象力匮乏,还得是 00 后适合做