我还是更相信开源社区。
OpenAI 总是提供很好的范式,DallE2,GPT, Sora.. 但至今你都没办法让 DallE2 画具体某个游戏画风的角色/场景,由于数据集本身的多样性不够,导致没有办法做具体的项目风格,风格没有办法自定义,对于大多数商业项目来说就没有意义,即实用性很低。
但 Sora 对于我来说也是有 takeaway 的:
1. diffusion+transformer 构架
去年和 VC 聊天时,我最喜欢问的问题是:“你觉得 AI 视频究竟是大公司的机会,还是小公司的机会?”其中得到过一个很有趣的回答:“如果未来的生成式视频构架还是 diffusion 的话,那小公司机会更大;如果是 transformer 构架的话,那还是大公司的机会。”从 OpenAI 技术报告看, transformer 架构的 spacetime patches 是其技术的核心。
2. 自然语言交互的视频剪辑
AI 在视频行业带来的最大的变化,以前影视制作前中后三期泾渭分明,我们前期设计、中期拍摄、后期制作;现在则在后期阶段也会不断生成新的素材,甚至定义新的设计。工作流的压缩必定带来新的工具需求。AI 除了由于生成能力极强,让生产变得前所未有的容易以外,也在创造新的交互范式的可能,其中就是用自然语言来改图/改视频,这在 GPT4 中已见雏形,在 Sora 的 v2v editing 中则显得更加吸引人。
就说这么多吧,以 Sora 模型的发布为起点,开始今年的正式复工。只要你真的足够特别,那么你一定会迎来属于你的登场时机。