即刻App年轻人的同好社区
下载
App内打开
Szhans
3月前
🎬 Dan Shipper:Sora 是如何工作的(及其意义)

「我们不会惊慌失措。我们不会预言乌托邦,也不会预言末日,我们要保持头脑清醒。」

这看似镇静的开场,难以掩饰作者Dan Shipper的兴奋—— 这位ChatGPT 研究者向来以文笔优美、洞察深邃著称。

Hans 强烈推荐,你直接阅读原文 :

🔗 every.to

在这篇深入浅出的科普小作文, Dan 提出了几个精妙的隐喻和发现,让我深深共鸣:

- 正如 GPT-4 模型本质在于预测下一个文本的令牌, 而Sora 是预测图像下一个的「补丁」。

- 「补丁」的创新让Sora无比强大,从无穷无尽的视频被剪切出来,海量数据堆叠起来输入到模型中。

- Sora的一大进步在于其架构,不同于Runway是扩散模型, GPT-4是Transformer :Sora 是两者的混合体。 这个架构具有算力意义的拓展性。

- GPT-4 「似乎」可以学习语法规则,而Sora「似乎」可以学习物理学(宇宙的语法)。

- 有两个趋势是如此清晰而重要:海量数据和算力能产生震撼人心的AI 突破;技术会带来各种成本降低,例如电影制作。

- 在电影的历史里,只有少数人才能制作电影。 因为拍电影的投资风险够高,过去二十年一直在改变,从Youtube、Tiktok,电影制作形式一直在以新的方式呈现。

- 新工具和技术总能催生新的电影制作风格。比如之前人们用韦斯·安德森(Wes Anderson)的风格来演绎《星球大战》中的角色,成为了AI 视频的一种流行。

- Sora 因为长达1分钟的质的飞跃,让电影制作可以用更少成本产生更多的多样性和复杂性。

- 在近期一次与AI 电影制作前沿人士的交流:Dave Clark作为传统电影制作人已经实战AI 生成的视频,最近一部《借用时间》的科幻短片,完全使用Midjourney和Runway来生成,自己亲自配音并结合Eleven Labs来完成其他角色声音。 这部短片广受好评,好莱坞的顶级电影公司希望将其拍成长篇。

- 简言之,这意味着电影测试成本急剧下降,创意被实现的可能性更高了,就像现在的作家通过推特和Newsletter来获得图书交易一样。

- AI 将创造自己的电影类型, 利用IP混搭、剪辑和快速剪辑的内容会涌现,但不会取代传统的好莱坞,就像Youtube一样, 它会蚕食人们的注意力和份额。

- 我们正在从知识为报酬转变为以智力分配为报酬的世界。 在这新世界个人贡献者或创作者也成会成为管理者, 但我们管理的不是人,而是模型。

- Sora 并非让任何人能一键制作精彩电影,讲故事、品味和奉献精神会成为创造力的关键。 但毫无疑问,这是最好的时代。
37

来自圈子

圈子图片

AI探索站

66768人已经加入