即刻App年轻人的同好社区
下载
App内打开
Szhans
11月前
🚀 重磅: Open AI 正式推出文生视频模型 Sora

名为Sora 视频模型突然降临,Open AI 目前提供的情报,所揭示的一些惊人能力:

- Sora 根据用户提示可以生成长达一分钟的视频,同时保持视觉质量。(在这部电影预告片的提示词,非常简介:讲述 30 岁的太空人头戴红色羊毛针织摩托车头盔的冒险故事,蓝天、盐碱沙漠、电影风格、35 毫米胶片拍摄、色彩鲜明。)
- Sora 能够生成包含多个角色、特定运动类型以及主体和背景准确细节的复杂场景。
- Sora 将理解你。这意味着和Dall·E 3有着类似的体验,它具有非凡的语言理解力。
- Sora 还能理解这些事物在物理世界中是如何存在的;换句话说,Sora 理解关于世界如何通过知识和规律进行表征,这可能是重大突破之一。(Hans注,这并不代表它是完美理解世界)
- Sora 还能在单个生成的视频中创建多个镜头,准确地体现角色和视觉风格。
- Sora 是一种采取了Transformer架构的扩散模型,不仅能生成还能延长,让模型一次性预测多帧画面,确保主体一致性。
- 更多官方案例参考
openai.com


🔒 安全方面的声明和步骤:

Open A 正在与红队人员(错误信息、仇恨内容和偏见等领域的专家)合作,他们将对模型进行对抗性测试。还在开发一些工具来帮助检测误导性内容,例如检测分类器,它可以分辨出视频是由 Sora 生成的。

Open AI相信,从现实世界的使用中学习,是随着时间的推移创建和发布越来越安全的人工智能系统的重要组成部分。



⛰️ Text 2 Video 的生态位

差不多在去年这个时候,Runway 所引爆的 Text 2 Video相关的生态位开启了重构好莱坞的想象空间。不到一年 Sora 的横空出生,其必将带来难以想像的变革力量。这是山峰再一次的快速攀升。

从多模态的深远意义来说,我强烈意识到 Open AI 描述的野心: 「Sora 是能够理解和模拟现实世界的模型的基础,我们相信这种能力将是实现 AGI 的重要里程碑。」
00:17
1690

来自圈子

圈子图片

AI探索站

79860人已经加入