简介
Sora 是 OpenAI 开发的视频生成模型,能够根据文本描述生成高质量、物理真实的视频,被认为是通向世界模拟器的重要一步。
模型版本
| 版本 | 发布时间 | 特点 |
|---|---|---|
| Sora | 2024.02 预览 | 首次发布,最长 60 秒 |
| Sora Turbo | 2024.12 | 更快生成速度 |
| Sora 2 | 2025 | 音画同步、更长时长 |
核心能力
- 文本生成视频:根据描述生成视频
- 图片生成视频:静态图片动态化
- 视频扩展:延长现有视频
- 视频编辑:修改视频内容
- 物理模拟:理解物理规律
技术特点
- Diffusion Transformer:结合扩散模型和 Transformer
- 时空补丁:统一处理不同分辨率和时长
- 物理理解:模拟真实世界物理
- 长上下文:保持视频一致性
规格参数
| 参数 | 数值 |
|---|---|
| 最长时长 | 60 秒(可扩展) |
| 最高分辨率 | 1080p |
| 帧率 | 24-60 fps |
相关产品
- Sora:OpenAI 视频生成服务