简介
Veo 是 Google DeepMind 开发的视频生成模型,具备强大的世界理解能力,可生成电影级质量的视频内容。
模型版本
| 版本 | 发布时间 | 特点 |
|---|---|---|
| Veo | 2024.05 | 首发版本 |
| Veo 2 | 2024.12 | 4K 分辨率、更长时长 |
| Veo 3 | 2025 | 原生音频生成 |
| Veo 3.1 Pro | 2025 | 专业版,更高质量 |
核心能力
- 文本生成视频:自然语言描述生成视频
- 图片生成视频:图片动态化
- 原生音频:Veo 3 支持音画同步生成
- 长视频:支持多分钟视频
- 镜头控制:专业电影镜头语言
技术特点
- 世界模型基础:理解物理和因果关系
- 高分辨率:支持 4K 输出
- 多模态融合:结合 Gemini 能力
- 时间一致性:长视频保持连贯
规格参数
| 参数 | 数值 |
|---|---|
| 最高分辨率 | 4K |
| 最长时长 | 2+ 分钟 |
| 音频 | Veo 3 原生支持 |
API 接入
通过 Vertex AI 和 302.AI 等平台可调用 Veo API。