Veo 系列

简介

Veo 是 Google DeepMind 开发的视频生成模型，具备强大的世界理解能力，可生成电影级质量的视频内容。

模型版本

版本	发布时间	特点
Veo	2024.05	首发版本
Veo 2	2024.12	4K 分辨率、更长时长
Veo 3	2025	原生音频生成
Veo 3.1 Pro	2025	专业版，更高质量

核心能力

文本生成视频：自然语言描述生成视频
图片生成视频：图片动态化
原生音频：Veo 3 支持音画同步生成
长视频：支持多分钟视频
镜头控制：专业电影镜头语言

技术特点

世界模型基础：理解物理和因果关系
高分辨率：支持 4K 输出
多模态融合：结合 Gemini 能力
时间一致性：长视频保持连贯

规格参数

参数	数值
最高分辨率	4K
最长时长	2+ 分钟
音频	Veo 3 原生支持

API 接入

通过 Vertex AI 和 302.AI 等平台可调用 Veo API。

相关

Veo：世界模型介绍
Imagen 系列：Google 图像模型

官方链接

DeepMind：https://deepmind.google/technologies/veo