简介
Gemini Image 系列是 Google DeepMind 开发的图像生成模型,代号 “Nano Banana”,基于 Gemini 大模型构建,以文字渲染能力和多图融合著称。
模型版本
| 版本 | 代号 | 发布时间 | 特点 |
|---|---|---|---|
| Gemini 2.5 Flash Image | Nano Banana | 2025.08 | 首发版本、3D 手办爆火 |
| Gemini 3 Pro Image | Nano Banana Pro | 2025.11 | 4K 分辨率、文字渲染最强 |
核心能力
- 文字渲染:业界最强的图片内文字生成
- 多语言文字:支持多种语言和字体
- 多图融合:最多 14 张图片融合
- 人物一致性:最多 5 个人物保持一致
- 图像编辑:自然语言描述修改图片
技术特点
- Gemini 基础:继承多模态理解能力
- 搜索验证:Pro 版可搜索验证视觉事实
- 高分辨率:支持 2K/4K 输出
- 3D 效果:擅长 3D 风格生成
规格对比
| 参数 | Nano Banana | Nano Banana Pro |
|---|---|---|
| 最高分辨率 | 1024×1024 | 4K |
| 多图输入 | 支持 | 最多 14 张 |
| 人物一致性 | 有限 | 最多 5 人 |
| 搜索验证 | 否 | 是 |
定价
- Gemini 2.5 Flash Image:30/百万 token)
- Gemini 3 Pro Image:按 token 计费
可用渠道
- Gemini App(免费有限额)
- Google AI Studio
- Vertex AI
- 302.AI、OpenRouter 等聚合平台
- Adobe Firefly、Figma、Canva 集成
”Nano Banana” 名称由来
“Nano Banana” 是 Google 内部在 LMSYS Chatbot Arena 进行盲测时使用的代号,因社区广泛使用而保留。2025 年 8 月 3D 手办生成功能在社交媒体爆火。