简介

Gemini Image 系列是 Google DeepMind 开发的图像生成模型,代号 “Nano Banana”,基于 Gemini 大模型构建,以文字渲染能力和多图融合著称。

模型版本

版本代号发布时间特点
Gemini 2.5 Flash ImageNano Banana2025.08首发版本、3D 手办爆火
Gemini 3 Pro ImageNano Banana Pro2025.114K 分辨率、文字渲染最强

核心能力

  • 文字渲染:业界最强的图片内文字生成
  • 多语言文字:支持多种语言和字体
  • 多图融合:最多 14 张图片融合
  • 人物一致性:最多 5 个人物保持一致
  • 图像编辑:自然语言描述修改图片

技术特点

  • Gemini 基础:继承多模态理解能力
  • 搜索验证:Pro 版可搜索验证视觉事实
  • 高分辨率:支持 2K/4K 输出
  • 3D 效果:擅长 3D 风格生成

规格对比

参数Nano BananaNano Banana Pro
最高分辨率1024×10244K
多图输入支持最多 14 张
人物一致性有限最多 5 人
搜索验证

定价

  • Gemini 2.5 Flash Image:30/百万 token)
  • Gemini 3 Pro Image:按 token 计费

可用渠道

  • Gemini App(免费有限额)
  • Google AI Studio
  • Vertex AI
  • 302.AI、OpenRouter 等聚合平台
  • Adobe Firefly、Figma、Canva 集成

”Nano Banana” 名称由来

“Nano Banana” 是 Google 内部在 LMSYS Chatbot Arena 进行盲测时使用的代号,因社区广泛使用而保留。2025 年 8 月 3D 手办生成功能在社交媒体爆火。

官方链接