简介

Gemma 是 Google 推出的开源大语言模型系列,基于 Gemini 相同的技术架构打造。Gemma 专为负责任的 AI 开发而设计,以轻量级、高性能著称,适合在消费级硬件(如笔记本电脑、云服务器)上运行。

模型版本 (2025.12)

模型参数量特点
Gemma 2 27B27B旗舰开源版,性能媲美 70B+ 模型,推理高效
Gemma 2 9B9B主流尺寸,超越 Llama 3 8B,适合大多数开发场景
Gemma 2 2.6B2.6B端侧极致轻量,适合移动设备

核心特点

  • 架构先进:采用滑动窗口注意力机制 (Sliding Window Attention) 和 Logit Soft-capping 等技术,提升推理效率和稳定性。
  • 高效推理:针对 TPU 和 NVIDIA GPU 进行了深度优化,部署成本低。
  • 负责任 AI:内置安全护栏,经过严格的红队测试。
  • 多语言能力:虽然以英语为主,但多语言处理能力依然强劲。

技术规格

  • 上下文窗口:8K tokens
  • 训练数据:27B 模型使用了 13T tokens,9B 模型使用了 8T tokens。

适用场景

  • 本地部署:隐私敏感或无网环境的任务。
  • 学术研究:由于其开放性和高性能,适合作为基座模型进行微调研究。
  • 辅助编码:Gemma 2 在代码生成和理解方面表现优异。

官方资源