简介
Gemma 是 Google 推出的开源大语言模型系列,基于 Gemini 相同的技术架构打造。Gemma 专为负责任的 AI 开发而设计,以轻量级、高性能著称,适合在消费级硬件(如笔记本电脑、云服务器)上运行。
模型版本 (2025.12)
| 模型 | 参数量 | 特点 |
|---|---|---|
| Gemma 2 27B | 27B | 旗舰开源版,性能媲美 70B+ 模型,推理高效 |
| Gemma 2 9B | 9B | 主流尺寸,超越 Llama 3 8B,适合大多数开发场景 |
| Gemma 2 2.6B | 2.6B | 端侧极致轻量,适合移动设备 |
核心特点
- 架构先进:采用滑动窗口注意力机制 (Sliding Window Attention) 和 Logit Soft-capping 等技术,提升推理效率和稳定性。
- 高效推理:针对 TPU 和 NVIDIA GPU 进行了深度优化,部署成本低。
- 负责任 AI:内置安全护栏,经过严格的红队测试。
- 多语言能力:虽然以英语为主,但多语言处理能力依然强劲。
技术规格
- 上下文窗口:8K tokens
- 训练数据:27B 模型使用了 13T tokens,9B 模型使用了 8T tokens。
适用场景
- 本地部署:隐私敏感或无网环境的任务。
- 学术研究:由于其开放性和高性能,适合作为基座模型进行微调研究。
- 辅助编码:Gemma 2 在代码生成和理解方面表现优异。
官方资源
- 官网:https://ai.google.dev/gemma
- HuggingFace:https://huggingface.co/google