Gemma 系列

简介

Gemma 是 Google 推出的开源大语言模型系列，基于 Gemini 相同的技术架构打造。Gemma 专为负责任的 AI 开发而设计，以轻量级、高性能著称，适合在消费级硬件（如笔记本电脑、云服务器）上运行。

模型版本 (2025.12)

模型	参数量	特点
Gemma 2 27B	27B	旗舰开源版，性能媲美 70B+ 模型，推理高效
Gemma 2 9B	9B	主流尺寸，超越 Llama 3 8B，适合大多数开发场景
Gemma 2 2.6B	2.6B	端侧极致轻量，适合移动设备

核心特点

架构先进：采用滑动窗口注意力机制 (Sliding Window Attention) 和 Logit Soft-capping 等技术，提升推理效率和稳定性。
高效推理：针对 TPU 和 NVIDIA GPU 进行了深度优化，部署成本低。
负责任 AI：内置安全护栏，经过严格的红队测试。
多语言能力：虽然以英语为主，但多语言处理能力依然强劲。

技术规格

上下文窗口：8K tokens
训练数据：27B 模型使用了 13T tokens，9B 模型使用了 8T tokens。

适用场景

本地部署：隐私敏感或无网环境的任务。
学术研究：由于其开放性和高性能，适合作为基座模型进行微调研究。
辅助编码：Gemma 2 在代码生成和理解方面表现优异。

官方资源

官网：https://ai.google.dev/gemma
HuggingFace：https://huggingface.co/google