概述

Llama 是由 Meta AI 开发的开源大型语言模型系列,旨在为研究人员和开发者提供高性能、可扩展的语言模型。相比 GPT 等闭源模型,Llama 的开源策略允许更多的定制和研究,是开源 LLM 领域的重要里程碑。

版本演进

  • Llama 1(2023.02):初始版本,提供 7B/13B/33B/65B 参数规模
  • Llama 2(2023.07):性能显著提升,提供 7B/13B/34B/70B 参数版本,并包含经过指令微调的 Chat 版本
  • Llama 3(2024.04):架构改进,扩展上下文长度,提供 8B/70B 版本
  • Llama 3.1(2024.07):新增 405B 参数版本,支持 128K 上下文

主要特点

  • 开源:允许研究者和开发者自由使用和修改
  • 高效:相比同等规模的其他模型,Llama 通常表现更好
  • 指令微调:提供经过 RLHF 微调的 Chat 版本,适合对话和任务完成
  • 多语言支持:主要训练于英语数据,但具备一定的多语言能力

应用场景

  • 自然语言处理研究
  • 对话系统开发
  • 文本生成和内容创作
  • 代码辅助和程序设计