简介
Step 系列是阶跃星辰 (StepFun) 开发的大模型,涵盖语言、视觉、音频等多个模态。Step-2 是中国首个万亿参数的 MoE 语言模型。
模型版本 (2025.12)
语言模型
| 模型 | 发布时间 | 特点 |
|---|---|---|
| Step-2 | 2024.07 | 万亿参数 MoE,对标 GPT-4 |
| Step-1 | 2024.03 | 千亿参数,长文本 |
多模态模型
| 模型 | 特点 |
|---|---|
| Step-1.5V | 视觉理解增强,识别细节 |
| Step-1X | 图像生成 |
| Step-Audio 2 | 2025.07 发布,端到端音频多模态 |
| Step-Video-T2V | 视频生成,30B 参数 |
技术特点
- 万亿 MoE:Step-2 采用混合专家架构,实现万亿参数规模的高效训练
- 全模态布局:同时拥有语言、视觉、音频、视频模型
- 端到端音频:Step-Audio 2 支持低延迟实时语音交互