简介

Step 系列是阶跃星辰 (StepFun) 开发的大模型,涵盖语言、视觉、音频等多个模态。Step-2 是中国首个万亿参数的 MoE 语言模型。

模型版本 (2025.12)

语言模型

模型发布时间特点
Step-22024.07万亿参数 MoE,对标 GPT-4
Step-12024.03千亿参数,长文本

多模态模型

模型特点
Step-1.5V视觉理解增强,识别细节
Step-1X图像生成
Step-Audio 22025.07 发布,端到端音频多模态
Step-Video-T2V视频生成,30B 参数

技术特点

  • 万亿 MoE:Step-2 采用混合专家架构,实现万亿参数规模的高效训练
  • 全模态布局:同时拥有语言、视觉、音频、视频模型
  • 端到端音频:Step-Audio 2 支持低延迟实时语音交互

官方资源