NPU 全称是 Neural Processing Unit(神经网络处理单元)

它是一种专门为 人工智能(AI)计算任务 设计的芯片或芯片模块,类似于 GPU 之于图形渲染。NPU 的目标是高效地执行 深度学习推理(尤其是卷积神经网络、Transformer 等模型)的计算。


🔑 主要特点

  1. 针对矩阵运算优化

    • 神经网络中大量涉及矩阵乘法、卷积等操作。NPU 内部往往有专门的阵列结构(类似 Google TPU、华为昇腾里的 矩阵乘单元),能在并行计算上远超 CPU/GPU 的通用设计。
  2. 低功耗

    • 设计目标通常是 “以尽可能低的能耗完成 AI 运算”,尤其适合手机、IoT 设备、笔记本电脑等场景。
    • 举例:手机里的 NPU 可以在耗电很少的情况下完成图像识别、AI 拍照优化。
  3. 高吞吐量

    • 能同时并行处理成千上万次计算,特别擅长批量推理。
  4. 和 CPU/GPU 协同工作

    • CPU:通用逻辑、控制任务。
    • GPU:高并行图形 & 通用计算。
    • NPU:AI 特定运算(卷积、矩阵乘法、非线性激活函数等)。

📱💻 常见应用

  • 手机

    • 华为麒麟芯片里的 NPU(例如麒麟 970 就是首个商用 NPU 的手机 SoC)。
    • 苹果 A 系列 / M 系列芯片的 Neural Engine
    • 高通骁龙里的 Hexagon DSP 也常作为 AI 加速器使用。
  • PC / 笔记本

    • 2023 年开始,Intel 的 Meteor Lake、AMD 的 Ryzen AI 都加入了 NPU,用于加速 Windows Copilot、视频降噪、人脸识别等。
  • 服务器 / 数据中心

    • Google TPU、华为 昇腾、寒武纪 MLU 都属于 NPU 类型。

✅ 总结一句: NPU 就是一个 专为人工智能运算加速设计的芯片/单元,和 CPU、GPU 互补,能让设备在更低能耗下更快跑 AI 应用。