NPU 全称是 Neural Processing Unit(神经网络处理单元)。
它是一种专门为 人工智能(AI)计算任务 设计的芯片或芯片模块,类似于 GPU 之于图形渲染。NPU 的目标是高效地执行 深度学习推理(尤其是卷积神经网络、Transformer 等模型)的计算。
🔑 主要特点
-
针对矩阵运算优化
- 神经网络中大量涉及矩阵乘法、卷积等操作。NPU 内部往往有专门的阵列结构(类似 Google TPU、华为昇腾里的 矩阵乘单元),能在并行计算上远超 CPU/GPU 的通用设计。
-
低功耗
- 设计目标通常是 “以尽可能低的能耗完成 AI 运算”,尤其适合手机、IoT 设备、笔记本电脑等场景。
- 举例:手机里的 NPU 可以在耗电很少的情况下完成图像识别、AI 拍照优化。
-
高吞吐量
- 能同时并行处理成千上万次计算,特别擅长批量推理。
-
和 CPU/GPU 协同工作
- CPU:通用逻辑、控制任务。
- GPU:高并行图形 & 通用计算。
- NPU:AI 特定运算(卷积、矩阵乘法、非线性激活函数等)。
📱💻 常见应用
-
手机:
- 华为麒麟芯片里的 NPU(例如麒麟 970 就是首个商用 NPU 的手机 SoC)。
- 苹果 A 系列 / M 系列芯片的 Neural Engine。
- 高通骁龙里的 Hexagon DSP 也常作为 AI 加速器使用。
-
PC / 笔记本:
- 2023 年开始,Intel 的 Meteor Lake、AMD 的 Ryzen AI 都加入了 NPU,用于加速 Windows Copilot、视频降噪、人脸识别等。
-
服务器 / 数据中心:
- Google TPU、华为 昇腾、寒武纪 MLU 都属于 NPU 类型。
✅ 总结一句: NPU 就是一个 专为人工智能运算加速设计的芯片/单元,和 CPU、GPU 互补,能让设备在更低能耗下更快跑 AI 应用。