人工智能知识库

本页是 AI 领域的工作版导航，负责把基础理论、应用方向、开发部署与治理议题串成一张可继续拆分的知识图谱。具体学习与研究笔记优先落到机器学习、具身智能、世界模型、Q&A/ 和 _terms/ 下。

使用入口

基础学习：机器学习、深度学习、Transformer、强化学习。
机器人与物理世界：具身智能、VLA 动作解码：自回归 vs 扩散、世界模型。
概念卡片：预训练、后训练、RLHF、DPO 等术语放在 _terms/，用于跨笔记复用。
问题沉淀：复杂解释型内容优先放入 Q&A/，避免把长推理堆在索引页。

1. AI 基础理论与方法 (AI Fundamental Theories and Methods)

1.1 符号主义 AI (Symbolic AI)

知识表示与推理 (Knowledge Representation and Reasoning)
- 逻辑推理 (Logical Reasoning)
- 概念表示 (Conceptual Representation)
- 本体论 (Ontology)
- 语义网络 (Semantic Networks)
专家系统 (Expert Systems)
- 规则推理 (Rule-based Reasoning)
- 模糊逻辑 (Fuzzy Logic)
搜索与优化 (Search and Optimization)
- 启发式搜索 (Heuristic Search)
- 进化算法 (Evolutionary Algorithms)
- 遗传算法 (Genetic Algorithms)
规划与决策 (Planning and Decision Making)
- 马尔可夫决策过程 (Markov Decision Processes, MDP)

1.2 机器学习 (Machine Learning)

1.2.1 按学习范式分类 (Learning Paradigms)

监督学习 (Supervised Learning)

分类 (Classification)
- 逻辑回归 (Logistic Regression)
- 支持向量机 (Support Vector Machines, SVM)
- 决策树 (Decision Trees)
- 随机森林 (Random Forest)
- 朴素贝叶斯 (Naive Bayes)
- K 近邻 (K-Nearest Neighbors)
回归 (Regression)
- 线性回归 (Linear Regression)
- 岭回归 (Ridge Regression)
- Lasso 回归

无监督学习 (Unsupervised Learning)

聚类分析 (Clustering)
- K-means
- 层次聚类 (Hierarchical Clustering)
- DBSCAN
降维 (Dimensionality Reduction)
- 主成分分析 (Principal Component Analysis, PCA)
- t-SNE
- UMAP
关联规则学习 (Association Rule Learning)

半监督学习 (Semi-supervised Learning)

自训练 (Self-training)
协同训练 (Co-training)
伪标签 (Pseudo-labeling)

强化学习 (Reinforcement Learning)

价值函数方法 (Value-based Methods)
- Q-learning
- Deep Q-Network (DQN)
- SARSA
策略梯度方法 (Policy Gradient Methods)
- REINFORCE
- Actor-Critic
- PPO (Proximal Policy Optimization)
- A3C (Asynchronous Advantage Actor-Critic)
- GRPO (Group Relative Policy Optimization) - DeepSeek 创新
模型基础 RL (Model-based RL)
多智能体强化学习 (Multi-Agent RL)

1.2.2 按实现技术分类 (Implementation Techniques)

传统机器学习 (Classical Machine Learning)

集成学习 (Ensemble Learning)
- Bagging
- Boosting (AdaBoost, XGBoost, LightGBM)
- Stacking
核方法 (Kernel Methods)

深度学习 (Deep Learning)

基础神经网络 (Basic Neural Networks)
- 多层感知机 (Multi-Layer Perceptron, MLP)
- 自编码器 (Autoencoders)
  - 稀疏自编码器 (Sparse AE)
  - 去噪自编码器 (Denoising AE)
- 反向传播 (Backpropagation)
- 激活函数 (Activation Functions)
- 正则化技术 (Regularization: Dropout, Batch Normalization)
- 优化算法 (Optimizers: SGD, Adam, RMSprop)
卷积神经网络 (Convolutional Neural Networks, CNN)
- 经典架构 (LeNet, AlexNet, VGG, ResNet, Inception)
- 轻量化网络 (MobileNet, EfficientNet)
- 注意力机制 CNN (Attention-based CNN)
循环神经网络 (Recurrent Neural Networks, RNN)
- 长短期记忆网络 (Long Short-Term Memory, LSTM)
- 门控循环单元 (Gated Recurrent Unit, GRU)
- 双向 RNN (Bidirectional RNN)
注意力机制与 Transformer (Attention & Transformer)
- 自注意力机制 (Self-Attention)
- 多头注意力 (Multi-Head Attention)
- Transformer 架构
- 位置编码 (Positional Encoding)
序列状态空间模型 (State Space Models, SSM) 与其他新架构
- 代表方法: S4/SSD, Mamba/Mamba-2, RWKV, RetNet, Hyena
- 特点: 计算/内存复杂度近似线性、长上下文建模更稳健、对流式与边缘端友好
- 适用: 长序列建模、低时延推理、资源受限部署
生成模型 (Generative Models)
- 生成对抗网络 (Generative Adversarial Networks, GAN)
  - DCGAN, StyleGAN, CycleGAN, Pix2Pix
- 变分自编码器 (Variational Autoencoders, VAE)
- 扩散模型 (Diffusion Models)
  - DDPM, DDIM, Stable Diffusion
- 归一化流 (Normalizing Flows)
图神经网络 (Graph Neural Networks, GNN)
- GCN, GAT, GraphSAGE
混合专家模型 (Mixture of Experts, MoE)
- 稀疏激活架构
- 动态路由机制

1.2.3 学习策略与技术 (Learning Strategies)

迁移学习 (Transfer Learning)
- 领域自适应 (Domain Adaptation)
- 微调 (Fine-tuning)
元学习 (Meta-Learning)
- MAML (Model-Agnostic Meta-Learning)
- 学习如何学习 (Learning to Learn)
少样本学习 (Few-Shot Learning)
- 原型网络 (Prototypical Networks)
- 匹配网络 (Matching Networks)
- Siamese 网络
零样本学习 (Zero-Shot Learning)
自监督学习 (Self-Supervised Learning)
- 对比学习 (Contrastive Learning: SimCLR, MoCo)
- 掩码学习 (Masked Learning: MAE, BEiT)
联邦学习 (Federated Learning)
持续学习/终身学习 (Continual/Lifelong Learning)
主动学习 (Active Learning)
课程学习 (Curriculum Learning)
长上下文与位置扩展 (Long-context & Positional Scaling)
- RoPE/ALiBi/YaRN、Position Interpolation、NTK-aware scaling
- 滑动窗口注意力、KV 压缩/丢弃、段内复用 (Segment-level KV Reuse)
推理策略与技能学习
- Program-of-Thought (PoT)、Graph-of-Thought (GoT)
- 自发现/自反思 (Self-Discover / Self-Reflection)

1.2.4 其他 ML 技术

概率图模型 (Probabilistic Graphical Models)
- 贝叶斯网络 (Bayesian Networks)
- 马尔可夫随机场 (Markov Random Fields)
- 隐马尔可夫模型 (Hidden Markov Models)
异常检测 (Anomaly Detection)
因果推断 (Causal Inference)

2. AI 核心应用领域 (AI Core Application Domains)

2.1 自然语言处理 (Natural Language Processing, NLP)

2.1.1 基础技术

文本表示 (Text Representation)
- 词嵌入 (Word Embeddings: Word2Vec, GloVe, FastText)
- 上下文嵌入 (Contextual Embeddings: ELMo)
语法解析 (Syntax Parsing)
- 词性标注 (POS Tagging)
- 依存句法分析 (Dependency Parsing)
- 成分句法分析 (Constituency Parsing)
语义理解 (Semantic Understanding)
- 语义角色标注 (Semantic Role Labeling)
- 共指消解 (Coreference Resolution)

2.1.2 核心任务

文本分类 (Text Classification)
- 情感分析 (Sentiment Analysis)
- 主题分类 (Topic Classification)
- 意图识别 (Intent Recognition)
序列标注 (Sequence Labeling)
- 命名实体识别 (Named Entity Recognition, NER)
- 关键词提取 (Keyword Extraction)
文本生成 (Text Generation)
- 机器翻译 (Machine Translation)
- 文本摘要 (Text Summarization)
- 释义生成 (Paraphrasing)
信息抽取 (Information Extraction)
- 关系抽取 (Relation Extraction)
- 事件抽取 (Event Extraction)
- 知识图谱构建 (Knowledge Graph Construction)
问答系统 (Question Answering)
- 阅读理解 (Reading Comprehension)
- 知识库问答 (Knowledge Base QA)
- 开放域问答 (Open-domain QA)
对话系统 (Dialogue Systems)
- 任务型对话 (Task-oriented Dialogue)
- 开放域对话 (Open-domain Dialogue)
- 检索式对话 (Retrieval-based)
- 生成式对话 (Generative)

2.1.3 语言模型

传统语言模型 (Traditional Language Models)
- N-gram 模型
- 神经语言模型
预训练语言模型 (Pre-trained Language Models, PLM)
- BERT (Bidirectional Encoder Representations from Transformers)
- RoBERTa, ALBERT, ELECTRA
- T5 (Text-to-Text Transfer Transformer)
- BART, mBART
大语言模型 (Large Language Models, LLM)
- OpenAI 系列
  - GPT 系列 (GPT-1/2/3/3.5/4/4o/4o-mini)
  - o1 系列推理模型 (o1-preview, o1, o1-mini, o3)
  - GPT-5 (预计中)
- Anthropic 系列
  - Claude 3 系列 (Haiku, Sonnet, Opus)
  - Claude 3.5 系列 (3.5 Sonnet, 3.5 Haiku)
  - Claude 3.7 Sonnet (首个混合推理模型)
  - Claude 4 系列 (Opus 4, Sonnet 4, Sonnet 4.5)
- Google 系列
  - Gemini 1.0/1.5 系列
  - Gemini 2.0 (2025)
  - Gemini 2.5 系列 (Flash, Pro)
- Meta 系列
  - LLaMA 1/2/3/3.1/3.2/3.3
- 中国开源模型
  - DeepSeek 系列 (V2, V3, R1, R1 升级版)
  - Qwen 系列 (2.5, 3)
  - Yi 系列
- 其他开源模型
  - Mistral 系列
  - Phi 系列 (Microsoft)
多模态大模型 (Multimodal LLMs)
- GPT-4V, GPT-4o
- Gemini 2.0
- Claude 3.5/4 系列
推理模型 (Reasoning Models)
- OpenAI o1/o3 系列
- DeepSeek-R1 (开源推理模型突破)
- Claude 3.7/4 混合推理
检索增强生成 (Retrieval-Augmented Generation, RAG)
- 核心组件: Ingestion → Chunking → Embedding → Indexing → Retrieval → Rerank → Generation
- 关键技术: 多路检索 (Hybrid/Reciprocal Rank Fusion)、结构化检索 (Graph/SQL/知识库)、重排序 (Cross-Encoder)
- 质量保障: Hallucination 检测、引用对齐 (Citations)、事实一致性 (Fact Consistency)
- 工具生态: LlamaIndex、LangChain、Weaviate/FAISS/Milvus、Voyage/CoHere/Unisat 向量检索

注: DeepSeek-R1 于 2025 年 1 月发布,采用纯强化学习训练,在数学、代码等推理任务上达到与 o1 相当的性能,但成本仅为其 15-50%

2.1.4 语音技术

语音识别 (Automatic Speech Recognition, ASR)
- 传统方法 (GMM-HMM)
- 深度学习方法 (DeepSpeech, Wav2Vec, Whisper)
- 端到端模型 (End-to-End Models)
语音合成 (Speech Synthesis / Text-to-Speech, TTS)
- 参数化合成
- 神经网络合成 (WaveNet, Tacotron, VITS)
声纹识别 (Speaker Recognition / Verification)
- 说话人识别 (Speaker Identification)
- 说话人验证 (Speaker Verification)
语音唤醒 (Wake Word Detection / Keyword Spotting)
语音情感识别 (Speech Emotion Recognition)

2.2 计算机视觉 (Computer Vision, CV)

2.2.1 基础技术

图像处理 (Image Processing)
- 滤波与增强 (Filtering and Enhancement)
- 边缘检测 (Edge Detection)
- 形态学操作 (Morphological Operations)
特征提取 (Feature Extraction)
- 传统特征 (SIFT, SURF, HOG, ORB)
- 深度特征 (Deep Features)

2.2.2 核心任务

图像分类 (Image Classification)
- 单标签分类 (Single-label Classification)
- 多标签分类 (Multi-label Classification)
目标检测 (Object Detection)
- 两阶段检测 (Two-stage: R-CNN, Fast R-CNN, Faster R-CNN)
- 单阶段检测 (One-stage: YOLO, SSD, RetinaNet)
- Transformer 检测 (DETR, Deformable DETR)
图像分割 (Image Segmentation)
- 语义分割 (Semantic Segmentation: FCN, U-Net, DeepLab, SegFormer)
- 实例分割 (Instance Segmentation: Mask R-CNN)
- 全景分割 (Panoptic Segmentation)
目标追踪 (Object Tracking)
- 单目标追踪 (Single Object Tracking)
- 多目标追踪 (Multiple Object Tracking: SORT, DeepSORT)
姿态估计 (Pose Estimation)
- 2D/3D 人体姿态估计 (Human Pose Estimation)
- 手势识别 (Gesture Recognition)
- 动物姿态估计
人脸技术 (Face Technology)
- 人脸检测 (Face Detection)
- 人脸识别 (Face Recognition)
- 人脸验证 (Face Verification)
- 表情识别 (Expression Recognition)
- 人脸属性分析 (Face Attribute Analysis)
场景理解 (Scene Understanding)
- 场景分类 (Scene Classification)
- 深度估计 (Depth Estimation: Monocular, Stereo)

2.2.3 视频分析

视频分类 (Video Classification)
动作识别 (Action Recognition)
- 时序动作检测 (Temporal Action Detection)
视频目标检测 (Video Object Detection)
视频分割 (Video Segmentation)
视频摘要 (Video Summarization)

2.2.4 其他视觉任务

图像增强 (Image Enhancement)
- 图像超分辨率 (Image Super-Resolution)
- 图像去噪 (Image Denoising)
- 图像修复 (Image Inpainting)
- 低光增强 (Low-light Enhancement)
图像编辑 (Image Editing)
- 风格迁移 (Style Transfer)
- 图像变换 (Image-to-Image Translation)
光学字符识别 (Optical Character Recognition, OCR)
- 文本检测 (Text Detection)
- 文本识别 (Text Recognition)
3D 视觉 (3D Vision)
- 三维重建 (3D Reconstruction)
- 点云处理 (Point Cloud Processing: PointNet)
- NeRF (Neural Radiance Fields)
- 3D 高斯泼溅 (3D Gaussian Splatting)
- SLAM (Simultaneous Localization and Mapping)

2.3 多模态 AI (Multimodal AI)

视觉 - 语言理解 (Vision-Language Understanding)
- 图像描述生成 (Image Captioning)
- 视觉问答 (Visual Question Answering, VQA)
- 视觉推理 (Visual Reasoning)
- 视觉常识推理 (Visual Commonsense Reasoning)
跨模态检索 (Cross-modal Retrieval)
- 图文检索 (Image-Text Retrieval)
- 视频 - 文本检索 (Video-Text Retrieval)
多模态预训练模型
- CLIP, ALIGN, BLIP, BLIP-2
- Flamingo, GPT-4V/4o, Gemini 2.0, Claude 4
音频 - 视觉学习 (Audio-Visual Learning)

2.4 机器人学 (Robotics)

感知 (Perception)
- 传感器融合 (Sensor Fusion)
- 环境感知 (Environmental Perception)
- 物体识别与定位
定位与建图 (Localization and Mapping)
- SLAM (Simultaneous Localization and Mapping)
- 视觉 SLAM (Visual SLAM: ORB-SLAM, LSD-SLAM)
- 激光 SLAM (LiDAR SLAM)
运动规划 (Motion Planning)
- 路径规划 (Path Planning: A*, RRT)
- 轨迹规划 (Trajectory Planning)
- 避障 (Obstacle Avoidance)
机器人控制 (Robot Control)
- PID 控制
- 自适应控制 (Adaptive Control)
- 模型预测控制 (Model Predictive Control, MPC)
操作与抓取 (Manipulation and Grasping)
- 抓取规划 (Grasp Planning)
- 灵巧操作 (Dexterous Manipulation)
人机交互 (Human-Robot Interaction)
- 手势识别
- 语音交互
- 协作机器人 (Collaborative Robots / Cobots)

3. AI 垂直应用场景 (AI Vertical Applications)

3.1 生成式 AI 应用 (Generative AI Applications)

文本生成 (Text Generation)
- 内容创作 (Content Creation)
- 代码生成 (Code Generation: GitHub Copilot, Cursor, Claude Code)
- 数据合成 (Data Synthesis)
- 邮件/文档写作
图像生成 (Image Generation)
- 文生图 (Text-to-Image)
  - DALL-E 3 (OpenAI)
  - Midjourney
  - Stable Diffusion
  - Flux (Black Forest Labs, 2025)
  - Ideogram (2025)
- 图像编辑 (Image Editing)
  - Inpainting, Outpainting
  - ControlNet (可控生成)
  - IP-Adapter (风格控制)
- 图像风格化
视频生成 (Video Generation)
- 文生视频 (Text-to-Video)
  - Sora (OpenAI)
  - Runway Gen-3/Gen-4 (2025)
  - Pika
  - Kling (快手, 2025)
  - Veo (Google, 2025)
- 图生视频 (Image-to-Video)
- 视频编辑
音频生成 (Audio Generation)
- 音乐生成 (Music Generation)
- 语音克隆 (Voice Cloning)
- 音效生成
3D 生成 (3D Generation)
- 文本到 3D (Text-to-3D)
- 图像到 3D (Image-to-3D)
- NeRF 生成

3.2 智能驾驶 (Autonomous Driving / Intelligent Driving)

感知系统 (Perception Systems)
- 多传感器融合 (Multi-sensor Fusion: Camera, LiDAR, Radar)
- 目标检测与追踪
- 车道线检测 (Lane Detection)
- 可行驶区域分割 (Drivable Area Segmentation)
预测 (Prediction)
- 轨迹预测 (Trajectory Prediction)
- 行为预测 (Behavior Prediction)
决策规划 (Decision Making and Planning)
- 路径规划 (Path Planning)
- 行为决策 (Behavior Planning)
控制系统 (Control Systems)
- 横向控制 (Lateral Control)
- 纵向控制 (Longitudinal Control)
高精地图 (HD Mapping)
V2X 通信 (Vehicle-to-Everything)
仿真测试 (Simulation and Testing)
商业化进展 (2025)
- Waymo: 每周 15 万次自动驾驶出行
- 百度 Apollo Go: 中国多城市运营
- 全球 16 个中国城市、奥斯陆、日内瓦等地开展测试

3.3 推荐系统 (Recommendation Systems)

协同过滤 (Collaborative Filtering)
- 基于用户 (User-based)
- 基于物品 (Item-based)
- 矩阵分解 (Matrix Factorization)
内容推荐 (Content-based Filtering)
混合推荐 (Hybrid Recommendation)
深度学习推荐 (Deep Learning for Recommendation)
- Wide & Deep, DeepFM, DIN
- 序列推荐 (Sequential Recommendation)
实时推荐 (Real-time Recommendation)
冷启动问题 (Cold Start Problem)

3.4 行业应用

医疗健康 (Healthcare)

医学影像分析 (Medical Image Analysis)
- CT/MRI/X 光分析
- 病灶检测与分割
疾病诊断与辅助诊断 (Disease Diagnosis)
药物发现 (Drug Discovery)
基因组学 (Genomics)
个性化医疗 (Personalized Medicine)
医疗问答与咨询
2025 进展: FDA 批准 223 个 AI 医疗设备 (2023 年仅 6 个)

金融 (Finance)

风险评估 (Risk Assessment)
欺诈检测 (Fraud Detection)
算法交易 (Algorithmic Trading)
信用评分 (Credit Scoring)
智能投顾 (Robo-Advisory)
反洗钱 (Anti-Money Laundering, AML)
结构化产品分析

教育 (Education)

自适应学习 (Adaptive Learning)
智能辅导 (Intelligent Tutoring Systems)
自动评分 (Automated Grading)
学习分析 (Learning Analytics)
个性化学习路径

环境科学 (Environmental Science)

气候预测 (Climate Prediction)
能源优化 (Energy Optimization)
生态监测 (Ecological Monitoring)
污染检测 (Pollution Detection)

制造业 (Manufacturing)

质量检测 (Quality Inspection)
预测性维护 (Predictive Maintenance)
供应链优化 (Supply Chain Optimization)
工业机器人 (Industrial Robots)

零售 (Retail)

需求预测 (Demand Forecasting)
价格优化 (Price Optimization)
客户分析 (Customer Analytics)
智能客服 (Intelligent Customer Service)

艺术创作 (Art Creation)

AI 绘画 (AI Painting)
AI 音乐创作 (AI Music Composition)
AI 写作 (AI Writing)
创意设计辅助

安防 (Public Safety / Security)

视频监控 (Video Surveillance)
异常行为检测 (Abnormal Behavior Detection)
人脸识别门禁 (Face Recognition Access Control)
人群分析 (Crowd Analysis)

法律 (Legal Tech)

合同审查 (Contract Review)
法律检索 (Legal Research)
案例分析 (Case Analysis)
法律文书生成
诉讼记录分析

农业 (Agriculture)

精准农业 (Precision Agriculture)
病虫害检测 (Pest and Disease Detection)
作物产量预测 (Crop Yield Prediction)
智能灌溉 (Smart Irrigation)
农业机器人 (Agricultural Robots)

物流 (Logistics)

路线优化 (Route Optimization)
仓储自动化 (Warehouse Automation)
需求预测 (Demand Forecasting)
包裹分拣 (Package Sorting)
配送机器人 (Delivery Robots)

4. AI 工程与开发 (AI Engineering and Development)

4.1 数据工程 (Data Engineering)

数据收集 (Data Collection)
- 网络爬虫 (Web Scraping)
- 数据采集系统
- API 数据接入
数据清洗 (Data Cleaning)
- 缺失值处理
- 异常值检测
- 数据去重
数据标注 (Data Annotation)
- 标注工具 (Labelbox, Scale AI)
- 众包标注
- 半自动标注
数据增强 (Data Augmentation)
- 图像增强 (Crop, Flip, Color Jitter)
- 文本增强 (Back-translation, Synonym Replacement)
- 合成数据生成
数据版本管理 (Data Versioning)
- DVC (Data Version Control)
- 数据血缘追踪
数据湖仓一体 (Data Lakehouse, 2025 趋势)
- 统一数据平台
- 结合数据湖和数据仓库优势

4.2 模型开发 (Model Development)

模型训练 (Model Training)
- 超参数调优 (Hyperparameter Tuning)
  - 网格搜索 (Grid Search)
  - 随机搜索 (Random Search)
  - 贝叶斯优化 (Bayesian Optimization)
- 分布式训练 (Distributed Training)
  - 数据并行 (Data Parallelism)
  - 模型并行 (Model Parallelism)
  - 流水线并行 (Pipeline Parallelism)
  - 张量并行 (Tensor Parallelism)
- 混合精度训练 (Mixed Precision Training)
- 梯度累积 (Gradient Accumulation)
大模型调优 (Large Model Fine-tuning)
- 全参数微调 (Full Fine-tuning)
- 参数高效微调 (Parameter-Efficient Fine-tuning, PEFT)
  - LoRA (Low-Rank Adaptation)
  - QLoRA (Quantized LoRA)
  - Adapter, Prefix Tuning, P-tuning
- 指令微调 (Instruction Tuning)
- RLHF (Reinforcement Learning from Human Feedback)
- DPO (Direct Preference Optimization)
- 提示工程 (Prompt Engineering)
  - Few-shot Prompting
  - Chain-of-Thought (CoT)
  - ReAct, Tree-of-Thought
  - Self-Consistency
- 2025 新趋势: 纯强化学习训练 (Pure RL Training)
  - DeepSeek-R1 方法: 无需人类标注的推理训练
- 新偏好优化方法: IPO、KTO、RPO、ORPO (稳定性与效率提升)
- 结构化输出: JSON Mode、函数调用模板、约束语法 (Grammar-based Decoding)
- Guardrails: PII 过滤、越权指令拒绝、政策合规过滤

4.3 模型优化 (Model Optimization)

模型压缩 (Model Compression)
- 知识蒸馏 (Knowledge Distillation)
- 模型剪枝 (Model Pruning)
  - 结构化剪枝 (Structured Pruning)
  - 非结构化剪枝 (Unstructured Pruning)
- 量化 (Quantization)
  - 训练后量化 (Post-Training Quantization, PTQ)
  - 量化感知训练 (Quantization-Aware Training, QAT)
  - INT8/INT4/INT2 量化
  - FP8 量化 (NVIDIA 新标准)
- 低秩分解 (Low-rank Factorization)
- 组量化 (Group-wise Quantization)
- 矩阵重排 (Permutation-aware Quantization)
- SmoothQuant / AWQ / GPTQ / AQLM / QuIP
- 蒸馏到小语言模型 (SLM Distillation)

4.4 模型评估与测试 (Model Evaluation and Testing)

性能评估 (Performance Evaluation)
- 分类指标 (Accuracy, Precision, Recall, F1)
- 回归指标 (MSE, RMSE, MAE, R²)
- 排序指标 (AUC-ROC, mAP)
- NLP 指标 (BLEU, ROUGE, METEOR, BERTScore)
- CV 指标 (IoU, Dice, mIoU)
鲁棒性测试 (Robustness Testing)
- 对抗样本测试 (Adversarial Testing)
- 数据分布偏移测试
A/B 测试 (A/B Testing)
模型基准测试 (Benchmarking)
- MMLU, HumanEval, GSM8K
- GPQA, AIME (数学推理)
- Arena (Chatbot Arena, 实时对战排名)
RAG 专用评估 (RAG Evaluation)
- 检索召回率 (Retrieval Recall)
- 答案真实性 (Factuality)
- 引用覆盖率 (Citation Coverage)
- 参考一致性 (Grounding Consistency)
Agent 评估
- 任务完成率 (Task Success Rate)
- 工具调用正确率 (Tool Use Accuracy)
- 步骤最优性 (Plan Optimality)

4.5 模型部署与推理 (Model Deployment & Inference)

模型服务化 (Model Serving)
- REST API, gRPC
- 批处理推理 (Batch Inference)
- 实时推理 (Real-time Inference)
- 流式推理 (Streaming Inference)
云端部署 (Cloud Deployment)
- AWS SageMaker, Azure ML, Google Vertex AI
- 阿里云 PAI, 腾讯云 TI
- Kubernetes 部署
边缘部署 (Edge Deployment)
- 移动端部署 (Mobile: TensorFlow Lite, Core ML, ONNX)
- IoT 设备部署
- 嵌入式系统
- 相关前沿技术参见 6.5 边缘 AI
模型加速 (Model Acceleration)
- 推理引擎 (TensorRT, ONNX Runtime, OpenVINO)
- GPU/TPU 优化
- 算子融合 (Operator Fusion)
- KV Cache 优化
- 投机采样 (Speculative Decoding)
- FlashAttention / FlashDecoding
- 多次候选头 (Medusa Heads) 并行扩展
- Batch Prefill / Continuous Batching
- 分层缓存 (Paged KV Cache / Unified Memory)
- 混合解码策略: Top-k/Top-p + Contrastive Decoding + Semantic Guidance

4.6 MLOps / AI DevOps

CI/CD for ML
- 自动化训练流水线
- 自动化测试
- 自动化部署
模型监控 (Model Monitoring)
- 性能监控 (Performance Monitoring)
- 数据漂移检测 (Data Drift Detection)
- 模型漂移检测 (Model Drift Detection)
- 在线学习 (Online Learning)
模型版本管理 (Model Versioning)
- 模型注册表 (Model Registry)
实验追踪 (Experiment Tracking)
- MLflow, Weights & Biases, Neptune
特征工程平台 (Feature Store)
- Feast, Tecton
LLMOps 专项 (Observability for LLMs)
- 日志与遥测: 请求/提示/响应链路追踪
- 指标: 延迟、令牌吞吐、拒答率、越狱命中率、幻觉率
- 评测平台: Promptfoo, Phoenix, Giskard, DeepEval
- 在线 Guardrails: 安全策略、提示注入防御、输出约束、PII 屏蔽
RAGOps
- 数据摄取与再切片 (re-chunking)
- 嵌入/索引版本管理
- 在线检索质量监控与热修复 (热更新索引、召回/重排策略切换)

4.7 AI 基础设施 (AI Infrastructure)

AI 芯片 (AI Chips)
- GPU (Graphics Processing Unit)
  - NVIDIA (CUDA, Tensor Cores)
    - Hopper 架构: H100, H200
    - Blackwell 架构: B100, B200, GB200 (2025)
  - AMD (ROCm, MI300, MI350 系列)
- TPU (Tensor Processing Unit)
  - Google TPU v5/v6 (2025)
- NPU (Neural Processing Unit)
  - 移动端 AI 芯片 (Apple Neural Engine, Qualcomm AI Engine)
- 其他 AI 加速器
  - ASIC (Application-Specific Integrated Circuit)
  - FPGA (Field-Programmable Gate Array)
  - 华为昇腾 (Ascend 910C)
  - 寒武纪 (Cambricon)
  - Groq LPU (Language Processing Unit, 2025)
计算平台 (Compute Platforms)
- 云计算 (Cloud Computing)
  - AWS (Amazon Web Services)
  - Microsoft Azure
  - Google Cloud Platform (GCP)
  - 阿里云, 腾讯云, 华为云
- 高性能计算 (High-Performance Computing, HPC)
  - 超算集群
  - GPU 集群
  - 液冷技术 (2025 趋势)
AI 框架底层技术 (Framework Internals)
- 计算图 (Computation Graph)
- 自动微分 (Automatic Differentiation)
- CUDA / cuDNN
- OpenCL
- Triton (NVIDIA)
- XLA (Accelerated Linear Algebra)

4.8 开发框架与工具 (Development Frameworks and Tools)

深度学习框架 (Deep Learning Frameworks)
- TensorFlow / Keras
- PyTorch / PyTorch Lightning
- JAX / Flax
- MXNet
- PaddlePaddle
大模型工具 (LLM Tools)
- 开发框架
  - Hugging Face Transformers
  - LangChain / LangGraph (2025 升级)
  - LlamaIndex
- 推理引擎
  - vLLM (高速推理)
  - SGLang (结构化生成语言, 2025)
  - TGI (Text Generation Inference)
- 训练工具
  - DeepSpeed (分布式训练)
  - Megatron-LM
  - Axolotl
- 本地部署
  - Ollama
  - LM Studio
AutoML 工具
- AutoKeras, Auto-sklearn
- H2O.ai, Google AutoML
- Ray Tune, Optuna
可视化工具 (Visualization Tools)
- TensorBoard
- Weights & Biases (W&B)
- MLflow
- Netron (模型可视化)

5. AI 安全、伦理与治理 (AI Safety, Ethics and Governance)

5.1 AI 安全 (AI Safety)

对抗攻击与防御 (Adversarial Attacks and Defense)
- 对抗样本 (Adversarial Examples: FGSM, PGD, C&W)
- 对抗训练 (Adversarial Training)
- 模型鲁棒性 (Model Robustness)
- 认证鲁棒性 (Certified Robustness)
模型安全 (Model Security)
- 模型窃取 (Model Stealing / Extraction)
- 后门攻击 (Backdoor Attacks / Trojan Attacks)
- 成员推断攻击 (Membership Inference Attack)
- 模型逆向 (Model Inversion)
内容安全 (Content Safety)
- 有害内容检测 (Harmful Content Detection)
- 内容审核 (Content Moderation)
- 毒性检测 (Toxicity Detection)
- NSFW 检测
- 虚假信息检测 (Misinformation Detection)
- 越狱检测 (Jailbreak Detection)
提示注入防御 (Prompt Injection Defense)
- 越狱攻击防御 (Jailbreak Defense)
- 系统提示泄露防护
- 模型供应链安全 (Model Supply Chain Security): 权重篡改、模型来源可信度、SBOM
AI 红队测试 (AI Red Teaming, 2025 趋势)
- 对抗性测试
- 安全漏洞发现

5.2 隐私保护 (Privacy Protection)

差分隐私 (Differential Privacy)
- ε- 差分隐私
- 本地差分隐私 (Local DP)
联邦学习 (Federated Learning)
- 横向联邦学习
- 纵向联邦学习
同态加密 (Homomorphic Encryption)
安全多方计算 (Secure Multi-party Computation, MPC)
数据脱敏 (Data Anonymization / De-identification)
- K- 匿名性
- L- 多样性

5.3 可解释性与可信赖 AI (Explainability & Trustworthy AI)

可解释 AI (Explainable AI, XAI)
- 特征重要性 (Feature Importance)
  - SHAP (SHapley Additive exPlanations)
  - LIME (Local Interpretable Model-agnostic Explanations)
  - 积分梯度 (Integrated Gradients)
- 注意力可视化 (Attention Visualization)
- 显著图 (Saliency Maps)
- 概念激活向量 (CAV)
可解释模型 (Interpretable Models)
- 决策树、线性模型
- GAM (Generalized Additive Models)
决策解释 (Decision Explanation)
模型透明度 (Model Transparency)

5.4 公平性 (Fairness)

偏见检测 (Bias Detection)
- 数据偏见 (Data Bias)
- 算法偏见 (Algorithmic Bias)
公平性度量 (Fairness Metrics)
- 人口统计公平 (Demographic Parity)
- 机会均等 (Equalized Odds)
- 个体公平性 (Individual Fairness)
去偏见技术 (Debiasing Techniques)
- 预处理去偏见
- 训练中去偏见
- 后处理去偏见

5.5 AI 伦理 (AI Ethics)

负责任的 AI (Responsible AI)
- AI 伦理准则
- 人类价值观对齐
AI 对齐 (AI Alignment)
- 价值对齐 (Value Alignment)
- 目标对齐 (Goal Alignment)
- Constitutional AI (Anthropic 提出)
AI 偏见与歧视 (AI Bias and Discrimination)
AI 透明度与问责 (AI Transparency and Accountability)

5.6 AI 治理 (AI Governance)

AI 法规与标准 (AI Regulations and Standards)
- 欧盟 AI 法案 (EU AI Act, 2024 生效)
- 美国 AI 行政令
- 中国生成式 AI 管理办法
- 行业标准 (ISO/IEC, IEEE)
AI 审计 (AI Auditing)
- 算法审计
- 合规性审计
- 第三方评估
知识产权与版权 (Intellectual Property & Copyright)
- AI 生成内容的版权归属
- 训练数据的版权问题
- 开源许可
- 《纽约时报》诉 OpenAI 案等法律纠纷
数据主权 (Data Sovereignty)
- 跨境数据流动
- GDPR, CCPA 等法规遵从
- 数据本地化要求

6. 前沿与新兴技术 (Frontier and Emerging Technologies)

6.1 人工通用智能 (Artificial General Intelligence, AGI)

智能涌现 (Emergent Abilities)
- 规模定律 (Scaling Laws)
- 涌现现象研究
- 能力跃迁研究
推理能力 (Reasoning Capabilities)
- 思维链 (Chain-of-Thought, CoT)
- 树形思维 (Tree-of-Thought)
- 自我反思 (Self-Reflection)
- 长链推理 (Long-Chain Reasoning)
- 数学推理 (Mathematical Reasoning)
- 代码推理 (Code Reasoning)
- 2025 突破: OpenAI o1/o3, DeepSeek-R1 推理模型
工具使用 (Tool Use)
- 函数调用 (Function Calling)
- API 调用
- 工具学习 (Tool Learning)
- 多工具协作
世界模型 (World Models)
- 环境建模与预测
- 物理常识理解
- 因果推理与模拟
- 视频世界模型 (Video World Models)
AI Agent (2025 热点)
- 自主规划 (Autonomous Planning)
  - 任务分解
  - 多步骤规划
- 记忆系统 (Memory Systems)
  - 短期记忆
  - 长期记忆
  - 情景记忆
- 多 Agent 协作 (Multi-Agent Collaboration)
  - Agent 通信协议
  - 分工协作
  - 集体智能
- 应用场景
  - 代码开发 Agent (Devin, Cursor Agent)
  - 研究助手 Agent
  - 业务流程自动化 Agent

6.2 具身智能 (Embodied AI)

机器人学习 (Robot Learning)
- 模仿学习 (Imitation Learning)
- 强化学习用于机器人
- 端到端学习
视觉 - 运动控制 (Vision-Motor Control)
- 视觉伺服控制
- 手眼协调
具身问答 (Embodied Question Answering)
物理世界交互 (Physical World Interaction)
- 物体操控
- 环境探索
人形机器人 (Humanoid Robots, 2025 趋势)
- Tesla Optimus Gen 2
- Figure 01/02
- 小米 CyberOne

6.3 神经符号 AI (Neuro-Symbolic AI)

知识图谱与神经网络融合
- 知识增强的神经网络
- 神经定理证明 (Neural Theorem Proving)
可解释推理 (Explainable Reasoning)
混合推理系统 (Hybrid Reasoning Systems)
- 符号推理 + 神经网络
- 规则引导的学习

6.4 量子机器学习 (Quantum Machine Learning)

量子神经网络 (Quantum Neural Networks, QNN)
量子优化算法 (Quantum Optimization)
- QAOA, VQE
量子核方法 (Quantum Kernel Methods)
量子数据编码 (Quantum Data Encoding)
商业化进展 (2025)
- IBM Quantum, Google Quantum AI
- 中国祖冲之号、九章系列

6.5 边缘 AI (Edge AI)

端侧智能 (On-device Intelligence)
- 端侧推理优化
- 移动端模型设计
- 低功耗设计
TinyML
- 微控制器上的机器学习
- 极低功耗 AI (<1mW)
- 传感器融合
边缘 - 云协同 (Edge-Cloud Collaboration)
- 边缘计算 + 云计算
- 任务卸载 (Task Offloading)
模型分割 (Model Partitioning)
- 层级分割
- 计算分配
联邦边缘学习 (Federated Edge Learning)

注: 边缘 AI 作为前沿研究方向,其工程实践部分参见 4.5 边缘部署

6.6 脑机接口与 AI (Brain-Computer Interface & AI)

神经信号处理 (Neural Signal Processing)
- EEG, fMRI 信号分析
- 神经解码
认知增强 (Cognitive Enhancement)
神经形态计算 (Neuromorphic Computing)
- 脉冲神经网络 (Spiking Neural Networks, SNN)
- 类脑芯片 (Neuromorphic Chips: IBM TrueNorth, Intel Loihi)
脑机交互 (Brain-Machine Interaction)
- Neuralink (Elon Musk)
- 运动控制应用
- 感觉反馈

6.7 AI for Science (AI4Science)

蛋白质与生物学 (Protein & Biology)
- 蛋白质结构预测 (AlphaFold 2/3, ESMFold)
- 蛋白质设计 (RFdiffusion)
- RNA 结构预测
药物设计 (Drug Design)
- 分子生成
- 分子性质预测
- 靶点发现
- 临床试验优化
材料科学 (Material Science)
- 材料发现 (GNoME by DeepMind)
- 晶体结构预测
- 材料性质预测
科学推理 (Scientific Reasoning)
- 科学文献分析
- 假设生成
- 实验设计
气候与环境 (Climate & Environment)
- 气候建模
- 极端天气预测
- GraphCast (DeepMind)
天文学 (Astronomy)
- 天体分类
- 引力波检测
- 系外行星发现

6.8 其他前沿方向

因果 AI (Causal AI)

因果发现 (Causal Discovery)
因果推断 (Causal Inference)
反事实推理 (Counterfactual Reasoning)
干预效应估计

可微编程 (Differentiable Programming)

端到端可微分系统
可微分物理引擎

神经架构搜索 (Neural Architecture Search, NAS)

自动化模型设计
硬件感知 NAS

终身学习系统 (Lifelong Learning Systems)

持续学习
知识保留与迁移
灾难性遗忘防止

开放世界学习 (Open World Learning)

未知类别识别
动态环境适应
开放集识别

小样本大模型 (Small Language Models, 2025 趋势)

Phi-3/4 (Microsoft)
Gemma (Google)
Qwen 系列小模型
性能接近大模型但参数更少

6.9 新兴架构与可持续 AI (Emerging Architectures & Sustainable AI)

新兴架构
- SSM/Mamba-2、RetNet、RWKV：长上下文、流式推理优势
- 混合注意力-状态空间模型：结合两者优点以提升稳健性与效率
- MoE 2.0：细粒度路由、鲁棒激活裁剪，降低稀疏带宽开销
可持续 AI (Sustainable AI)
- 训练/推理能耗度量与优化 (Energy/Carbon Accounting)
- 绿色推理技术：低比特量化、蒸馏到 SLM、动态早停 (Early-Exit)
- 硬件-算法协同：低功耗加速器、内存层次优化、分页 KV Cache 降耗

附录: 关键概念关系说明

学习范式 vs 实现技术

学习范式（监督/无监督/半监督/强化学习）描述的是 ” 如何获取训练信号 ”
- 监督学习：从标注数据学习
- 无监督学习：从无标注数据学习内在结构
- 半监督学习：结合少量标注和大量无标注数据
- 强化学习：从环境反馈中学习
实现技术（传统 ML/深度学习）描述的是 ” 用什么算法实现 ”
- 传统机器学习：使用统计学习方法（如 SVM、决策树）
- 深度学习：使用深层神经网络
关系: 深度学习可以用于任何学习范式
- 监督学习 + 深度学习 = CNN 图像分类
- 无监督学习 + 深度学习 = VAE 生成模型
- 强化学习 + 深度学习 = DQN

理论 vs 应用

NLP/CV/机器人学既是研究领域（有独特的理论和方法），也是应用领域
本图谱将其放在 ” 核心应用领域 “（第 2 章），强调其作为 AI 技术落地的主要方向
这些领域都会使用第 1 章的各种机器学习方法

生成式 AI

作为技术（生成模型）：属于深度学习的一部分（1.2.2）
- 包括 GAN、VAE、扩散模型等具体技术
作为应用（生成式 AI 应用）：是当前最热门的应用方向（3.1）
- 包括文生图、文生视频、代码生成等具体应用

边缘 AI

作为工程实践（边缘部署）：在 4.5 模型部署中
- 关注如何在边缘设备上部署模型
作为前沿技术（边缘 AI）：在 6.5 中
- 关注端侧智能、TinyML 等研究方向

大语言模型 (LLM)

大语言模型是预训练语言模型发展到一定规模后的产物
GPT 系列横跨了 PLM 和 LLM 两个时代：
- GPT-1/2 (2018-2019): 预训练语言模型时代
- GPT-3/4 (2020-): 大语言模型时代的标志
区别主要在于：模型规模、涌现能力、应用方式（prompt vs fine-tune）

推理模型 (Reasoning Models, 2025 新概念)

推理模型是 LLM 的一个特殊子类,专注于复杂推理任务
特点：
- 使用强化学习训练推理能力
- 在数学、代码、科学等领域表现突出
- 推理过程可见（思维链）
代表模型：OpenAI o1/o3, DeepSeek-R1, Claude 3.7/4

AI 硬件与算法的关系

AI 的发展是 ” 算法 + 数据 + 算力 ” 三位一体
硬件进步（GPU、TPU）推动了深度学习的突破
算法创新（Transformer）也反过来推动硬件设计
两者相互促进，缺一不可

Agentic AI (2025 核心趋势)

AI Agent 不是单一技术,而是多种技术的集成系统
核心能力：
- 感知（Perception）: 理解环境和任务
- 规划（Planning）: 制定多步骤计划
- 执行（Execution）: 使用工具完成任务
- 记忆（Memory）: 保存和检索信息
- 学习（Learning）: 从经验中改进
应用层面已成为 2025 年 AI 产业最大热点

版本更新说明

v2.1 主要更新 (2025 年 11 月)

2025 年重大技术更新
- 推理模型崛起: 新增 OpenAI o1/o3, DeepSeek-R1 等推理模型
- Agentic AI 爆发: 新增 AI Agent 专门章节
- 多模态突破: Gemini 2.0, Claude 4 等原生多模态模型
- 视频生成成熟: Gen-3/4, Kling, Veo 等商业化产品
模型与工具更新
- 更新所有主流 LLM 到最新版本
- 新增 Flux, Ideogram 等图像生成工具
- 新增 SGLang, Ollama 等开发工具
- 更新 AI 芯片到 Blackwell/MI300 系列
产业应用更新
- 医疗: FDA 批准 AI 设备数量激增
- 自动驾驶: Waymo 等商业化进展
- 更新各行业 AI 应用现状
方法论创新
- 纯强化学习训练方法 (DeepSeek-R1)
- MoE 架构普及
- 数据湖仓一体趋势
治理与安全
- 欧盟 AI 法案生效
- AI 红队测试成为标准实践
- 版权纠纷案例更新
前沿技术
- 小样本大模型 (SLM) 趋势
- 人形机器人商业化
- AI4Science 重大突破
结构优化
- 新增推理模型专门分类
- 完善 AI Agent 相关内容
- 补充 2025 产业数据

图谱维护:

本知识图谱基于 2025 年 11 月最新信息编制
建议每季度审查更新,AI 领域发展迅速
重点关注: LLM 能力边界、Agent 应用落地、法规政策变化

数据来源:

学术论文与技术报告
产业动态与公司发布
权威机构报告 (Stanford AI Index, McKinsey AI Report)
开源社区与技术博客

Sean's Blog

Explorer

1D 人工智能知识库