人工智能知识库

本页是 AI 领域的工作版导航,负责把基础理论、应用方向、开发部署与治理议题串成一张可继续拆分的知识图谱。具体学习与研究笔记优先落到 机器学习具身智能世界模型Q&A/_terms/ 下。

使用入口

1. AI 基础理论与方法 (AI Fundamental Theories and Methods)

1.1 符号主义 AI (Symbolic AI)

  • 知识表示与推理 (Knowledge Representation and Reasoning)
    • 逻辑推理 (Logical Reasoning)
    • 概念表示 (Conceptual Representation)
    • 本体论 (Ontology)
    • 语义网络 (Semantic Networks)
  • 专家系统 (Expert Systems)
    • 规则推理 (Rule-based Reasoning)
    • 模糊逻辑 (Fuzzy Logic)
  • 搜索与优化 (Search and Optimization)
    • 启发式搜索 (Heuristic Search)
    • 进化算法 (Evolutionary Algorithms)
    • 遗传算法 (Genetic Algorithms)
  • 规划与决策 (Planning and Decision Making)
    • 马尔可夫决策过程 (Markov Decision Processes, MDP)

1.2 机器学习 (Machine Learning)

1.2.1 按学习范式分类 (Learning Paradigms)

监督学习 (Supervised Learning)

  • 分类 (Classification)
    • 逻辑回归 (Logistic Regression)
    • 支持向量机 (Support Vector Machines, SVM)
    • 决策树 (Decision Trees)
    • 随机森林 (Random Forest)
    • 朴素贝叶斯 (Naive Bayes)
    • K 近邻 (K-Nearest Neighbors)
  • 回归 (Regression)
    • 线性回归 (Linear Regression)
    • 岭回归 (Ridge Regression)
    • Lasso 回归

无监督学习 (Unsupervised Learning)

  • 聚类分析 (Clustering)
    • K-means
    • 层次聚类 (Hierarchical Clustering)
    • DBSCAN
  • 降维 (Dimensionality Reduction)
    • 主成分分析 (Principal Component Analysis, PCA)
    • t-SNE
    • UMAP
  • 关联规则学习 (Association Rule Learning)

半监督学习 (Semi-supervised Learning)

  • 自训练 (Self-training)
  • 协同训练 (Co-training)
  • 伪标签 (Pseudo-labeling)

强化学习 (Reinforcement Learning)

  • 价值函数方法 (Value-based Methods)
    • Q-learning
    • Deep Q-Network (DQN)
    • SARSA
  • 策略梯度方法 (Policy Gradient Methods)
    • REINFORCE
    • Actor-Critic
    • PPO (Proximal Policy Optimization)
    • A3C (Asynchronous Advantage Actor-Critic)
    • GRPO (Group Relative Policy Optimization) - DeepSeek 创新
  • 模型基础 RL (Model-based RL)
  • 多智能体强化学习 (Multi-Agent RL)

1.2.2 按实现技术分类 (Implementation Techniques)

传统机器学习 (Classical Machine Learning)

  • 集成学习 (Ensemble Learning)
    • Bagging
    • Boosting (AdaBoost, XGBoost, LightGBM)
    • Stacking
  • 核方法 (Kernel Methods)

深度学习 (Deep Learning)

  • 基础神经网络 (Basic Neural Networks)

    • 多层感知机 (Multi-Layer Perceptron, MLP)
    • 自编码器 (Autoencoders)
      • 稀疏自编码器 (Sparse AE)
      • 去噪自编码器 (Denoising AE)
    • 反向传播 (Backpropagation)
    • 激活函数 (Activation Functions)
    • 正则化技术 (Regularization: Dropout, Batch Normalization)
    • 优化算法 (Optimizers: SGD, Adam, RMSprop)
  • 卷积神经网络 (Convolutional Neural Networks, CNN)

    • 经典架构 (LeNet, AlexNet, VGG, ResNet, Inception)
    • 轻量化网络 (MobileNet, EfficientNet)
    • 注意力机制 CNN (Attention-based CNN)
  • 循环神经网络 (Recurrent Neural Networks, RNN)

    • 长短期记忆网络 (Long Short-Term Memory, LSTM)
    • 门控循环单元 (Gated Recurrent Unit, GRU)
    • 双向 RNN (Bidirectional RNN)
  • 注意力机制与 Transformer (Attention & Transformer)

    • 自注意力机制 (Self-Attention)
    • 多头注意力 (Multi-Head Attention)
    • Transformer 架构
    • 位置编码 (Positional Encoding)
  • 序列状态空间模型 (State Space Models, SSM) 与其他新架构

    • 代表方法: S4/SSD, Mamba/Mamba-2, RWKV, RetNet, Hyena
    • 特点: 计算/内存复杂度近似线性、长上下文建模更稳健、对流式与边缘端友好
    • 适用: 长序列建模、低时延推理、资源受限部署
  • 生成模型 (Generative Models)

    • 生成对抗网络 (Generative Adversarial Networks, GAN)
      • DCGAN, StyleGAN, CycleGAN, Pix2Pix
    • 变分自编码器 (Variational Autoencoders, VAE)
    • 扩散模型 (Diffusion Models)
      • DDPM, DDIM, Stable Diffusion
    • 归一化流 (Normalizing Flows)
  • 图神经网络 (Graph Neural Networks, GNN)

    • GCN, GAT, GraphSAGE
  • 混合专家模型 (Mixture of Experts, MoE)

    • 稀疏激活架构
    • 动态路由机制

1.2.3 学习策略与技术 (Learning Strategies)

  • 迁移学习 (Transfer Learning)

    • 领域自适应 (Domain Adaptation)
    • 微调 (Fine-tuning)
  • 元学习 (Meta-Learning)

    • MAML (Model-Agnostic Meta-Learning)
    • 学习如何学习 (Learning to Learn)
  • 少样本学习 (Few-Shot Learning)

    • 原型网络 (Prototypical Networks)
    • 匹配网络 (Matching Networks)
    • Siamese 网络
  • 零样本学习 (Zero-Shot Learning)

  • 自监督学习 (Self-Supervised Learning)

    • 对比学习 (Contrastive Learning: SimCLR, MoCo)
    • 掩码学习 (Masked Learning: MAE, BEiT)
  • 联邦学习 (Federated Learning)

  • 持续学习/终身学习 (Continual/Lifelong Learning)

  • 主动学习 (Active Learning)

  • 课程学习 (Curriculum Learning)

  • 长上下文与位置扩展 (Long-context & Positional Scaling)

    • RoPE/ALiBi/YaRN、Position Interpolation、NTK-aware scaling
    • 滑动窗口注意力、KV 压缩/丢弃、段内复用 (Segment-level KV Reuse)
  • 推理策略与技能学习

    • Program-of-Thought (PoT)、Graph-of-Thought (GoT)
    • 自发现/自反思 (Self-Discover / Self-Reflection)

1.2.4 其他 ML 技术

  • 概率图模型 (Probabilistic Graphical Models)
    • 贝叶斯网络 (Bayesian Networks)
    • 马尔可夫随机场 (Markov Random Fields)
    • 隐马尔可夫模型 (Hidden Markov Models)
  • 异常检测 (Anomaly Detection)
  • 因果推断 (Causal Inference)

2. AI 核心应用领域 (AI Core Application Domains)

2.1 自然语言处理 (Natural Language Processing, NLP)

2.1.1 基础技术

  • 文本表示 (Text Representation)
    • 词嵌入 (Word Embeddings: Word2Vec, GloVe, FastText)
    • 上下文嵌入 (Contextual Embeddings: ELMo)
  • 语法解析 (Syntax Parsing)
    • 词性标注 (POS Tagging)
    • 依存句法分析 (Dependency Parsing)
    • 成分句法分析 (Constituency Parsing)
  • 语义理解 (Semantic Understanding)
    • 语义角色标注 (Semantic Role Labeling)
    • 共指消解 (Coreference Resolution)

2.1.2 核心任务

  • 文本分类 (Text Classification)
    • 情感分析 (Sentiment Analysis)
    • 主题分类 (Topic Classification)
    • 意图识别 (Intent Recognition)
  • 序列标注 (Sequence Labeling)
    • 命名实体识别 (Named Entity Recognition, NER)
    • 关键词提取 (Keyword Extraction)
  • 文本生成 (Text Generation)
    • 机器翻译 (Machine Translation)
    • 文本摘要 (Text Summarization)
    • 释义生成 (Paraphrasing)
  • 信息抽取 (Information Extraction)
    • 关系抽取 (Relation Extraction)
    • 事件抽取 (Event Extraction)
    • 知识图谱构建 (Knowledge Graph Construction)
  • 问答系统 (Question Answering)
    • 阅读理解 (Reading Comprehension)
    • 知识库问答 (Knowledge Base QA)
    • 开放域问答 (Open-domain QA)
  • 对话系统 (Dialogue Systems)
    • 任务型对话 (Task-oriented Dialogue)
    • 开放域对话 (Open-domain Dialogue)
    • 检索式对话 (Retrieval-based)
    • 生成式对话 (Generative)

2.1.3 语言模型

  • 传统语言模型 (Traditional Language Models)

    • N-gram 模型
    • 神经语言模型
  • 预训练语言模型 (Pre-trained Language Models, PLM)

    • BERT (Bidirectional Encoder Representations from Transformers)
    • RoBERTa, ALBERT, ELECTRA
    • T5 (Text-to-Text Transfer Transformer)
    • BART, mBART
  • 大语言模型 (Large Language Models, LLM)

    • OpenAI 系列
      • GPT 系列 (GPT-1/2/3/3.5/4/4o/4o-mini)
      • o1 系列推理模型 (o1-preview, o1, o1-mini, o3)
      • GPT-5 (预计中)
    • Anthropic 系列
      • Claude 3 系列 (Haiku, Sonnet, Opus)
      • Claude 3.5 系列 (3.5 Sonnet, 3.5 Haiku)
      • Claude 3.7 Sonnet (首个混合推理模型)
      • Claude 4 系列 (Opus 4, Sonnet 4, Sonnet 4.5)
    • Google 系列
      • Gemini 1.0/1.5 系列
      • Gemini 2.0 (2025)
      • Gemini 2.5 系列 (Flash, Pro)
    • Meta 系列
      • LLaMA 1/2/3/3.1/3.2/3.3
    • 中国开源模型
      • DeepSeek 系列 (V2, V3, R1, R1 升级版)
      • Qwen 系列 (2.5, 3)
      • Yi 系列
    • 其他开源模型
      • Mistral 系列
      • Phi 系列 (Microsoft)
  • 多模态大模型 (Multimodal LLMs)

    • GPT-4V, GPT-4o
    • Gemini 2.0
    • Claude 3.5/4 系列
  • 推理模型 (Reasoning Models)

    • OpenAI o1/o3 系列
    • DeepSeek-R1 (开源推理模型突破)
    • Claude 3.7/4 混合推理
  • 检索增强生成 (Retrieval-Augmented Generation, RAG)

    • 核心组件: Ingestion → Chunking → Embedding → Indexing → Retrieval → Rerank → Generation
    • 关键技术: 多路检索 (Hybrid/Reciprocal Rank Fusion)、结构化检索 (Graph/SQL/知识库)、重排序 (Cross-Encoder)
    • 质量保障: Hallucination 检测、引用对齐 (Citations)、事实一致性 (Fact Consistency)
    • 工具生态: LlamaIndex、LangChain、Weaviate/FAISS/Milvus、Voyage/CoHere/Unisat 向量检索

: DeepSeek-R1 于 2025 年 1 月发布,采用纯强化学习训练,在数学、代码等推理任务上达到与 o1 相当的性能,但成本仅为其 15-50%

2.1.4 语音技术

  • 语音识别 (Automatic Speech Recognition, ASR)
    • 传统方法 (GMM-HMM)
    • 深度学习方法 (DeepSpeech, Wav2Vec, Whisper)
    • 端到端模型 (End-to-End Models)
  • 语音合成 (Speech Synthesis / Text-to-Speech, TTS)
    • 参数化合成
    • 神经网络合成 (WaveNet, Tacotron, VITS)
  • 声纹识别 (Speaker Recognition / Verification)
    • 说话人识别 (Speaker Identification)
    • 说话人验证 (Speaker Verification)
  • 语音唤醒 (Wake Word Detection / Keyword Spotting)
  • 语音情感识别 (Speech Emotion Recognition)

2.2 计算机视觉 (Computer Vision, CV)

2.2.1 基础技术

  • 图像处理 (Image Processing)
    • 滤波与增强 (Filtering and Enhancement)
    • 边缘检测 (Edge Detection)
    • 形态学操作 (Morphological Operations)
  • 特征提取 (Feature Extraction)
    • 传统特征 (SIFT, SURF, HOG, ORB)
    • 深度特征 (Deep Features)

2.2.2 核心任务

  • 图像分类 (Image Classification)
    • 单标签分类 (Single-label Classification)
    • 多标签分类 (Multi-label Classification)
  • 目标检测 (Object Detection)
    • 两阶段检测 (Two-stage: R-CNN, Fast R-CNN, Faster R-CNN)
    • 单阶段检测 (One-stage: YOLO, SSD, RetinaNet)
    • Transformer 检测 (DETR, Deformable DETR)
  • 图像分割 (Image Segmentation)
    • 语义分割 (Semantic Segmentation: FCN, U-Net, DeepLab, SegFormer)
    • 实例分割 (Instance Segmentation: Mask R-CNN)
    • 全景分割 (Panoptic Segmentation)
  • 目标追踪 (Object Tracking)
    • 单目标追踪 (Single Object Tracking)
    • 多目标追踪 (Multiple Object Tracking: SORT, DeepSORT)
  • 姿态估计 (Pose Estimation)
    • 2D/3D 人体姿态估计 (Human Pose Estimation)
    • 手势识别 (Gesture Recognition)
    • 动物姿态估计
  • 人脸技术 (Face Technology)
    • 人脸检测 (Face Detection)
    • 人脸识别 (Face Recognition)
    • 人脸验证 (Face Verification)
    • 表情识别 (Expression Recognition)
    • 人脸属性分析 (Face Attribute Analysis)
  • 场景理解 (Scene Understanding)
    • 场景分类 (Scene Classification)
    • 深度估计 (Depth Estimation: Monocular, Stereo)

2.2.3 视频分析

  • 视频分类 (Video Classification)
  • 动作识别 (Action Recognition)
    • 时序动作检测 (Temporal Action Detection)
  • 视频目标检测 (Video Object Detection)
  • 视频分割 (Video Segmentation)
  • 视频摘要 (Video Summarization)

2.2.4 其他视觉任务

  • 图像增强 (Image Enhancement)
    • 图像超分辨率 (Image Super-Resolution)
    • 图像去噪 (Image Denoising)
    • 图像修复 (Image Inpainting)
    • 低光增强 (Low-light Enhancement)
  • 图像编辑 (Image Editing)
    • 风格迁移 (Style Transfer)
    • 图像变换 (Image-to-Image Translation)
  • 光学字符识别 (Optical Character Recognition, OCR)
    • 文本检测 (Text Detection)
    • 文本识别 (Text Recognition)
  • 3D 视觉 (3D Vision)
    • 三维重建 (3D Reconstruction)
    • 点云处理 (Point Cloud Processing: PointNet)
    • NeRF (Neural Radiance Fields)
    • 3D 高斯泼溅 (3D Gaussian Splatting)
    • SLAM (Simultaneous Localization and Mapping)

2.3 多模态 AI (Multimodal AI)

  • 视觉 - 语言理解 (Vision-Language Understanding)
    • 图像描述生成 (Image Captioning)
    • 视觉问答 (Visual Question Answering, VQA)
    • 视觉推理 (Visual Reasoning)
    • 视觉常识推理 (Visual Commonsense Reasoning)
  • 跨模态检索 (Cross-modal Retrieval)
    • 图文检索 (Image-Text Retrieval)
    • 视频 - 文本检索 (Video-Text Retrieval)
  • 多模态预训练模型
    • CLIP, ALIGN, BLIP, BLIP-2
    • Flamingo, GPT-4V/4o, Gemini 2.0, Claude 4
  • 音频 - 视觉学习 (Audio-Visual Learning)

2.4 机器人学 (Robotics)

  • 感知 (Perception)
    • 传感器融合 (Sensor Fusion)
    • 环境感知 (Environmental Perception)
    • 物体识别与定位
  • 定位与建图 (Localization and Mapping)
    • SLAM (Simultaneous Localization and Mapping)
    • 视觉 SLAM (Visual SLAM: ORB-SLAM, LSD-SLAM)
    • 激光 SLAM (LiDAR SLAM)
  • 运动规划 (Motion Planning)
    • 路径规划 (Path Planning: A*, RRT)
    • 轨迹规划 (Trajectory Planning)
    • 避障 (Obstacle Avoidance)
  • 机器人控制 (Robot Control)
    • PID 控制
    • 自适应控制 (Adaptive Control)
    • 模型预测控制 (Model Predictive Control, MPC)
  • 操作与抓取 (Manipulation and Grasping)
    • 抓取规划 (Grasp Planning)
    • 灵巧操作 (Dexterous Manipulation)
  • 人机交互 (Human-Robot Interaction)
    • 手势识别
    • 语音交互
    • 协作机器人 (Collaborative Robots / Cobots)

3. AI 垂直应用场景 (AI Vertical Applications)

3.1 生成式 AI 应用 (Generative AI Applications)

  • 文本生成 (Text Generation)

    • 内容创作 (Content Creation)
    • 代码生成 (Code Generation: GitHub Copilot, Cursor, Claude Code)
    • 数据合成 (Data Synthesis)
    • 邮件/文档写作
  • 图像生成 (Image Generation)

    • 文生图 (Text-to-Image)
      • DALL-E 3 (OpenAI)
      • Midjourney
      • Stable Diffusion
      • Flux (Black Forest Labs, 2025)
      • Ideogram (2025)
    • 图像编辑 (Image Editing)
      • Inpainting, Outpainting
      • ControlNet (可控生成)
      • IP-Adapter (风格控制)
    • 图像风格化
  • 视频生成 (Video Generation)

    • 文生视频 (Text-to-Video)
      • Sora (OpenAI)
      • Runway Gen-3/Gen-4 (2025)
      • Pika
      • Kling (快手, 2025)
      • Veo (Google, 2025)
    • 图生视频 (Image-to-Video)
    • 视频编辑
  • 音频生成 (Audio Generation)

    • 音乐生成 (Music Generation)
    • 语音克隆 (Voice Cloning)
    • 音效生成
  • 3D 生成 (3D Generation)

    • 文本到 3D (Text-to-3D)
    • 图像到 3D (Image-to-3D)
    • NeRF 生成

3.2 智能驾驶 (Autonomous Driving / Intelligent Driving)

  • 感知系统 (Perception Systems)
    • 多传感器融合 (Multi-sensor Fusion: Camera, LiDAR, Radar)
    • 目标检测与追踪
    • 车道线检测 (Lane Detection)
    • 可行驶区域分割 (Drivable Area Segmentation)
  • 预测 (Prediction)
    • 轨迹预测 (Trajectory Prediction)
    • 行为预测 (Behavior Prediction)
  • 决策规划 (Decision Making and Planning)
    • 路径规划 (Path Planning)
    • 行为决策 (Behavior Planning)
  • 控制系统 (Control Systems)
    • 横向控制 (Lateral Control)
    • 纵向控制 (Longitudinal Control)
  • 高精地图 (HD Mapping)
  • V2X 通信 (Vehicle-to-Everything)
  • 仿真测试 (Simulation and Testing)
  • 商业化进展 (2025)
    • Waymo: 每周 15 万次自动驾驶出行
    • 百度 Apollo Go: 中国多城市运营
    • 全球 16 个中国城市、奥斯陆、日内瓦等地开展测试

3.3 推荐系统 (Recommendation Systems)

  • 协同过滤 (Collaborative Filtering)
    • 基于用户 (User-based)
    • 基于物品 (Item-based)
    • 矩阵分解 (Matrix Factorization)
  • 内容推荐 (Content-based Filtering)
  • 混合推荐 (Hybrid Recommendation)
  • 深度学习推荐 (Deep Learning for Recommendation)
    • Wide & Deep, DeepFM, DIN
    • 序列推荐 (Sequential Recommendation)
  • 实时推荐 (Real-time Recommendation)
  • 冷启动问题 (Cold Start Problem)

3.4 行业应用

医疗健康 (Healthcare)

  • 医学影像分析 (Medical Image Analysis)
    • CT/MRI/X 光分析
    • 病灶检测与分割
  • 疾病诊断与辅助诊断 (Disease Diagnosis)
  • 药物发现 (Drug Discovery)
  • 基因组学 (Genomics)
  • 个性化医疗 (Personalized Medicine)
  • 医疗问答与咨询
  • 2025 进展: FDA 批准 223 个 AI 医疗设备 (2023 年仅 6 个)

金融 (Finance)

  • 风险评估 (Risk Assessment)
  • 欺诈检测 (Fraud Detection)
  • 算法交易 (Algorithmic Trading)
  • 信用评分 (Credit Scoring)
  • 智能投顾 (Robo-Advisory)
  • 反洗钱 (Anti-Money Laundering, AML)
  • 结构化产品分析

教育 (Education)

  • 自适应学习 (Adaptive Learning)
  • 智能辅导 (Intelligent Tutoring Systems)
  • 自动评分 (Automated Grading)
  • 学习分析 (Learning Analytics)
  • 个性化学习路径

环境科学 (Environmental Science)

  • 气候预测 (Climate Prediction)
  • 能源优化 (Energy Optimization)
  • 生态监测 (Ecological Monitoring)
  • 污染检测 (Pollution Detection)

制造业 (Manufacturing)

  • 质量检测 (Quality Inspection)
  • 预测性维护 (Predictive Maintenance)
  • 供应链优化 (Supply Chain Optimization)
  • 工业机器人 (Industrial Robots)

零售 (Retail)

  • 需求预测 (Demand Forecasting)
  • 价格优化 (Price Optimization)
  • 客户分析 (Customer Analytics)
  • 智能客服 (Intelligent Customer Service)

艺术创作 (Art Creation)

  • AI 绘画 (AI Painting)
  • AI 音乐创作 (AI Music Composition)
  • AI 写作 (AI Writing)
  • 创意设计辅助

安防 (Public Safety / Security)

  • 视频监控 (Video Surveillance)
  • 异常行为检测 (Abnormal Behavior Detection)
  • 人脸识别门禁 (Face Recognition Access Control)
  • 人群分析 (Crowd Analysis)

法律 (Legal Tech)

  • 合同审查 (Contract Review)
  • 法律检索 (Legal Research)
  • 案例分析 (Case Analysis)
  • 法律文书生成
  • 诉讼记录分析

农业 (Agriculture)

  • 精准农业 (Precision Agriculture)
  • 病虫害检测 (Pest and Disease Detection)
  • 作物产量预测 (Crop Yield Prediction)
  • 智能灌溉 (Smart Irrigation)
  • 农业机器人 (Agricultural Robots)

物流 (Logistics)

  • 路线优化 (Route Optimization)
  • 仓储自动化 (Warehouse Automation)
  • 需求预测 (Demand Forecasting)
  • 包裹分拣 (Package Sorting)
  • 配送机器人 (Delivery Robots)

4. AI 工程与开发 (AI Engineering and Development)

4.1 数据工程 (Data Engineering)

  • 数据收集 (Data Collection)
    • 网络爬虫 (Web Scraping)
    • 数据采集系统
    • API 数据接入
  • 数据清洗 (Data Cleaning)
    • 缺失值处理
    • 异常值检测
    • 数据去重
  • 数据标注 (Data Annotation)
    • 标注工具 (Labelbox, Scale AI)
    • 众包标注
    • 半自动标注
  • 数据增强 (Data Augmentation)
    • 图像增强 (Crop, Flip, Color Jitter)
    • 文本增强 (Back-translation, Synonym Replacement)
    • 合成数据生成
  • 数据版本管理 (Data Versioning)
    • DVC (Data Version Control)
    • 数据血缘追踪
  • 数据湖仓一体 (Data Lakehouse, 2025 趋势)
    • 统一数据平台
    • 结合数据湖和数据仓库优势

4.2 模型开发 (Model Development)

  • 模型训练 (Model Training)

    • 超参数调优 (Hyperparameter Tuning)
      • 网格搜索 (Grid Search)
      • 随机搜索 (Random Search)
      • 贝叶斯优化 (Bayesian Optimization)
    • 分布式训练 (Distributed Training)
      • 数据并行 (Data Parallelism)
      • 模型并行 (Model Parallelism)
      • 流水线并行 (Pipeline Parallelism)
      • 张量并行 (Tensor Parallelism)
    • 混合精度训练 (Mixed Precision Training)
    • 梯度累积 (Gradient Accumulation)
  • 大模型调优 (Large Model Fine-tuning)

    • 全参数微调 (Full Fine-tuning)
    • 参数高效微调 (Parameter-Efficient Fine-tuning, PEFT)
      • LoRA (Low-Rank Adaptation)
      • QLoRA (Quantized LoRA)
      • Adapter, Prefix Tuning, P-tuning
    • 指令微调 (Instruction Tuning)
    • RLHF (Reinforcement Learning from Human Feedback)
    • DPO (Direct Preference Optimization)
    • 提示工程 (Prompt Engineering)
      • Few-shot Prompting
      • Chain-of-Thought (CoT)
      • ReAct, Tree-of-Thought
      • Self-Consistency
    • 2025 新趋势: 纯强化学习训练 (Pure RL Training)
      • DeepSeek-R1 方法: 无需人类标注的推理训练
    • 新偏好优化方法: IPO、KTO、RPO、ORPO (稳定性与效率提升)
    • 结构化输出: JSON Mode、函数调用模板、约束语法 (Grammar-based Decoding)
    • Guardrails: PII 过滤、越权指令拒绝、政策合规过滤

4.3 模型优化 (Model Optimization)

  • 模型压缩 (Model Compression)
    • 知识蒸馏 (Knowledge Distillation)
    • 模型剪枝 (Model Pruning)
      • 结构化剪枝 (Structured Pruning)
      • 非结构化剪枝 (Unstructured Pruning)
    • 量化 (Quantization)
      • 训练后量化 (Post-Training Quantization, PTQ)
      • 量化感知训练 (Quantization-Aware Training, QAT)
      • INT8/INT4/INT2 量化
      • FP8 量化 (NVIDIA 新标准)
    • 低秩分解 (Low-rank Factorization)
    • 组量化 (Group-wise Quantization)
    • 矩阵重排 (Permutation-aware Quantization)
    • SmoothQuant / AWQ / GPTQ / AQLM / QuIP
    • 蒸馏到小语言模型 (SLM Distillation)

4.4 模型评估与测试 (Model Evaluation and Testing)

  • 性能评估 (Performance Evaluation)
    • 分类指标 (Accuracy, Precision, Recall, F1)
    • 回归指标 (MSE, RMSE, MAE, R²)
    • 排序指标 (AUC-ROC, mAP)
    • NLP 指标 (BLEU, ROUGE, METEOR, BERTScore)
    • CV 指标 (IoU, Dice, mIoU)
  • 鲁棒性测试 (Robustness Testing)
    • 对抗样本测试 (Adversarial Testing)
    • 数据分布偏移测试
  • A/B 测试 (A/B Testing)
  • 模型基准测试 (Benchmarking)
    • MMLU, HumanEval, GSM8K
    • GPQA, AIME (数学推理)
    • Arena (Chatbot Arena, 实时对战排名)
  • RAG 专用评估 (RAG Evaluation)
    • 检索召回率 (Retrieval Recall)
    • 答案真实性 (Factuality)
    • 引用覆盖率 (Citation Coverage)
    • 参考一致性 (Grounding Consistency)
  • Agent 评估
    • 任务完成率 (Task Success Rate)
    • 工具调用正确率 (Tool Use Accuracy)
    • 步骤最优性 (Plan Optimality)

4.5 模型部署与推理 (Model Deployment & Inference)

  • 模型服务化 (Model Serving)
    • REST API, gRPC
    • 批处理推理 (Batch Inference)
    • 实时推理 (Real-time Inference)
    • 流式推理 (Streaming Inference)
  • 云端部署 (Cloud Deployment)
    • AWS SageMaker, Azure ML, Google Vertex AI
    • 阿里云 PAI, 腾讯云 TI
    • Kubernetes 部署
  • 边缘部署 (Edge Deployment)
    • 移动端部署 (Mobile: TensorFlow Lite, Core ML, ONNX)
    • IoT 设备部署
    • 嵌入式系统
    • 相关前沿技术参见 6.5 边缘 AI
  • 模型加速 (Model Acceleration)
    • 推理引擎 (TensorRT, ONNX Runtime, OpenVINO)
    • GPU/TPU 优化
    • 算子融合 (Operator Fusion)
    • KV Cache 优化
    • 投机采样 (Speculative Decoding)
    • FlashAttention / FlashDecoding
    • 多次候选头 (Medusa Heads) 并行扩展
    • Batch Prefill / Continuous Batching
    • 分层缓存 (Paged KV Cache / Unified Memory)
    • 混合解码策略: Top-k/Top-p + Contrastive Decoding + Semantic Guidance

4.6 MLOps / AI DevOps

  • CI/CD for ML
    • 自动化训练流水线
    • 自动化测试
    • 自动化部署
  • 模型监控 (Model Monitoring)
    • 性能监控 (Performance Monitoring)
    • 数据漂移检测 (Data Drift Detection)
    • 模型漂移检测 (Model Drift Detection)
    • 在线学习 (Online Learning)
  • 模型版本管理 (Model Versioning)
    • 模型注册表 (Model Registry)
  • 实验追踪 (Experiment Tracking)
    • MLflow, Weights & Biases, Neptune
  • 特征工程平台 (Feature Store)
    • Feast, Tecton
  • LLMOps 专项 (Observability for LLMs)
    • 日志与遥测: 请求/提示/响应链路追踪
    • 指标: 延迟、令牌吞吐、拒答率、越狱命中率、幻觉率
    • 评测平台: Promptfoo, Phoenix, Giskard, DeepEval
    • 在线 Guardrails: 安全策略、提示注入防御、输出约束、PII 屏蔽
  • RAGOps
    • 数据摄取与再切片 (re-chunking)
    • 嵌入/索引版本管理
    • 在线检索质量监控与热修复 (热更新索引、召回/重排策略切换)

4.7 AI 基础设施 (AI Infrastructure)

  • AI 芯片 (AI Chips)

    • GPU (Graphics Processing Unit)
      • NVIDIA (CUDA, Tensor Cores)
        • Hopper 架构: H100, H200
        • Blackwell 架构: B100, B200, GB200 (2025)
      • AMD (ROCm, MI300, MI350 系列)
    • TPU (Tensor Processing Unit)
      • Google TPU v5/v6 (2025)
    • NPU (Neural Processing Unit)
      • 移动端 AI 芯片 (Apple Neural Engine, Qualcomm AI Engine)
    • 其他 AI 加速器
      • ASIC (Application-Specific Integrated Circuit)
      • FPGA (Field-Programmable Gate Array)
      • 华为昇腾 (Ascend 910C)
      • 寒武纪 (Cambricon)
      • Groq LPU (Language Processing Unit, 2025)
  • 计算平台 (Compute Platforms)

    • 云计算 (Cloud Computing)
      • AWS (Amazon Web Services)
      • Microsoft Azure
      • Google Cloud Platform (GCP)
      • 阿里云, 腾讯云, 华为云
    • 高性能计算 (High-Performance Computing, HPC)
      • 超算集群
      • GPU 集群
      • 液冷技术 (2025 趋势)
  • AI 框架底层技术 (Framework Internals)

    • 计算图 (Computation Graph)
    • 自动微分 (Automatic Differentiation)
    • CUDA / cuDNN
    • OpenCL
    • Triton (NVIDIA)
    • XLA (Accelerated Linear Algebra)

4.8 开发框架与工具 (Development Frameworks and Tools)

  • 深度学习框架 (Deep Learning Frameworks)

    • TensorFlow / Keras
    • PyTorch / PyTorch Lightning
    • JAX / Flax
    • MXNet
    • PaddlePaddle
  • 大模型工具 (LLM Tools)

    • 开发框架
      • Hugging Face Transformers
      • LangChain / LangGraph (2025 升级)
      • LlamaIndex
    • 推理引擎
      • vLLM (高速推理)
      • SGLang (结构化生成语言, 2025)
      • TGI (Text Generation Inference)
    • 训练工具
      • DeepSpeed (分布式训练)
      • Megatron-LM
      • Axolotl
    • 本地部署
      • Ollama
      • LM Studio
  • AutoML 工具

    • AutoKeras, Auto-sklearn
    • H2O.ai, Google AutoML
    • Ray Tune, Optuna
  • 可视化工具 (Visualization Tools)

    • TensorBoard
    • Weights & Biases (W&B)
    • MLflow
    • Netron (模型可视化)

5. AI 安全、伦理与治理 (AI Safety, Ethics and Governance)

5.1 AI 安全 (AI Safety)

  • 对抗攻击与防御 (Adversarial Attacks and Defense)

    • 对抗样本 (Adversarial Examples: FGSM, PGD, C&W)
    • 对抗训练 (Adversarial Training)
    • 模型鲁棒性 (Model Robustness)
    • 认证鲁棒性 (Certified Robustness)
  • 模型安全 (Model Security)

    • 模型窃取 (Model Stealing / Extraction)
    • 后门攻击 (Backdoor Attacks / Trojan Attacks)
    • 成员推断攻击 (Membership Inference Attack)
    • 模型逆向 (Model Inversion)
  • 内容安全 (Content Safety)

    • 有害内容检测 (Harmful Content Detection)
    • 内容审核 (Content Moderation)
    • 毒性检测 (Toxicity Detection)
    • NSFW 检测
    • 虚假信息检测 (Misinformation Detection)
    • 越狱检测 (Jailbreak Detection)
  • 提示注入防御 (Prompt Injection Defense)

    • 越狱攻击防御 (Jailbreak Defense)
    • 系统提示泄露防护
    • 模型供应链安全 (Model Supply Chain Security): 权重篡改、模型来源可信度、SBOM
  • AI 红队测试 (AI Red Teaming, 2025 趋势)

    • 对抗性测试
    • 安全漏洞发现

5.2 隐私保护 (Privacy Protection)

  • 差分隐私 (Differential Privacy)

    • ε- 差分隐私
    • 本地差分隐私 (Local DP)
  • 联邦学习 (Federated Learning)

    • 横向联邦学习
    • 纵向联邦学习
  • 同态加密 (Homomorphic Encryption)

  • 安全多方计算 (Secure Multi-party Computation, MPC)

  • 数据脱敏 (Data Anonymization / De-identification)

    • K- 匿名性
    • L- 多样性

5.3 可解释性与可信赖 AI (Explainability & Trustworthy AI)

  • 可解释 AI (Explainable AI, XAI)

    • 特征重要性 (Feature Importance)
      • SHAP (SHapley Additive exPlanations)
      • LIME (Local Interpretable Model-agnostic Explanations)
      • 积分梯度 (Integrated Gradients)
    • 注意力可视化 (Attention Visualization)
    • 显著图 (Saliency Maps)
    • 概念激活向量 (CAV)
  • 可解释模型 (Interpretable Models)

    • 决策树、线性模型
    • GAM (Generalized Additive Models)
  • 决策解释 (Decision Explanation)

  • 模型透明度 (Model Transparency)

5.4 公平性 (Fairness)

  • 偏见检测 (Bias Detection)

    • 数据偏见 (Data Bias)
    • 算法偏见 (Algorithmic Bias)
  • 公平性度量 (Fairness Metrics)

    • 人口统计公平 (Demographic Parity)
    • 机会均等 (Equalized Odds)
    • 个体公平性 (Individual Fairness)
  • 去偏见技术 (Debiasing Techniques)

    • 预处理去偏见
    • 训练中去偏见
    • 后处理去偏见

5.5 AI 伦理 (AI Ethics)

  • 负责任的 AI (Responsible AI)

    • AI 伦理准则
    • 人类价值观对齐
  • AI 对齐 (AI Alignment)

    • 价值对齐 (Value Alignment)
    • 目标对齐 (Goal Alignment)
    • Constitutional AI (Anthropic 提出)
  • AI 偏见与歧视 (AI Bias and Discrimination)

  • AI 透明度与问责 (AI Transparency and Accountability)

5.6 AI 治理 (AI Governance)

  • AI 法规与标准 (AI Regulations and Standards)

    • 欧盟 AI 法案 (EU AI Act, 2024 生效)
    • 美国 AI 行政令
    • 中国生成式 AI 管理办法
    • 行业标准 (ISO/IEC, IEEE)
  • AI 审计 (AI Auditing)

    • 算法审计
    • 合规性审计
    • 第三方评估
  • 知识产权与版权 (Intellectual Property & Copyright)

    • AI 生成内容的版权归属
    • 训练数据的版权问题
    • 开源许可
    • 《纽约时报》诉 OpenAI 案等法律纠纷
  • 数据主权 (Data Sovereignty)

    • 跨境数据流动
    • GDPR, CCPA 等法规遵从
    • 数据本地化要求

6. 前沿与新兴技术 (Frontier and Emerging Technologies)

6.1 人工通用智能 (Artificial General Intelligence, AGI)

  • 智能涌现 (Emergent Abilities)

    • 规模定律 (Scaling Laws)
    • 涌现现象研究
    • 能力跃迁研究
  • 推理能力 (Reasoning Capabilities)

    • 思维链 (Chain-of-Thought, CoT)
    • 树形思维 (Tree-of-Thought)
    • 自我反思 (Self-Reflection)
    • 长链推理 (Long-Chain Reasoning)
    • 数学推理 (Mathematical Reasoning)
    • 代码推理 (Code Reasoning)
    • 2025 突破: OpenAI o1/o3, DeepSeek-R1 推理模型
  • 工具使用 (Tool Use)

    • 函数调用 (Function Calling)
    • API 调用
    • 工具学习 (Tool Learning)
    • 多工具协作
  • 世界模型 (World Models)

    • 环境建模与预测
    • 物理常识理解
    • 因果推理与模拟
    • 视频世界模型 (Video World Models)
  • AI Agent (2025 热点)

    • 自主规划 (Autonomous Planning)
      • 任务分解
      • 多步骤规划
    • 记忆系统 (Memory Systems)
      • 短期记忆
      • 长期记忆
      • 情景记忆
    • 多 Agent 协作 (Multi-Agent Collaboration)
      • Agent 通信协议
      • 分工协作
      • 集体智能
    • 应用场景
      • 代码开发 Agent (Devin, Cursor Agent)
      • 研究助手 Agent
      • 业务流程自动化 Agent

6.2 具身智能 (Embodied AI)

  • 机器人学习 (Robot Learning)

    • 模仿学习 (Imitation Learning)
    • 强化学习用于机器人
    • 端到端学习
  • 视觉 - 运动控制 (Vision-Motor Control)

    • 视觉伺服控制
    • 手眼协调
  • 具身问答 (Embodied Question Answering)

  • 物理世界交互 (Physical World Interaction)

    • 物体操控
    • 环境探索
  • 人形机器人 (Humanoid Robots, 2025 趋势)

    • Tesla Optimus Gen 2
    • Figure 01/02
    • 小米 CyberOne

6.3 神经符号 AI (Neuro-Symbolic AI)

  • 知识图谱与神经网络融合

    • 知识增强的神经网络
    • 神经定理证明 (Neural Theorem Proving)
  • 可解释推理 (Explainable Reasoning)

  • 混合推理系统 (Hybrid Reasoning Systems)

    • 符号推理 + 神经网络
    • 规则引导的学习

6.4 量子机器学习 (Quantum Machine Learning)

  • 量子神经网络 (Quantum Neural Networks, QNN)

  • 量子优化算法 (Quantum Optimization)

    • QAOA, VQE
  • 量子核方法 (Quantum Kernel Methods)

  • 量子数据编码 (Quantum Data Encoding)

  • 商业化进展 (2025)

    • IBM Quantum, Google Quantum AI
    • 中国祖冲之号、九章系列

6.5 边缘 AI (Edge AI)

  • 端侧智能 (On-device Intelligence)

    • 端侧推理优化
    • 移动端模型设计
    • 低功耗设计
  • TinyML

    • 微控制器上的机器学习
    • 极低功耗 AI (<1mW)
    • 传感器融合
  • 边缘 - 云协同 (Edge-Cloud Collaboration)

    • 边缘计算 + 云计算
    • 任务卸载 (Task Offloading)
  • 模型分割 (Model Partitioning)

    • 层级分割
    • 计算分配
  • 联邦边缘学习 (Federated Edge Learning)

: 边缘 AI 作为前沿研究方向,其工程实践部分参见 4.5 边缘部署

6.6 脑机接口与 AI (Brain-Computer Interface & AI)

  • 神经信号处理 (Neural Signal Processing)

    • EEG, fMRI 信号分析
    • 神经解码
  • 认知增强 (Cognitive Enhancement)

  • 神经形态计算 (Neuromorphic Computing)

    • 脉冲神经网络 (Spiking Neural Networks, SNN)
    • 类脑芯片 (Neuromorphic Chips: IBM TrueNorth, Intel Loihi)
  • 脑机交互 (Brain-Machine Interaction)

    • Neuralink (Elon Musk)
    • 运动控制应用
    • 感觉反馈

6.7 AI for Science (AI4Science)

  • 蛋白质与生物学 (Protein & Biology)

    • 蛋白质结构预测 (AlphaFold 2/3, ESMFold)
    • 蛋白质设计 (RFdiffusion)
    • RNA 结构预测
  • 药物设计 (Drug Design)

    • 分子生成
    • 分子性质预测
    • 靶点发现
    • 临床试验优化
  • 材料科学 (Material Science)

    • 材料发现 (GNoME by DeepMind)
    • 晶体结构预测
    • 材料性质预测
  • 科学推理 (Scientific Reasoning)

    • 科学文献分析
    • 假设生成
    • 实验设计
  • 气候与环境 (Climate & Environment)

    • 气候建模
    • 极端天气预测
    • GraphCast (DeepMind)
  • 天文学 (Astronomy)

    • 天体分类
    • 引力波检测
    • 系外行星发现

6.8 其他前沿方向

因果 AI (Causal AI)

  • 因果发现 (Causal Discovery)
  • 因果推断 (Causal Inference)
  • 反事实推理 (Counterfactual Reasoning)
  • 干预效应估计

可微编程 (Differentiable Programming)

  • 端到端可微分系统
  • 可微分物理引擎

神经架构搜索 (Neural Architecture Search, NAS)

  • 自动化模型设计
  • 硬件感知 NAS

终身学习系统 (Lifelong Learning Systems)

  • 持续学习
  • 知识保留与迁移
  • 灾难性遗忘防止

开放世界学习 (Open World Learning)

  • 未知类别识别
  • 动态环境适应
  • 开放集识别

小样本大模型 (Small Language Models, 2025 趋势)

  • Phi-3/4 (Microsoft)
  • Gemma (Google)
  • Qwen 系列小模型
  • 性能接近大模型但参数更少

6.9 新兴架构与可持续 AI (Emerging Architectures & Sustainable AI)

  • 新兴架构

    • SSM/Mamba-2、RetNet、RWKV:长上下文、流式推理优势
    • 混合注意力-状态空间模型:结合两者优点以提升稳健性与效率
    • MoE 2.0:细粒度路由、鲁棒激活裁剪,降低稀疏带宽开销
  • 可持续 AI (Sustainable AI)

    • 训练/推理能耗度量与优化 (Energy/Carbon Accounting)
    • 绿色推理技术:低比特量化、蒸馏到 SLM、动态早停 (Early-Exit)
    • 硬件-算法协同:低功耗加速器、内存层次优化、分页 KV Cache 降耗

附录: 关键概念关系说明

学习范式 vs 实现技术

  • 学习范式(监督/无监督/半监督/强化学习)描述的是 ” 如何获取训练信号 ”

    • 监督学习:从标注数据学习
    • 无监督学习:从无标注数据学习内在结构
    • 半监督学习:结合少量标注和大量无标注数据
    • 强化学习:从环境反馈中学习
  • 实现技术(传统 ML/深度学习)描述的是 ” 用什么算法实现 ”

    • 传统机器学习:使用统计学习方法(如 SVM、决策树)
    • 深度学习:使用深层神经网络
  • 关系: 深度学习可以用于任何学习范式

    • 监督学习 + 深度学习 = CNN 图像分类
    • 无监督学习 + 深度学习 = VAE 生成模型
    • 强化学习 + 深度学习 = DQN

理论 vs 应用

  • NLP/CV/机器人学既是研究领域(有独特的理论和方法),也是应用领域
  • 本图谱将其放在 ” 核心应用领域 “(第 2 章),强调其作为 AI 技术落地的主要方向
  • 这些领域都会使用第 1 章的各种机器学习方法

生成式 AI

  • 作为技术(生成模型):属于深度学习的一部分(1.2.2)
    • 包括 GAN、VAE、扩散模型等具体技术
  • 作为应用(生成式 AI 应用):是当前最热门的应用方向(3.1)
    • 包括文生图、文生视频、代码生成等具体应用

边缘 AI

  • 作为工程实践(边缘部署):在 4.5 模型部署中
    • 关注如何在边缘设备上部署模型
  • 作为前沿技术(边缘 AI):在 6.5 中
    • 关注端侧智能、TinyML 等研究方向

大语言模型 (LLM)

  • 大语言模型是预训练语言模型发展到一定规模后的产物
  • GPT 系列横跨了 PLM 和 LLM 两个时代:
    • GPT-1/2 (2018-2019): 预训练语言模型时代
    • GPT-3/4 (2020-): 大语言模型时代的标志
  • 区别主要在于:模型规模、涌现能力、应用方式(prompt vs fine-tune)

推理模型 (Reasoning Models, 2025 新概念)

  • 推理模型是 LLM 的一个特殊子类,专注于复杂推理任务
  • 特点:
    • 使用强化学习训练推理能力
    • 在数学、代码、科学等领域表现突出
    • 推理过程可见(思维链)
  • 代表模型:OpenAI o1/o3, DeepSeek-R1, Claude 3.7/4

AI 硬件与算法的关系

  • AI 的发展是 ” 算法 + 数据 + 算力 ” 三位一体
  • 硬件进步(GPU、TPU)推动了深度学习的突破
  • 算法创新(Transformer)也反过来推动硬件设计
  • 两者相互促进,缺一不可

Agentic AI (2025 核心趋势)

  • AI Agent 不是单一技术,而是多种技术的集成系统
  • 核心能力:
    • 感知(Perception): 理解环境和任务
    • 规划(Planning): 制定多步骤计划
    • 执行(Execution): 使用工具完成任务
    • 记忆(Memory): 保存和检索信息
    • 学习(Learning): 从经验中改进
  • 应用层面已成为 2025 年 AI 产业最大热点

版本更新说明

v2.1 主要更新 (2025 年 11 月)

  1. 2025 年重大技术更新

    • 推理模型崛起: 新增 OpenAI o1/o3, DeepSeek-R1 等推理模型
    • Agentic AI 爆发: 新增 AI Agent 专门章节
    • 多模态突破: Gemini 2.0, Claude 4 等原生多模态模型
    • 视频生成成熟: Gen-3/4, Kling, Veo 等商业化产品
  2. 模型与工具更新

    • 更新所有主流 LLM 到最新版本
    • 新增 Flux, Ideogram 等图像生成工具
    • 新增 SGLang, Ollama 等开发工具
    • 更新 AI 芯片到 Blackwell/MI300 系列
  3. 产业应用更新

    • 医疗: FDA 批准 AI 设备数量激增
    • 自动驾驶: Waymo 等商业化进展
    • 更新各行业 AI 应用现状
  4. 方法论创新

    • 纯强化学习训练方法 (DeepSeek-R1)
    • MoE 架构普及
    • 数据湖仓一体趋势
  5. 治理与安全

    • 欧盟 AI 法案生效
    • AI 红队测试成为标准实践
    • 版权纠纷案例更新
  6. 前沿技术

    • 小样本大模型 (SLM) 趋势
    • 人形机器人商业化
    • AI4Science 重大突破
  7. 结构优化

    • 新增推理模型专门分类
    • 完善 AI Agent 相关内容
    • 补充 2025 产业数据

图谱维护:

  • 本知识图谱基于 2025 年 11 月最新信息编制
  • 建议每季度审查更新,AI 领域发展迅速
  • 重点关注: LLM 能力边界、Agent 应用落地、法规政策变化

数据来源:

  • 学术论文与技术报告
  • 产业动态与公司发布
  • 权威机构报告 (Stanford AI Index, McKinsey AI Report)
  • 开源社区与技术博客