人工智能知识库
本页是 AI 领域的工作版导航,负责把基础理论、应用方向、开发部署与治理议题串成一张可继续拆分的知识图谱。具体学习与研究笔记优先落到 机器学习、具身智能、世界模型、Q&A/ 和 _terms/ 下。
使用入口
- 基础学习:机器学习、深度学习、Transformer、强化学习。
- 机器人与物理世界:具身智能、VLA 动作解码:自回归 vs 扩散、世界模型。
- 概念卡片:预训练、后训练、RLHF、DPO 等术语放在
_terms/,用于跨笔记复用。 - 问题沉淀:复杂解释型内容优先放入
Q&A/,避免把长推理堆在索引页。
1. AI 基础理论与方法 (AI Fundamental Theories and Methods)
1.1 符号主义 AI (Symbolic AI)
- 知识表示与推理 (Knowledge Representation and Reasoning)
- 逻辑推理 (Logical Reasoning)
- 概念表示 (Conceptual Representation)
- 本体论 (Ontology)
- 语义网络 (Semantic Networks)
- 专家系统 (Expert Systems)
- 规则推理 (Rule-based Reasoning)
- 模糊逻辑 (Fuzzy Logic)
- 搜索与优化 (Search and Optimization)
- 启发式搜索 (Heuristic Search)
- 进化算法 (Evolutionary Algorithms)
- 遗传算法 (Genetic Algorithms)
- 规划与决策 (Planning and Decision Making)
- 马尔可夫决策过程 (Markov Decision Processes, MDP)
1.2 机器学习 (Machine Learning)
1.2.1 按学习范式分类 (Learning Paradigms)
监督学习 (Supervised Learning)
- 分类 (Classification)
- 逻辑回归 (Logistic Regression)
- 支持向量机 (Support Vector Machines, SVM)
- 决策树 (Decision Trees)
- 随机森林 (Random Forest)
- 朴素贝叶斯 (Naive Bayes)
- K 近邻 (K-Nearest Neighbors)
- 回归 (Regression)
- 线性回归 (Linear Regression)
- 岭回归 (Ridge Regression)
- Lasso 回归
无监督学习 (Unsupervised Learning)
- 聚类分析 (Clustering)
- K-means
- 层次聚类 (Hierarchical Clustering)
- DBSCAN
- 降维 (Dimensionality Reduction)
- 主成分分析 (Principal Component Analysis, PCA)
- t-SNE
- UMAP
- 关联规则学习 (Association Rule Learning)
半监督学习 (Semi-supervised Learning)
- 自训练 (Self-training)
- 协同训练 (Co-training)
- 伪标签 (Pseudo-labeling)
强化学习 (Reinforcement Learning)
- 价值函数方法 (Value-based Methods)
- Q-learning
- Deep Q-Network (DQN)
- SARSA
- 策略梯度方法 (Policy Gradient Methods)
- REINFORCE
- Actor-Critic
- PPO (Proximal Policy Optimization)
- A3C (Asynchronous Advantage Actor-Critic)
- GRPO (Group Relative Policy Optimization) - DeepSeek 创新
- 模型基础 RL (Model-based RL)
- 多智能体强化学习 (Multi-Agent RL)
1.2.2 按实现技术分类 (Implementation Techniques)
传统机器学习 (Classical Machine Learning)
- 集成学习 (Ensemble Learning)
- Bagging
- Boosting (AdaBoost, XGBoost, LightGBM)
- Stacking
- 核方法 (Kernel Methods)
深度学习 (Deep Learning)
-
基础神经网络 (Basic Neural Networks)
- 多层感知机 (Multi-Layer Perceptron, MLP)
- 自编码器 (Autoencoders)
- 稀疏自编码器 (Sparse AE)
- 去噪自编码器 (Denoising AE)
- 反向传播 (Backpropagation)
- 激活函数 (Activation Functions)
- 正则化技术 (Regularization: Dropout, Batch Normalization)
- 优化算法 (Optimizers: SGD, Adam, RMSprop)
-
卷积神经网络 (Convolutional Neural Networks, CNN)
- 经典架构 (LeNet, AlexNet, VGG, ResNet, Inception)
- 轻量化网络 (MobileNet, EfficientNet)
- 注意力机制 CNN (Attention-based CNN)
-
循环神经网络 (Recurrent Neural Networks, RNN)
- 长短期记忆网络 (Long Short-Term Memory, LSTM)
- 门控循环单元 (Gated Recurrent Unit, GRU)
- 双向 RNN (Bidirectional RNN)
-
注意力机制与 Transformer (Attention & Transformer)
- 自注意力机制 (Self-Attention)
- 多头注意力 (Multi-Head Attention)
- Transformer 架构
- 位置编码 (Positional Encoding)
-
序列状态空间模型 (State Space Models, SSM) 与其他新架构
- 代表方法: S4/SSD, Mamba/Mamba-2, RWKV, RetNet, Hyena
- 特点: 计算/内存复杂度近似线性、长上下文建模更稳健、对流式与边缘端友好
- 适用: 长序列建模、低时延推理、资源受限部署
-
生成模型 (Generative Models)
- 生成对抗网络 (Generative Adversarial Networks, GAN)
- DCGAN, StyleGAN, CycleGAN, Pix2Pix
- 变分自编码器 (Variational Autoencoders, VAE)
- 扩散模型 (Diffusion Models)
- DDPM, DDIM, Stable Diffusion
- 归一化流 (Normalizing Flows)
- 生成对抗网络 (Generative Adversarial Networks, GAN)
-
图神经网络 (Graph Neural Networks, GNN)
- GCN, GAT, GraphSAGE
-
混合专家模型 (Mixture of Experts, MoE)
- 稀疏激活架构
- 动态路由机制
1.2.3 学习策略与技术 (Learning Strategies)
-
迁移学习 (Transfer Learning)
- 领域自适应 (Domain Adaptation)
- 微调 (Fine-tuning)
-
元学习 (Meta-Learning)
- MAML (Model-Agnostic Meta-Learning)
- 学习如何学习 (Learning to Learn)
-
少样本学习 (Few-Shot Learning)
- 原型网络 (Prototypical Networks)
- 匹配网络 (Matching Networks)
- Siamese 网络
-
零样本学习 (Zero-Shot Learning)
-
自监督学习 (Self-Supervised Learning)
- 对比学习 (Contrastive Learning: SimCLR, MoCo)
- 掩码学习 (Masked Learning: MAE, BEiT)
-
联邦学习 (Federated Learning)
-
持续学习/终身学习 (Continual/Lifelong Learning)
-
主动学习 (Active Learning)
-
课程学习 (Curriculum Learning)
-
长上下文与位置扩展 (Long-context & Positional Scaling)
- RoPE/ALiBi/YaRN、Position Interpolation、NTK-aware scaling
- 滑动窗口注意力、KV 压缩/丢弃、段内复用 (Segment-level KV Reuse)
-
推理策略与技能学习
- Program-of-Thought (PoT)、Graph-of-Thought (GoT)
- 自发现/自反思 (Self-Discover / Self-Reflection)
1.2.4 其他 ML 技术
- 概率图模型 (Probabilistic Graphical Models)
- 贝叶斯网络 (Bayesian Networks)
- 马尔可夫随机场 (Markov Random Fields)
- 隐马尔可夫模型 (Hidden Markov Models)
- 异常检测 (Anomaly Detection)
- 因果推断 (Causal Inference)
2. AI 核心应用领域 (AI Core Application Domains)
2.1 自然语言处理 (Natural Language Processing, NLP)
2.1.1 基础技术
- 文本表示 (Text Representation)
- 词嵌入 (Word Embeddings: Word2Vec, GloVe, FastText)
- 上下文嵌入 (Contextual Embeddings: ELMo)
- 语法解析 (Syntax Parsing)
- 词性标注 (POS Tagging)
- 依存句法分析 (Dependency Parsing)
- 成分句法分析 (Constituency Parsing)
- 语义理解 (Semantic Understanding)
- 语义角色标注 (Semantic Role Labeling)
- 共指消解 (Coreference Resolution)
2.1.2 核心任务
- 文本分类 (Text Classification)
- 情感分析 (Sentiment Analysis)
- 主题分类 (Topic Classification)
- 意图识别 (Intent Recognition)
- 序列标注 (Sequence Labeling)
- 命名实体识别 (Named Entity Recognition, NER)
- 关键词提取 (Keyword Extraction)
- 文本生成 (Text Generation)
- 机器翻译 (Machine Translation)
- 文本摘要 (Text Summarization)
- 释义生成 (Paraphrasing)
- 信息抽取 (Information Extraction)
- 关系抽取 (Relation Extraction)
- 事件抽取 (Event Extraction)
- 知识图谱构建 (Knowledge Graph Construction)
- 问答系统 (Question Answering)
- 阅读理解 (Reading Comprehension)
- 知识库问答 (Knowledge Base QA)
- 开放域问答 (Open-domain QA)
- 对话系统 (Dialogue Systems)
- 任务型对话 (Task-oriented Dialogue)
- 开放域对话 (Open-domain Dialogue)
- 检索式对话 (Retrieval-based)
- 生成式对话 (Generative)
2.1.3 语言模型
-
传统语言模型 (Traditional Language Models)
- N-gram 模型
- 神经语言模型
-
预训练语言模型 (Pre-trained Language Models, PLM)
- BERT (Bidirectional Encoder Representations from Transformers)
- RoBERTa, ALBERT, ELECTRA
- T5 (Text-to-Text Transfer Transformer)
- BART, mBART
-
大语言模型 (Large Language Models, LLM)
- OpenAI 系列
- GPT 系列 (GPT-1/2/3/3.5/4/4o/4o-mini)
- o1 系列推理模型 (o1-preview, o1, o1-mini, o3)
- GPT-5 (预计中)
- Anthropic 系列
- Claude 3 系列 (Haiku, Sonnet, Opus)
- Claude 3.5 系列 (3.5 Sonnet, 3.5 Haiku)
- Claude 3.7 Sonnet (首个混合推理模型)
- Claude 4 系列 (Opus 4, Sonnet 4, Sonnet 4.5)
- Google 系列
- Gemini 1.0/1.5 系列
- Gemini 2.0 (2025)
- Gemini 2.5 系列 (Flash, Pro)
- Meta 系列
- LLaMA 1/2/3/3.1/3.2/3.3
- 中国开源模型
- DeepSeek 系列 (V2, V3, R1, R1 升级版)
- Qwen 系列 (2.5, 3)
- Yi 系列
- 其他开源模型
- Mistral 系列
- Phi 系列 (Microsoft)
- OpenAI 系列
-
多模态大模型 (Multimodal LLMs)
- GPT-4V, GPT-4o
- Gemini 2.0
- Claude 3.5/4 系列
-
推理模型 (Reasoning Models)
- OpenAI o1/o3 系列
- DeepSeek-R1 (开源推理模型突破)
- Claude 3.7/4 混合推理
-
检索增强生成 (Retrieval-Augmented Generation, RAG)
- 核心组件: Ingestion → Chunking → Embedding → Indexing → Retrieval → Rerank → Generation
- 关键技术: 多路检索 (Hybrid/Reciprocal Rank Fusion)、结构化检索 (Graph/SQL/知识库)、重排序 (Cross-Encoder)
- 质量保障: Hallucination 检测、引用对齐 (Citations)、事实一致性 (Fact Consistency)
- 工具生态: LlamaIndex、LangChain、Weaviate/FAISS/Milvus、Voyage/CoHere/Unisat 向量检索
注: DeepSeek-R1 于 2025 年 1 月发布,采用纯强化学习训练,在数学、代码等推理任务上达到与 o1 相当的性能,但成本仅为其 15-50%
2.1.4 语音技术
- 语音识别 (Automatic Speech Recognition, ASR)
- 传统方法 (GMM-HMM)
- 深度学习方法 (DeepSpeech, Wav2Vec, Whisper)
- 端到端模型 (End-to-End Models)
- 语音合成 (Speech Synthesis / Text-to-Speech, TTS)
- 参数化合成
- 神经网络合成 (WaveNet, Tacotron, VITS)
- 声纹识别 (Speaker Recognition / Verification)
- 说话人识别 (Speaker Identification)
- 说话人验证 (Speaker Verification)
- 语音唤醒 (Wake Word Detection / Keyword Spotting)
- 语音情感识别 (Speech Emotion Recognition)
2.2 计算机视觉 (Computer Vision, CV)
2.2.1 基础技术
- 图像处理 (Image Processing)
- 滤波与增强 (Filtering and Enhancement)
- 边缘检测 (Edge Detection)
- 形态学操作 (Morphological Operations)
- 特征提取 (Feature Extraction)
- 传统特征 (SIFT, SURF, HOG, ORB)
- 深度特征 (Deep Features)
2.2.2 核心任务
- 图像分类 (Image Classification)
- 单标签分类 (Single-label Classification)
- 多标签分类 (Multi-label Classification)
- 目标检测 (Object Detection)
- 两阶段检测 (Two-stage: R-CNN, Fast R-CNN, Faster R-CNN)
- 单阶段检测 (One-stage: YOLO, SSD, RetinaNet)
- Transformer 检测 (DETR, Deformable DETR)
- 图像分割 (Image Segmentation)
- 语义分割 (Semantic Segmentation: FCN, U-Net, DeepLab, SegFormer)
- 实例分割 (Instance Segmentation: Mask R-CNN)
- 全景分割 (Panoptic Segmentation)
- 目标追踪 (Object Tracking)
- 单目标追踪 (Single Object Tracking)
- 多目标追踪 (Multiple Object Tracking: SORT, DeepSORT)
- 姿态估计 (Pose Estimation)
- 2D/3D 人体姿态估计 (Human Pose Estimation)
- 手势识别 (Gesture Recognition)
- 动物姿态估计
- 人脸技术 (Face Technology)
- 人脸检测 (Face Detection)
- 人脸识别 (Face Recognition)
- 人脸验证 (Face Verification)
- 表情识别 (Expression Recognition)
- 人脸属性分析 (Face Attribute Analysis)
- 场景理解 (Scene Understanding)
- 场景分类 (Scene Classification)
- 深度估计 (Depth Estimation: Monocular, Stereo)
2.2.3 视频分析
- 视频分类 (Video Classification)
- 动作识别 (Action Recognition)
- 时序动作检测 (Temporal Action Detection)
- 视频目标检测 (Video Object Detection)
- 视频分割 (Video Segmentation)
- 视频摘要 (Video Summarization)
2.2.4 其他视觉任务
- 图像增强 (Image Enhancement)
- 图像超分辨率 (Image Super-Resolution)
- 图像去噪 (Image Denoising)
- 图像修复 (Image Inpainting)
- 低光增强 (Low-light Enhancement)
- 图像编辑 (Image Editing)
- 风格迁移 (Style Transfer)
- 图像变换 (Image-to-Image Translation)
- 光学字符识别 (Optical Character Recognition, OCR)
- 文本检测 (Text Detection)
- 文本识别 (Text Recognition)
- 3D 视觉 (3D Vision)
- 三维重建 (3D Reconstruction)
- 点云处理 (Point Cloud Processing: PointNet)
- NeRF (Neural Radiance Fields)
- 3D 高斯泼溅 (3D Gaussian Splatting)
- SLAM (Simultaneous Localization and Mapping)
2.3 多模态 AI (Multimodal AI)
- 视觉 - 语言理解 (Vision-Language Understanding)
- 图像描述生成 (Image Captioning)
- 视觉问答 (Visual Question Answering, VQA)
- 视觉推理 (Visual Reasoning)
- 视觉常识推理 (Visual Commonsense Reasoning)
- 跨模态检索 (Cross-modal Retrieval)
- 图文检索 (Image-Text Retrieval)
- 视频 - 文本检索 (Video-Text Retrieval)
- 多模态预训练模型
- CLIP, ALIGN, BLIP, BLIP-2
- Flamingo, GPT-4V/4o, Gemini 2.0, Claude 4
- 音频 - 视觉学习 (Audio-Visual Learning)
2.4 机器人学 (Robotics)
- 感知 (Perception)
- 传感器融合 (Sensor Fusion)
- 环境感知 (Environmental Perception)
- 物体识别与定位
- 定位与建图 (Localization and Mapping)
- SLAM (Simultaneous Localization and Mapping)
- 视觉 SLAM (Visual SLAM: ORB-SLAM, LSD-SLAM)
- 激光 SLAM (LiDAR SLAM)
- 运动规划 (Motion Planning)
- 路径规划 (Path Planning: A*, RRT)
- 轨迹规划 (Trajectory Planning)
- 避障 (Obstacle Avoidance)
- 机器人控制 (Robot Control)
- PID 控制
- 自适应控制 (Adaptive Control)
- 模型预测控制 (Model Predictive Control, MPC)
- 操作与抓取 (Manipulation and Grasping)
- 抓取规划 (Grasp Planning)
- 灵巧操作 (Dexterous Manipulation)
- 人机交互 (Human-Robot Interaction)
- 手势识别
- 语音交互
- 协作机器人 (Collaborative Robots / Cobots)
3. AI 垂直应用场景 (AI Vertical Applications)
3.1 生成式 AI 应用 (Generative AI Applications)
-
文本生成 (Text Generation)
- 内容创作 (Content Creation)
- 代码生成 (Code Generation: GitHub Copilot, Cursor, Claude Code)
- 数据合成 (Data Synthesis)
- 邮件/文档写作
-
图像生成 (Image Generation)
- 文生图 (Text-to-Image)
- DALL-E 3 (OpenAI)
- Midjourney
- Stable Diffusion
- Flux (Black Forest Labs, 2025)
- Ideogram (2025)
- 图像编辑 (Image Editing)
- Inpainting, Outpainting
- ControlNet (可控生成)
- IP-Adapter (风格控制)
- 图像风格化
- 文生图 (Text-to-Image)
-
视频生成 (Video Generation)
- 文生视频 (Text-to-Video)
- Sora (OpenAI)
- Runway Gen-3/Gen-4 (2025)
- Pika
- Kling (快手, 2025)
- Veo (Google, 2025)
- 图生视频 (Image-to-Video)
- 视频编辑
- 文生视频 (Text-to-Video)
-
音频生成 (Audio Generation)
- 音乐生成 (Music Generation)
- 语音克隆 (Voice Cloning)
- 音效生成
-
3D 生成 (3D Generation)
- 文本到 3D (Text-to-3D)
- 图像到 3D (Image-to-3D)
- NeRF 生成
3.2 智能驾驶 (Autonomous Driving / Intelligent Driving)
- 感知系统 (Perception Systems)
- 多传感器融合 (Multi-sensor Fusion: Camera, LiDAR, Radar)
- 目标检测与追踪
- 车道线检测 (Lane Detection)
- 可行驶区域分割 (Drivable Area Segmentation)
- 预测 (Prediction)
- 轨迹预测 (Trajectory Prediction)
- 行为预测 (Behavior Prediction)
- 决策规划 (Decision Making and Planning)
- 路径规划 (Path Planning)
- 行为决策 (Behavior Planning)
- 控制系统 (Control Systems)
- 横向控制 (Lateral Control)
- 纵向控制 (Longitudinal Control)
- 高精地图 (HD Mapping)
- V2X 通信 (Vehicle-to-Everything)
- 仿真测试 (Simulation and Testing)
- 商业化进展 (2025)
- Waymo: 每周 15 万次自动驾驶出行
- 百度 Apollo Go: 中国多城市运营
- 全球 16 个中国城市、奥斯陆、日内瓦等地开展测试
3.3 推荐系统 (Recommendation Systems)
- 协同过滤 (Collaborative Filtering)
- 基于用户 (User-based)
- 基于物品 (Item-based)
- 矩阵分解 (Matrix Factorization)
- 内容推荐 (Content-based Filtering)
- 混合推荐 (Hybrid Recommendation)
- 深度学习推荐 (Deep Learning for Recommendation)
- Wide & Deep, DeepFM, DIN
- 序列推荐 (Sequential Recommendation)
- 实时推荐 (Real-time Recommendation)
- 冷启动问题 (Cold Start Problem)
3.4 行业应用
医疗健康 (Healthcare)
- 医学影像分析 (Medical Image Analysis)
- CT/MRI/X 光分析
- 病灶检测与分割
- 疾病诊断与辅助诊断 (Disease Diagnosis)
- 药物发现 (Drug Discovery)
- 基因组学 (Genomics)
- 个性化医疗 (Personalized Medicine)
- 医疗问答与咨询
- 2025 进展: FDA 批准 223 个 AI 医疗设备 (2023 年仅 6 个)
金融 (Finance)
- 风险评估 (Risk Assessment)
- 欺诈检测 (Fraud Detection)
- 算法交易 (Algorithmic Trading)
- 信用评分 (Credit Scoring)
- 智能投顾 (Robo-Advisory)
- 反洗钱 (Anti-Money Laundering, AML)
- 结构化产品分析
教育 (Education)
- 自适应学习 (Adaptive Learning)
- 智能辅导 (Intelligent Tutoring Systems)
- 自动评分 (Automated Grading)
- 学习分析 (Learning Analytics)
- 个性化学习路径
环境科学 (Environmental Science)
- 气候预测 (Climate Prediction)
- 能源优化 (Energy Optimization)
- 生态监测 (Ecological Monitoring)
- 污染检测 (Pollution Detection)
制造业 (Manufacturing)
- 质量检测 (Quality Inspection)
- 预测性维护 (Predictive Maintenance)
- 供应链优化 (Supply Chain Optimization)
- 工业机器人 (Industrial Robots)
零售 (Retail)
- 需求预测 (Demand Forecasting)
- 价格优化 (Price Optimization)
- 客户分析 (Customer Analytics)
- 智能客服 (Intelligent Customer Service)
艺术创作 (Art Creation)
- AI 绘画 (AI Painting)
- AI 音乐创作 (AI Music Composition)
- AI 写作 (AI Writing)
- 创意设计辅助
安防 (Public Safety / Security)
- 视频监控 (Video Surveillance)
- 异常行为检测 (Abnormal Behavior Detection)
- 人脸识别门禁 (Face Recognition Access Control)
- 人群分析 (Crowd Analysis)
法律 (Legal Tech)
- 合同审查 (Contract Review)
- 法律检索 (Legal Research)
- 案例分析 (Case Analysis)
- 法律文书生成
- 诉讼记录分析
农业 (Agriculture)
- 精准农业 (Precision Agriculture)
- 病虫害检测 (Pest and Disease Detection)
- 作物产量预测 (Crop Yield Prediction)
- 智能灌溉 (Smart Irrigation)
- 农业机器人 (Agricultural Robots)
物流 (Logistics)
- 路线优化 (Route Optimization)
- 仓储自动化 (Warehouse Automation)
- 需求预测 (Demand Forecasting)
- 包裹分拣 (Package Sorting)
- 配送机器人 (Delivery Robots)
4. AI 工程与开发 (AI Engineering and Development)
4.1 数据工程 (Data Engineering)
- 数据收集 (Data Collection)
- 网络爬虫 (Web Scraping)
- 数据采集系统
- API 数据接入
- 数据清洗 (Data Cleaning)
- 缺失值处理
- 异常值检测
- 数据去重
- 数据标注 (Data Annotation)
- 标注工具 (Labelbox, Scale AI)
- 众包标注
- 半自动标注
- 数据增强 (Data Augmentation)
- 图像增强 (Crop, Flip, Color Jitter)
- 文本增强 (Back-translation, Synonym Replacement)
- 合成数据生成
- 数据版本管理 (Data Versioning)
- DVC (Data Version Control)
- 数据血缘追踪
- 数据湖仓一体 (Data Lakehouse, 2025 趋势)
- 统一数据平台
- 结合数据湖和数据仓库优势
4.2 模型开发 (Model Development)
-
模型训练 (Model Training)
- 超参数调优 (Hyperparameter Tuning)
- 网格搜索 (Grid Search)
- 随机搜索 (Random Search)
- 贝叶斯优化 (Bayesian Optimization)
- 分布式训练 (Distributed Training)
- 数据并行 (Data Parallelism)
- 模型并行 (Model Parallelism)
- 流水线并行 (Pipeline Parallelism)
- 张量并行 (Tensor Parallelism)
- 混合精度训练 (Mixed Precision Training)
- 梯度累积 (Gradient Accumulation)
- 超参数调优 (Hyperparameter Tuning)
-
大模型调优 (Large Model Fine-tuning)
- 全参数微调 (Full Fine-tuning)
- 参数高效微调 (Parameter-Efficient Fine-tuning, PEFT)
- LoRA (Low-Rank Adaptation)
- QLoRA (Quantized LoRA)
- Adapter, Prefix Tuning, P-tuning
- 指令微调 (Instruction Tuning)
- RLHF (Reinforcement Learning from Human Feedback)
- DPO (Direct Preference Optimization)
- 提示工程 (Prompt Engineering)
- Few-shot Prompting
- Chain-of-Thought (CoT)
- ReAct, Tree-of-Thought
- Self-Consistency
- 2025 新趋势: 纯强化学习训练 (Pure RL Training)
- DeepSeek-R1 方法: 无需人类标注的推理训练
- 新偏好优化方法: IPO、KTO、RPO、ORPO (稳定性与效率提升)
- 结构化输出: JSON Mode、函数调用模板、约束语法 (Grammar-based Decoding)
- Guardrails: PII 过滤、越权指令拒绝、政策合规过滤
4.3 模型优化 (Model Optimization)
- 模型压缩 (Model Compression)
- 知识蒸馏 (Knowledge Distillation)
- 模型剪枝 (Model Pruning)
- 结构化剪枝 (Structured Pruning)
- 非结构化剪枝 (Unstructured Pruning)
- 量化 (Quantization)
- 训练后量化 (Post-Training Quantization, PTQ)
- 量化感知训练 (Quantization-Aware Training, QAT)
- INT8/INT4/INT2 量化
- FP8 量化 (NVIDIA 新标准)
- 低秩分解 (Low-rank Factorization)
- 组量化 (Group-wise Quantization)
- 矩阵重排 (Permutation-aware Quantization)
- SmoothQuant / AWQ / GPTQ / AQLM / QuIP
- 蒸馏到小语言模型 (SLM Distillation)
4.4 模型评估与测试 (Model Evaluation and Testing)
- 性能评估 (Performance Evaluation)
- 分类指标 (Accuracy, Precision, Recall, F1)
- 回归指标 (MSE, RMSE, MAE, R²)
- 排序指标 (AUC-ROC, mAP)
- NLP 指标 (BLEU, ROUGE, METEOR, BERTScore)
- CV 指标 (IoU, Dice, mIoU)
- 鲁棒性测试 (Robustness Testing)
- 对抗样本测试 (Adversarial Testing)
- 数据分布偏移测试
- A/B 测试 (A/B Testing)
- 模型基准测试 (Benchmarking)
- MMLU, HumanEval, GSM8K
- GPQA, AIME (数学推理)
- Arena (Chatbot Arena, 实时对战排名)
- RAG 专用评估 (RAG Evaluation)
- 检索召回率 (Retrieval Recall)
- 答案真实性 (Factuality)
- 引用覆盖率 (Citation Coverage)
- 参考一致性 (Grounding Consistency)
- Agent 评估
- 任务完成率 (Task Success Rate)
- 工具调用正确率 (Tool Use Accuracy)
- 步骤最优性 (Plan Optimality)
4.5 模型部署与推理 (Model Deployment & Inference)
- 模型服务化 (Model Serving)
- REST API, gRPC
- 批处理推理 (Batch Inference)
- 实时推理 (Real-time Inference)
- 流式推理 (Streaming Inference)
- 云端部署 (Cloud Deployment)
- AWS SageMaker, Azure ML, Google Vertex AI
- 阿里云 PAI, 腾讯云 TI
- Kubernetes 部署
- 边缘部署 (Edge Deployment)
- 移动端部署 (Mobile: TensorFlow Lite, Core ML, ONNX)
- IoT 设备部署
- 嵌入式系统
- 相关前沿技术参见 6.5 边缘 AI
- 模型加速 (Model Acceleration)
- 推理引擎 (TensorRT, ONNX Runtime, OpenVINO)
- GPU/TPU 优化
- 算子融合 (Operator Fusion)
- KV Cache 优化
- 投机采样 (Speculative Decoding)
- FlashAttention / FlashDecoding
- 多次候选头 (Medusa Heads) 并行扩展
- Batch Prefill / Continuous Batching
- 分层缓存 (Paged KV Cache / Unified Memory)
- 混合解码策略: Top-k/Top-p + Contrastive Decoding + Semantic Guidance
4.6 MLOps / AI DevOps
- CI/CD for ML
- 自动化训练流水线
- 自动化测试
- 自动化部署
- 模型监控 (Model Monitoring)
- 性能监控 (Performance Monitoring)
- 数据漂移检测 (Data Drift Detection)
- 模型漂移检测 (Model Drift Detection)
- 在线学习 (Online Learning)
- 模型版本管理 (Model Versioning)
- 模型注册表 (Model Registry)
- 实验追踪 (Experiment Tracking)
- MLflow, Weights & Biases, Neptune
- 特征工程平台 (Feature Store)
- Feast, Tecton
- LLMOps 专项 (Observability for LLMs)
- 日志与遥测: 请求/提示/响应链路追踪
- 指标: 延迟、令牌吞吐、拒答率、越狱命中率、幻觉率
- 评测平台: Promptfoo, Phoenix, Giskard, DeepEval
- 在线 Guardrails: 安全策略、提示注入防御、输出约束、PII 屏蔽
- RAGOps
- 数据摄取与再切片 (re-chunking)
- 嵌入/索引版本管理
- 在线检索质量监控与热修复 (热更新索引、召回/重排策略切换)
4.7 AI 基础设施 (AI Infrastructure)
-
AI 芯片 (AI Chips)
- GPU (Graphics Processing Unit)
- NVIDIA (CUDA, Tensor Cores)
- Hopper 架构: H100, H200
- Blackwell 架构: B100, B200, GB200 (2025)
- AMD (ROCm, MI300, MI350 系列)
- NVIDIA (CUDA, Tensor Cores)
- TPU (Tensor Processing Unit)
- Google TPU v5/v6 (2025)
- NPU (Neural Processing Unit)
- 移动端 AI 芯片 (Apple Neural Engine, Qualcomm AI Engine)
- 其他 AI 加速器
- ASIC (Application-Specific Integrated Circuit)
- FPGA (Field-Programmable Gate Array)
- 华为昇腾 (Ascend 910C)
- 寒武纪 (Cambricon)
- Groq LPU (Language Processing Unit, 2025)
- GPU (Graphics Processing Unit)
-
计算平台 (Compute Platforms)
- 云计算 (Cloud Computing)
- AWS (Amazon Web Services)
- Microsoft Azure
- Google Cloud Platform (GCP)
- 阿里云, 腾讯云, 华为云
- 高性能计算 (High-Performance Computing, HPC)
- 超算集群
- GPU 集群
- 液冷技术 (2025 趋势)
- 云计算 (Cloud Computing)
-
AI 框架底层技术 (Framework Internals)
- 计算图 (Computation Graph)
- 自动微分 (Automatic Differentiation)
- CUDA / cuDNN
- OpenCL
- Triton (NVIDIA)
- XLA (Accelerated Linear Algebra)
4.8 开发框架与工具 (Development Frameworks and Tools)
-
深度学习框架 (Deep Learning Frameworks)
- TensorFlow / Keras
- PyTorch / PyTorch Lightning
- JAX / Flax
- MXNet
- PaddlePaddle
-
大模型工具 (LLM Tools)
- 开发框架
- Hugging Face Transformers
- LangChain / LangGraph (2025 升级)
- LlamaIndex
- 推理引擎
- vLLM (高速推理)
- SGLang (结构化生成语言, 2025)
- TGI (Text Generation Inference)
- 训练工具
- DeepSpeed (分布式训练)
- Megatron-LM
- Axolotl
- 本地部署
- Ollama
- LM Studio
- 开发框架
-
AutoML 工具
- AutoKeras, Auto-sklearn
- H2O.ai, Google AutoML
- Ray Tune, Optuna
-
可视化工具 (Visualization Tools)
- TensorBoard
- Weights & Biases (W&B)
- MLflow
- Netron (模型可视化)
5. AI 安全、伦理与治理 (AI Safety, Ethics and Governance)
5.1 AI 安全 (AI Safety)
-
对抗攻击与防御 (Adversarial Attacks and Defense)
- 对抗样本 (Adversarial Examples: FGSM, PGD, C&W)
- 对抗训练 (Adversarial Training)
- 模型鲁棒性 (Model Robustness)
- 认证鲁棒性 (Certified Robustness)
-
模型安全 (Model Security)
- 模型窃取 (Model Stealing / Extraction)
- 后门攻击 (Backdoor Attacks / Trojan Attacks)
- 成员推断攻击 (Membership Inference Attack)
- 模型逆向 (Model Inversion)
-
内容安全 (Content Safety)
- 有害内容检测 (Harmful Content Detection)
- 内容审核 (Content Moderation)
- 毒性检测 (Toxicity Detection)
- NSFW 检测
- 虚假信息检测 (Misinformation Detection)
- 越狱检测 (Jailbreak Detection)
-
提示注入防御 (Prompt Injection Defense)
- 越狱攻击防御 (Jailbreak Defense)
- 系统提示泄露防护
- 模型供应链安全 (Model Supply Chain Security): 权重篡改、模型来源可信度、SBOM
-
AI 红队测试 (AI Red Teaming, 2025 趋势)
- 对抗性测试
- 安全漏洞发现
5.2 隐私保护 (Privacy Protection)
-
差分隐私 (Differential Privacy)
- ε- 差分隐私
- 本地差分隐私 (Local DP)
-
联邦学习 (Federated Learning)
- 横向联邦学习
- 纵向联邦学习
-
同态加密 (Homomorphic Encryption)
-
安全多方计算 (Secure Multi-party Computation, MPC)
-
数据脱敏 (Data Anonymization / De-identification)
- K- 匿名性
- L- 多样性
5.3 可解释性与可信赖 AI (Explainability & Trustworthy AI)
-
可解释 AI (Explainable AI, XAI)
- 特征重要性 (Feature Importance)
- SHAP (SHapley Additive exPlanations)
- LIME (Local Interpretable Model-agnostic Explanations)
- 积分梯度 (Integrated Gradients)
- 注意力可视化 (Attention Visualization)
- 显著图 (Saliency Maps)
- 概念激活向量 (CAV)
- 特征重要性 (Feature Importance)
-
可解释模型 (Interpretable Models)
- 决策树、线性模型
- GAM (Generalized Additive Models)
-
决策解释 (Decision Explanation)
-
模型透明度 (Model Transparency)
5.4 公平性 (Fairness)
-
偏见检测 (Bias Detection)
- 数据偏见 (Data Bias)
- 算法偏见 (Algorithmic Bias)
-
公平性度量 (Fairness Metrics)
- 人口统计公平 (Demographic Parity)
- 机会均等 (Equalized Odds)
- 个体公平性 (Individual Fairness)
-
去偏见技术 (Debiasing Techniques)
- 预处理去偏见
- 训练中去偏见
- 后处理去偏见
5.5 AI 伦理 (AI Ethics)
-
负责任的 AI (Responsible AI)
- AI 伦理准则
- 人类价值观对齐
-
AI 对齐 (AI Alignment)
- 价值对齐 (Value Alignment)
- 目标对齐 (Goal Alignment)
- Constitutional AI (Anthropic 提出)
-
AI 偏见与歧视 (AI Bias and Discrimination)
-
AI 透明度与问责 (AI Transparency and Accountability)
5.6 AI 治理 (AI Governance)
-
AI 法规与标准 (AI Regulations and Standards)
- 欧盟 AI 法案 (EU AI Act, 2024 生效)
- 美国 AI 行政令
- 中国生成式 AI 管理办法
- 行业标准 (ISO/IEC, IEEE)
-
AI 审计 (AI Auditing)
- 算法审计
- 合规性审计
- 第三方评估
-
知识产权与版权 (Intellectual Property & Copyright)
- AI 生成内容的版权归属
- 训练数据的版权问题
- 开源许可
- 《纽约时报》诉 OpenAI 案等法律纠纷
-
数据主权 (Data Sovereignty)
- 跨境数据流动
- GDPR, CCPA 等法规遵从
- 数据本地化要求
6. 前沿与新兴技术 (Frontier and Emerging Technologies)
6.1 人工通用智能 (Artificial General Intelligence, AGI)
-
智能涌现 (Emergent Abilities)
- 规模定律 (Scaling Laws)
- 涌现现象研究
- 能力跃迁研究
-
推理能力 (Reasoning Capabilities)
- 思维链 (Chain-of-Thought, CoT)
- 树形思维 (Tree-of-Thought)
- 自我反思 (Self-Reflection)
- 长链推理 (Long-Chain Reasoning)
- 数学推理 (Mathematical Reasoning)
- 代码推理 (Code Reasoning)
- 2025 突破: OpenAI o1/o3, DeepSeek-R1 推理模型
-
工具使用 (Tool Use)
- 函数调用 (Function Calling)
- API 调用
- 工具学习 (Tool Learning)
- 多工具协作
-
世界模型 (World Models)
- 环境建模与预测
- 物理常识理解
- 因果推理与模拟
- 视频世界模型 (Video World Models)
-
AI Agent (2025 热点)
- 自主规划 (Autonomous Planning)
- 任务分解
- 多步骤规划
- 记忆系统 (Memory Systems)
- 短期记忆
- 长期记忆
- 情景记忆
- 多 Agent 协作 (Multi-Agent Collaboration)
- Agent 通信协议
- 分工协作
- 集体智能
- 应用场景
- 代码开发 Agent (Devin, Cursor Agent)
- 研究助手 Agent
- 业务流程自动化 Agent
- 自主规划 (Autonomous Planning)
6.2 具身智能 (Embodied AI)
-
机器人学习 (Robot Learning)
- 模仿学习 (Imitation Learning)
- 强化学习用于机器人
- 端到端学习
-
视觉 - 运动控制 (Vision-Motor Control)
- 视觉伺服控制
- 手眼协调
-
具身问答 (Embodied Question Answering)
-
物理世界交互 (Physical World Interaction)
- 物体操控
- 环境探索
-
人形机器人 (Humanoid Robots, 2025 趋势)
- Tesla Optimus Gen 2
- Figure 01/02
- 小米 CyberOne
6.3 神经符号 AI (Neuro-Symbolic AI)
-
知识图谱与神经网络融合
- 知识增强的神经网络
- 神经定理证明 (Neural Theorem Proving)
-
可解释推理 (Explainable Reasoning)
-
混合推理系统 (Hybrid Reasoning Systems)
- 符号推理 + 神经网络
- 规则引导的学习
6.4 量子机器学习 (Quantum Machine Learning)
-
量子神经网络 (Quantum Neural Networks, QNN)
-
量子优化算法 (Quantum Optimization)
- QAOA, VQE
-
量子核方法 (Quantum Kernel Methods)
-
量子数据编码 (Quantum Data Encoding)
-
商业化进展 (2025)
- IBM Quantum, Google Quantum AI
- 中国祖冲之号、九章系列
6.5 边缘 AI (Edge AI)
-
端侧智能 (On-device Intelligence)
- 端侧推理优化
- 移动端模型设计
- 低功耗设计
-
TinyML
- 微控制器上的机器学习
- 极低功耗 AI (<1mW)
- 传感器融合
-
边缘 - 云协同 (Edge-Cloud Collaboration)
- 边缘计算 + 云计算
- 任务卸载 (Task Offloading)
-
模型分割 (Model Partitioning)
- 层级分割
- 计算分配
-
联邦边缘学习 (Federated Edge Learning)
注: 边缘 AI 作为前沿研究方向,其工程实践部分参见 4.5 边缘部署
6.6 脑机接口与 AI (Brain-Computer Interface & AI)
-
神经信号处理 (Neural Signal Processing)
- EEG, fMRI 信号分析
- 神经解码
-
认知增强 (Cognitive Enhancement)
-
神经形态计算 (Neuromorphic Computing)
- 脉冲神经网络 (Spiking Neural Networks, SNN)
- 类脑芯片 (Neuromorphic Chips: IBM TrueNorth, Intel Loihi)
-
脑机交互 (Brain-Machine Interaction)
- Neuralink (Elon Musk)
- 运动控制应用
- 感觉反馈
6.7 AI for Science (AI4Science)
-
蛋白质与生物学 (Protein & Biology)
- 蛋白质结构预测 (AlphaFold 2/3, ESMFold)
- 蛋白质设计 (RFdiffusion)
- RNA 结构预测
-
药物设计 (Drug Design)
- 分子生成
- 分子性质预测
- 靶点发现
- 临床试验优化
-
材料科学 (Material Science)
- 材料发现 (GNoME by DeepMind)
- 晶体结构预测
- 材料性质预测
-
科学推理 (Scientific Reasoning)
- 科学文献分析
- 假设生成
- 实验设计
-
气候与环境 (Climate & Environment)
- 气候建模
- 极端天气预测
- GraphCast (DeepMind)
-
天文学 (Astronomy)
- 天体分类
- 引力波检测
- 系外行星发现
6.8 其他前沿方向
因果 AI (Causal AI)
- 因果发现 (Causal Discovery)
- 因果推断 (Causal Inference)
- 反事实推理 (Counterfactual Reasoning)
- 干预效应估计
可微编程 (Differentiable Programming)
- 端到端可微分系统
- 可微分物理引擎
神经架构搜索 (Neural Architecture Search, NAS)
- 自动化模型设计
- 硬件感知 NAS
终身学习系统 (Lifelong Learning Systems)
- 持续学习
- 知识保留与迁移
- 灾难性遗忘防止
开放世界学习 (Open World Learning)
- 未知类别识别
- 动态环境适应
- 开放集识别
小样本大模型 (Small Language Models, 2025 趋势)
- Phi-3/4 (Microsoft)
- Gemma (Google)
- Qwen 系列小模型
- 性能接近大模型但参数更少
6.9 新兴架构与可持续 AI (Emerging Architectures & Sustainable AI)
-
新兴架构
- SSM/Mamba-2、RetNet、RWKV:长上下文、流式推理优势
- 混合注意力-状态空间模型:结合两者优点以提升稳健性与效率
- MoE 2.0:细粒度路由、鲁棒激活裁剪,降低稀疏带宽开销
-
可持续 AI (Sustainable AI)
- 训练/推理能耗度量与优化 (Energy/Carbon Accounting)
- 绿色推理技术:低比特量化、蒸馏到 SLM、动态早停 (Early-Exit)
- 硬件-算法协同:低功耗加速器、内存层次优化、分页 KV Cache 降耗
附录: 关键概念关系说明
学习范式 vs 实现技术
-
学习范式(监督/无监督/半监督/强化学习)描述的是 ” 如何获取训练信号 ”
- 监督学习:从标注数据学习
- 无监督学习:从无标注数据学习内在结构
- 半监督学习:结合少量标注和大量无标注数据
- 强化学习:从环境反馈中学习
-
实现技术(传统 ML/深度学习)描述的是 ” 用什么算法实现 ”
- 传统机器学习:使用统计学习方法(如 SVM、决策树)
- 深度学习:使用深层神经网络
-
关系: 深度学习可以用于任何学习范式
- 监督学习 + 深度学习 = CNN 图像分类
- 无监督学习 + 深度学习 = VAE 生成模型
- 强化学习 + 深度学习 = DQN
理论 vs 应用
- NLP/CV/机器人学既是研究领域(有独特的理论和方法),也是应用领域
- 本图谱将其放在 ” 核心应用领域 “(第 2 章),强调其作为 AI 技术落地的主要方向
- 这些领域都会使用第 1 章的各种机器学习方法
生成式 AI
- 作为技术(生成模型):属于深度学习的一部分(1.2.2)
- 包括 GAN、VAE、扩散模型等具体技术
- 作为应用(生成式 AI 应用):是当前最热门的应用方向(3.1)
- 包括文生图、文生视频、代码生成等具体应用
边缘 AI
- 作为工程实践(边缘部署):在 4.5 模型部署中
- 关注如何在边缘设备上部署模型
- 作为前沿技术(边缘 AI):在 6.5 中
- 关注端侧智能、TinyML 等研究方向
大语言模型 (LLM)
- 大语言模型是预训练语言模型发展到一定规模后的产物
- GPT 系列横跨了 PLM 和 LLM 两个时代:
- GPT-1/2 (2018-2019): 预训练语言模型时代
- GPT-3/4 (2020-): 大语言模型时代的标志
- 区别主要在于:模型规模、涌现能力、应用方式(prompt vs fine-tune)
推理模型 (Reasoning Models, 2025 新概念)
- 推理模型是 LLM 的一个特殊子类,专注于复杂推理任务
- 特点:
- 使用强化学习训练推理能力
- 在数学、代码、科学等领域表现突出
- 推理过程可见(思维链)
- 代表模型:OpenAI o1/o3, DeepSeek-R1, Claude 3.7/4
AI 硬件与算法的关系
- AI 的发展是 ” 算法 + 数据 + 算力 ” 三位一体
- 硬件进步(GPU、TPU)推动了深度学习的突破
- 算法创新(Transformer)也反过来推动硬件设计
- 两者相互促进,缺一不可
Agentic AI (2025 核心趋势)
- AI Agent 不是单一技术,而是多种技术的集成系统
- 核心能力:
- 感知(Perception): 理解环境和任务
- 规划(Planning): 制定多步骤计划
- 执行(Execution): 使用工具完成任务
- 记忆(Memory): 保存和检索信息
- 学习(Learning): 从经验中改进
- 应用层面已成为 2025 年 AI 产业最大热点
版本更新说明
v2.1 主要更新 (2025 年 11 月)
-
2025 年重大技术更新
- 推理模型崛起: 新增 OpenAI o1/o3, DeepSeek-R1 等推理模型
- Agentic AI 爆发: 新增 AI Agent 专门章节
- 多模态突破: Gemini 2.0, Claude 4 等原生多模态模型
- 视频生成成熟: Gen-3/4, Kling, Veo 等商业化产品
-
模型与工具更新
- 更新所有主流 LLM 到最新版本
- 新增 Flux, Ideogram 等图像生成工具
- 新增 SGLang, Ollama 等开发工具
- 更新 AI 芯片到 Blackwell/MI300 系列
-
产业应用更新
- 医疗: FDA 批准 AI 设备数量激增
- 自动驾驶: Waymo 等商业化进展
- 更新各行业 AI 应用现状
-
方法论创新
- 纯强化学习训练方法 (DeepSeek-R1)
- MoE 架构普及
- 数据湖仓一体趋势
-
治理与安全
- 欧盟 AI 法案生效
- AI 红队测试成为标准实践
- 版权纠纷案例更新
-
前沿技术
- 小样本大模型 (SLM) 趋势
- 人形机器人商业化
- AI4Science 重大突破
-
结构优化
- 新增推理模型专门分类
- 完善 AI Agent 相关内容
- 补充 2025 产业数据
图谱维护:
- 本知识图谱基于 2025 年 11 月最新信息编制
- 建议每季度审查更新,AI 领域发展迅速
- 重点关注: LLM 能力边界、Agent 应用落地、法规政策变化
数据来源:
- 学术论文与技术报告
- 产业动态与公司发布
- 权威机构报告 (Stanford AI Index, McKinsey AI Report)
- 开源社区与技术博客