机器学习核心概念：三大范式与深度学习的本质

学习入口

入门路径：机器学习入门路线图、机器学习实战项目指南、机器学习工具与资源。
基础模型：神经网络、深度学习、Transformer、卷积神经网络、循环神经网络。
决策学习：强化学习、模仿学习。

1. 核心框架：机器学习的“版图”

机器学习 (Machine Learning) 是最大的范畴，致力于让机器从数据中自动学习规律。

我们可以根据机器获取**“学习信号”（反馈）的来源**，将其分为三大类（加上两种重要的新兴范式）：

监督学习 (Supervised Learning)
无监督学习 (Unsupervised Learning)
强化学习 (Reinforcement Learning)
半监督学习 (Semi-Supervised Learning)
自监督学习 (Self-Supervised Learning)

深度学习 (Deep Learning) 是一种跨越式的实现技术，可以应用于上述所有学习范式。

2. 深度学习的本质：为什么它如此强大？

在深入学习范式之前，我们必须先理解深度学习这个“工具”的革命性所在。

📌 深度学习的本质：自动化特征工程

传统 ML (如 SVM)： 高度依赖人工设计的特征（如图像的边缘、纹理）。
深度学习 (DL)： 使用多层神经网络，能够自动从原始数据中学习到分层的、高阶的特征表示。

“深度”的含义： 指的是特征学习的层次性。例如，CNN 的浅层学习边缘，中层学习形状，高层学习完整的物体概念。这实现了对复杂输入到输出映射的**端到端（End-to-End）**拟合。

3. 学习范式：机器如何获取反馈？

3.1 监督学习 (Supervised Learning)

核心思想	学习目标	典型任务
有标注数据：机器拥有”标准答案”（标签 $Y$ ），学习从输入 $X$ 到输出 $Y$ 的映射	学习一个从输入到输出的精确映射函数 $f$	分类（离散输出，如垃圾邮件识别）、回归（连续输出，如房价预测）

3.2 无监督学习 (Unsupervised Learning)

核心思想	学习目标	典型任务
无标注数据：机器只有输入 $X$ ，没有标准答案	发现数据中内在的结构、模式或分布	聚类（将相似数据分组，如 K-Means）、降维（压缩数据，如 PCA）、密度估计

3.3 强化学习 (Reinforcement Learning, RL)

核心思想	学习目标	典型任务
试错交互：机器（Agent）在一个环境中行动，通过获得奖励/惩罚（延迟的反馈信号）来学习	学习一个最优策略，以最大化长期累计奖励	机器人控制、AlphaGo、自动驾驶决策

4. 延伸范式：处理真实世界的复杂数据

4.1 半监督学习 (Semi-Supervised Learning, SSL)

地位： 介于监督学习和无监督学习之间
数据特点： 少量有标签数据 + 大量无标签数据（适用于标签昂贵的场景）
关键技术：
- 伪标签 (Pseudo-labeling)： 用初始模型给无标签数据打上高置信度的标签，再用这些”伪标签”数据进行训练

4.2 自监督学习 (Self-Supervised Learning, Self-SL)

地位： 属于无监督学习的一种高效实现方式
核心理念： 从无标签数据中自动创造”代理任务”（Pretext Task）的标签
典型应用：
- 预训练语言模型 (如 BERT)： 设计”完形填空”（预测被遮盖的词）作为代理任务，让模型从海量文本中学习上下文表示
- 对比学习 (Contrastive Learning)： 通过让模型区分样本的相似性/差异性（如图像的增强版本是相似的），学习强大的特征表示

5. 深度学习与学习范式的”协作”关系

范式	深度学习实现工具	示例	协作原理
监督学习	CNN, Transformer	图像分类、机器翻译	CNN/Transformer（工具）接收带标签数据（范式）完成任务
无监督学习	自编码器 (AE), GAN	数据降维、图像生成	AE/GAN（工具）接收无标签数据（范式）学习数据分布和结构
强化学习	DQN, A3C	玩游戏、机器人路径规划	DQN（工具）使用神经网络作为 Agent 的”大脑”，通过环境奖励（范式）优化决策
自监督学习	Transformer (BERT/GPT)	语言模型预训练	Transformer（工具）通过自创的代理标签（范式）学习语言的深层表示

结论：理解 AI 的核心逻辑

机器学习定义了我们解决问题的领域
学习范式定义了我们如何获取知识和反馈
深度学习是一种强大的技术工具，它通过自动学习复杂特征，极大地提高了我们解决几乎所有范式问题的能力

Sean's Blog

Explorer

机器学习

机器学习核心概念：三大范式与深度学习的本质

学习入口

1. 核心框架：机器学习的“版图”

2. 深度学习的本质：为什么它如此强大？

📌 深度学习的本质：自动化特征工程

3. 学习范式：机器如何获取反馈？

3.1 监督学习 (Supervised Learning)

3.2 无监督学习 (Unsupervised Learning)

3.3 强化学习 (Reinforcement Learning, RL)

4. 延伸范式：处理真实世界的复杂数据

4.1 半监督学习 (Semi-Supervised Learning, SSL)

4.2 自监督学习 (Self-Supervised Learning, Self-SL)

5. 深度学习与学习范式的”协作”关系

结论：理解 AI 的核心逻辑

学习笔记

机器学习工具与资源

Transformer

机器学习入门路线图

机器学习实战项目指南

图神经网络

神经网络层类型详解

神经网络

深度学习

卷积神经网络

循环神经网络

目录

Graph View

反向链接