引入
图论中的树和现实生活中的树长得一样,只不过我们习惯于处理问题的时候把树根放到上方来考虑。这种数据结构看起来像是一个倒挂的树,因此得名。
树与图的关系
树是图的特殊情况。具体来说:
- 树是连通无向无环图 — 图可以有环,树不能有环; 图可以不连通,树必须连通
- 树的边数固定 — 有 个节点的树必有 条边,而一般图的边数可以是 到 之间的任意值
- 树的路径唯一 — 树中任意两点间有且仅有一条简单路径,而一般图中两点间可能有多条路径或无路径
从集合论角度看,它们的包含关系为:
其中:
- 森林 (Forest): 每个连通分量都是树的图 (即多棵不相连的树)
- 生成树 (Spanning Tree): 连通图的子图,包含所有节点但只保留 条边使其成为树
由于树是图的特殊情况,因此:
- 图的存储方法 (邻接表、邻接矩阵等) 同样适用于树
- 图的遍历算法 (DFS、BFS) 也可直接用于树
- 但树的特殊性质 (无环、连通) 使得某些算法在树上可以简化
定义
一个没有固定根结点的树称为 无根树(unrooted tree)。无根树有几种等价的形式化定义:
-
有 个结点, 条边的连通无向图
-
无向无环的连通图
-
任意两个结点之间有且仅有一条简单路径的无向图
-
任何边均为桥的连通图
-
没有圈,且在任意不同两点间添加一条边之后所得图含唯一的一个圈的图
在无根树的基础上,指定一个结点称为 根,则形成一棵 有根树(rooted tree)。有根树在很多时候仍以无向图表示,只是规定了结点之间的上下级关系,详见下文。
有关树的定义
适用于无根树和有根树
-
森林(forest):每个连通分量(连通块)都是树的图。按照定义,一棵树也是森林。
-
生成树(spanning tree):一个连通无向图的生成子图,同时要求是树。也即在图的边集中选择 条,将所有顶点连通。
-
无根树的叶结点(leaf node):度数不超过 的结点。
为什么不是度数恰为 ?
考虑 。
- 有根树的叶结点(leaf node):没有子结点的结点。
只适用于有根树
- 父亲(parent node):对于除根以外的每个结点,定义为从该结点到根路径上的第二个结点。 根结点没有父结点。
- 祖先(ancestor):一个结点到根结点的路径上,除了它本身外的结点。 根结点的祖先集合为空。
- 子结点(child node):如果 是 的父亲,那么 是 的子结点。 子结点的顺序一般不加以区分,二叉树是一个例外。
- 结点的深度(depth):到根结点的路径上的边数。
- 树的高度(height):所有结点的深度的最大值。
- 兄弟(sibling):同一个父亲的多个子结点互为兄弟。
- 后代(descendant):子结点和子结点的后代。 或者理解成:如果 是 的祖先,那么 是 的后代。
-
子树(subtree):删掉与父亲相连的边后,该结点所在的子图。
特殊的树
-
链(chain/path graph):满足与任一结点相连的边不超过 条的树称为链。
-
菊花/星星(star):满足存在 使得所有除 以外结点均与 相连的树称为菊花。
-
有根二叉树(rooted binary tree):每个结点最多只有两个儿子(子结点)的有根树称为二叉树。常常对两个子结点的顺序加以区分,分别称之为左子结点和右子结点。 大多数情况下,二叉树 一词均指有根二叉树。
-
完整二叉树(full/proper binary tree):每个结点的子结点数量均为 0 或者 2 的二叉树。换言之,每个结点或者是树叶,或者左右子树均非空。
-
完全二叉树(complete binary tree):只有最下面两层结点的度数可以小于 2,且最下面一层的结点都集中在该层最左边的连续位置上。
-
完美二叉树(perfect binary tree):所有叶结点的深度均相同,且所有非叶节点的子节点数量均为 2 的二叉树称为完美二叉树。
Warning
Proper binary tree 的汉译名称不固定,且完全二叉树和满二叉树的定义在不同教材中定义不同,遇到的时候需根据上下文加以判断。
OIers 所说的「满二叉树」多指完美二叉树。
存储
只记录父结点
用一个数组 parent[N] 记录每个结点的父亲结点。
这种方式可以获得的信息较少,不便于进行自顶向下的遍历。常用于自底向上的递推问题中。
邻接表
- 对于无根树:为每个结点开辟一个线性列表,记录所有与之相连的结点。
std::vector<int> adj[N]; - 对于有根树:
- 方法一:若给定的是无向图,则仍可以上述形式存储。下文将介绍如何区分结点的上下关系。
- 方法二:若输入数据能够确保结点的上下关系,则可以利用这个信息。为每个结点开辟一个线性列表,记录其所有子结点;若有需要,还可在另一个数组中记录其父结点。
当然也可以用其他方式(如链表)替代std::vector<int> children[N]; int parent[N];std::vector。
左孩子右兄弟表示法
过程
对于有根树,存在一种简单的表示方法。
首先,给每个结点的所有子结点任意确定一个顺序。
此后为每个结点记录两个值:其 第一个子结点 child[u] 和其 下一个兄弟结点 sib[u]。若没有子结点,则 child[u] 为空;若该结点是其父结点的最后一个子结点,则 sib[u] 为空。
实现
遍历一个结点的所有子结点可由如下方式实现。
int v = child[u]; // 从第一个子结点开始
while (v != EMPTY_NODE) {
// ...
// 处理子结点 v
// ...
v = sib[v]; // 转至下一个子结点,即 v 的一个兄弟
}也可简写为以下形式。
for (int v = child[u]; v != EMPTY_NODE; v = sib[v]) {
// ...
// 处理子结点 v
// ...
}二叉树
需要记录每个结点的左右子结点。
实现
int parent[N]; int lch[N], rch[N]; // -- or -- int child[N][2];
树的遍历
树上 DFS
在树上 DFS 是这样的一个过程:先访问根节点,然后分别访问根节点每个儿子的子树。
可以用来求出每个节点的深度、父亲等信息。
二叉树 DFS 遍历
先序遍历
按照 根,左,右 的顺序遍历二叉树。
实现
void preorder(BiTree* root) { if (root) { cout << root->key << " "; preorder(root->left); preorder(root->right); } }
中序遍历
按照 左,根,右 的顺序遍历二叉树。
实现
void inorder(BiTree* root) { if (root) { inorder(root->left); cout << root->key << " "; inorder(root->right); } }
后序遍历
按照 左,右,根 的顺序遍历二叉树。
实现
void postorder(BiTree* root) { if (root) { postorder(root->left); postorder(root->right); cout << root->key << " "; } }
反推
重要结论:只有包含中序遍历的组合才能唯一确定二叉树并求出第三个序列:
- 中序 + 前序 → 可以唯一确定后序
- 中序 + 后序 → 可以唯一确定前序
- ❌ 前序 + 后序 → 不能唯一确定中序(反例:
1-2的链可能是左链也可能是右链)
重建步骤(以中序+前序为例):
- 前序的第一个是
root,后序的最后一个是root。 - 先确定根节点,然后根据中序遍历,在根左边的为左子树,根右边的为右子树。
- 根据左子树的节点数量,在前序/后序中划分出左右子树的范围。
- 对于每一个子树可以看成一个全新的树,递归地遵循上面的规律。
为什么需要中序?因为只有中序遍历能通过根节点的位置明确区分左右子树的边界,而前序和后序都无法做到这一点。
树上 BFS
从树根开始,严格按照层次来访问节点。
BFS 过程中也可以顺便求出各个节点的深度和父亲节点。
树的层序遍历
树层序遍历是指按照从根节点到叶子节点的层次关系,一层一层的横向遍历各个节点。根据 BFS 的定义可以知道,BFS 所得到的遍历顺序就是一种层序遍历。但层序遍历要求将不同的层次区分开来,所以其结果通常以二维数组的形式表示。
例如,下图的树的层序遍历的结果是 [[1], [2, 3, 4], [5, 6]](每一层从左向右)。
实现
vector<vector<int>> levelOrder(Node* root) { if (!root) { return {}; } vector<vector<int>> res; queue<Node*> q; q.push(root); while (!q.empty()) { int currentLevelSize = q.size(); // 当前层的节点个数 res.push_back(vector<int>()); for (int i = 0; i < currentLevelSize; ++i) { Node* cur = q.front(); q.pop(); res.back().push_back(cur->val); for (Node* child : cur->children) { // 把子节点都加入 q.push(child); } } } return res; }
二叉树 Morris 遍历
二叉树遍历的核心问题是,当遍历当前节点的子节点后,如何返回当前节点并继续遍历。遍历二叉树的递归方法和非递归方法都使用了栈结构,记录返回路径,来实现从下层到上层的移动。其空间复杂度最好时为 ,最坏时为 (二叉树呈线性)。
Morris 遍历的实质是避免使用栈,利用底层节点空闲的 right 指针指回上层的某个节点,从而完成下层到上层的移动。
Morris 遍历的过程
假设来到当前节点 cur,开始时来到根节点位置。
- 如果
cur为空时遍历停止,否则进行以下过程。 - 如果
cur没有左子树,cur向右移动(cur = cur->right)。 - 如果
cur有左子树,找到左子树上最右的节点,记为mostRight。- 如果
mostRight的right指针指向空,让其指向cur,然后cur向左移动(cur = cur->left)。 - 如果
mostRight的right指针指向cur,将其修改为null,然后cur向右移动(cur = cur->right)。
- 如果
完整遍历示例
以下面的二叉树为例(图示见上文):
1
/ \
2 3
/ \ / \
4 5 6 7
完整的 Morris 遍历过程:
-
cur = 1(第1次访问)
- 1 有左子树,找左子树(以2为根)的最右节点
- 从 2 开始:2→5(5的right为空),mostRight = 5
- 建立线索:
5->right = 1 - cur = 1→left = 2
-
cur = 2(第1次访问)
- 2 有左子树,找左子树(以4为根)的最右节点
- mostRight = 4(4的right为空)
- 建立线索:
4->right = 2 - cur = 2→left = 4
-
cur = 4
- 4 无左子树,直接向右:cur = 4→right = 2(通过线索回到2)
-
cur = 2(第2次访问)
- 2 有左子树,找mostRight = 4
- 4→right = 2(指向当前节点!说明左子树已遍历完)
- 恢复:
4->right = null - cur = 2→right = 5
-
cur = 5
- 5 无左子树,直接向右:cur = 5→right = 1(通过线索回到1)
-
cur = 1(第2次访问)
- 1 有左子树,找mostRight = 5
- 5→right = 1(指向当前节点!说明左子树已遍历完)
- 恢复:
5->right = null - cur = 1→right = 3
-
cur = 3(第1次访问)
- 3 有左子树,找mostRight = 6
- 建立线索:
6->right = 3 - cur = 3→left = 6
-
cur = 6
- 6 无左子树,直接向右:cur = 6→right = 3(通过线索回到3)
-
cur = 3(第2次访问)
- 恢复:
6->right = null - cur = 3→right = 7
- 恢复:
-
cur = 7
- 7 无左子树,cur = 7→right = null
- 遍历结束
访问序列:1 2 4 2 5 1 3 6 3 7
- 有左子树的节点(1, 2, 3)访问两次
- 无左子树的节点(4, 5, 6, 7)访问一次
核心机制:通过”左子树的最右节点”的空闲right指针建立临时线索,实现 O(1) 空间的回溯。
实现
void morrisInOrder(TreeNode* root) { TreeNode* cur = root; while (cur) { if (!cur->left) { // 如果当前节点没有左子节点,则输出当前节点的值并进入右子树 std::cout << cur->val << " "; cur = cur->right; continue; } // 找到当前节点的左子树的最右节点 TreeNode* mostRight = cur->left; while (mostRight->right && mostRight->right != cur) { mostRight = mostRight->right; } if (!mostRight->right) { // 如果最右节点的right指针为空,将其指向当前节点,并进入左子树 mostRight->right = cur; cur = cur->left; } else { // 如果最右节点的right指针指向当前节点,说明左子树已经遍历完毕,输出当前节点的值并进入右子树 mostRight->right = nullptr; std::cout << cur->val << " "; cur = cur->right; } } }
Morris 遍历的使用场景与比较
时间空间复杂度对比:
| 遍历方法 | 时间复杂度 | 空间复杂度 | 说明 |
|---|---|---|---|
| 递归 DFS | ~ | 递归栈深度取决于树高 平衡树为 ,链状树为 | |
| 迭代 DFS | ~ | 显式栈空间,与递归类似 | |
| BFS | ~ | 队列存储同层节点, 为最大宽度 完全二叉树最下层约 个节点 | |
| Morris | 利用树结构本身的空闲指针 通过摊还分析,每条边最多访问常数次 |
适用场景:
-
Morris 遍历适用于:
- 内存严格受限的环境(如嵌入式系统)
- 处理超大规模树且只需遍历一次
- 面试中明确要求 空间复杂度
- 构建线索化二叉树(Threaded Binary Tree)
- 学习数据结构原理,理解空间优化思想
-
递归/迭代 DFS 更适合:
- 需要回溯或记录访问路径
- 代码简洁性和可读性优先
- 树深度可控(如平衡树)
- 需要在遍历过程中维护复杂状态
- 普通业务代码开发
-
BFS 更适合:
- 层序遍历或按层处理
- 寻找最短路径(无权树)
- 树的宽度远小于高度时(如完全二叉树的上层)
实践建议:
- 默认选择:递归 DFS(代码简洁,性能已足够)
- 性能敏感:迭代 DFS 或 BFS(避免递归开销)
- 内存受限:Morris 遍历(空间 )
- 层次相关:BFS(如层序遍历、最短路径)
Morris 遍历的注意事项
- 代码复杂度高:难以理解和维护,容易出错
- 临时修改树结构:虽然遍历完成后会恢复,但过程中会修改 right 指针
- 常数因子较大:需要多次寻找最右节点,实际运行时间可能比递归慢
- 不支持并发访问:遍历过程中修改了指针,无法多线程同时遍历
- 调试困难:指针操作多,出错时不易定位问题
Morris 遍历是一个理论上很优雅,实践中很少用的算法,更多作为算法竞赛/面试的”奇技淫巧”,在实际工程中罕见。理解其思想即可,不必在实际项目中强行使用。
无根树
过程
树的遍历一般为深度优先遍历,这个过程中最需要注意的是避免重复访问结点。
由于树是无环图,因此只需记录当前结点是由哪个结点访问而来,此后进入除该结点外的所有相邻结点,即可避免重复访问。
实现
void dfs(int u, int from) { // 递归进入除了 from 之外的所有子结点 // 对于出发结点,from 为空,故会访问所有相邻结点,这与期望一致 for (int v : adj[u]) if (v != from) { dfs(v, u); } } // 开始遍历时 int EMPTY_NODE = -1; // 一个不存在的编号 int root = 0; // 任取一个结点作为出发点 dfs(root, EMPTY_NODE);
有根树
对于有根树,需要区分结点的上下关系。
考察上面的遍历过程,若从根开始遍历,则访问到一个结点时 from 的值,就是其父结点的编号。
通过这个方式,可以对于无向的输入求出所有结点的父结点,以及子结点列表。
本页面部分内容引用自博文 二叉树:前序遍历、中序遍历、后续遍历,遵循 CC 4.0 BY-SA 版权协议。