本文介绍 A* 搜索算法。

A* 搜索算法(A* search algorithm,A* 读作 A-star),简称 A* 算法,是一种在带权有向图上,找到给定起点与终点之间的最短路径的算法。它属于图遍历(graph traversal)和最佳优先搜索算法(best-first search),亦是 BFS 的改进。

过程

A* 算法的目标是找到有向图上从起点 到终点 的最短路径。设 为结点 之间的距离,也就是它们之间最短路径的长度。记 为从起点 到结点 的距离函数, 为从结点 到终点 的距离函数, 的一个估计 1。最后,记从 出发经由 到达 的最短路径长度的估计为

搜索时,A* 算法每次从优先队列中取出一个 最小的结点。然后,将它的所有后继结点 都推入优先队列中,并利用实际记录的 和估计的 更新

性质

由于 的实际值在搜索的时候是未知的,所以,需要使用容易计算的 作为它的估计。A* 搜索的实际复杂度就取决于这一估计函数 的性质。容易想象,如果 ,也就是说,估计是精确的,那么,搜索过程就会严格按照最短路径前进。而如果 ,那么,A* 算法就退化为 Dijkstra 算法;当 并且边权为 时,这就是 BFS

假设图没有负权边。如果估计 永远不超过实际距离 ,即 ,那么,A* 算法就一定能够找到最优解。满足这一条件的估计函数 称为 可采纳的(admissible)。根据前文的讨论, 越接近 ,相应的 A* 算法效率就越高。一般来说,在最差情形中,算法会经过所有满足

的结点,其中, 是起点 和终点 之间的最短距离。直觉上, 越接近 ,每次扩展时,能够满足该条件的后继结点就越少,因此,算法搜索到的分支就越少。所以,A* 算法可以看作是对搜索算法的一种「剪枝」优化。

如果 不仅是可采纳的,还是 一致的(consistent),即

那么,A* 算法不会将已经弹出队列的结点再次加入队列。一致性条件,可以理解为结点 之间的三角形不等式。

例题

A* 算法的一个经典应用是解决 k 短路问题。关于该问题的描述、A* 做法,以及复杂度更优的可持久化可并堆做法,请移步 k 短路问题 页面。

本节介绍一个可以用 A* 算法解决的经典问题。

的棋盘上,摆有八个棋子,每个棋子上标有 的某一数字。棋盘中留有一个空格,空格用 来表示。空格周围的棋子可以移到空格中,这样原来的位置就会变成空格。给出一种初始布局和目标布局(为了使题目简单,设目标状态如下),找到一种从初始布局到目标布局最少步骤的移动方法。

参考资料与注释

Footnotes

  1. 此处的 意为 heuristic。详见 启发式搜索 - 维基百科A* search algorithm - Wikipedia 的 Bounded relaxation 一节。