U4_2：图论之MST/Prim/Kruskal

文章目录

一、最小生成树-MST
- 生成MST策略
- - 一些定义
- 思路
- 彩蛋
二、普里姆算法（Prim算法）
- 思路
- 算法流程
- - 数据存储
  - - 分析
- 伪代码
- 时间复杂度分析
三、克鲁斯卡尔算法（Kruskal算法）
- 分析
- 算法流程
- - 并查集-Find-set
- 伪代码
- 时间复杂度分析

一、最小生成树-MST

无向图，无环，所有点连通，边权重和最小
(没有权重标注就默认为1）
在这里插入图片描述

生成MST策略

从一个空图开始。
尝试一次添加一条边，始终确保所构建的保持无循环。
如果在添加了每条边之后，我们确定生成的图是某个最小生成树的子集，我们就完成了。

一些定义

集合 $A$ 是最小生成树 $T$ 的子集，当 $A\space U(u,v)$ 也是 $MST$ 子集时， $(u ， v)$ 是安全的。
切割 $c u t$ ： $(S, V - S)$
$a$ $c u t$ $res p ec t s$ $a$ $se t$ $A$ $o f$ $e d g es$ $i f$ $n o$ $e d g es$ $in$ $A$ $crosses$ $t h e$ $c u t$ .
An edge is a light edge crossing a cut if its weight is the minimumof any edge crossing the cut
在这里插入图片描述

思路

(S, V - S) be any cut of G that respects A
(u, v) be a light edge crossing the cut (S, V - S)Then, edge (u, v) is safe for A.
则 lt means that we can find a safe edge by

first finding a cut that respects A
then finding the light edge crossingthat cut
That light edge is a safe edge

彩蛋

本质上下面所要讲的Prim算法和Kruskal算法都是依据这个总思路来的，先分隔cut，然后根据cut找light edge，最后不断生成MST

二、普里姆算法（Prim算法）

思路

首先选择任意顶点r作为树的根。
当树不包含图中的所有顶点时:找到离开树的最短边并将其添加到树中。
这个思路可以想到，每次的cut就是选入作为顶点的集合 $S$ 和未选入的顶点 $G - S$

算法流程

数据存储

区分cut：最初始是空集，所有顶点被标记为白色，选入的顶点标记为黑色
利用优先队列存储
利用优先队列（小顶堆）去寻找 $t h e$ $l i g h es t$ $e d g e$ （相应函数如下）
3. $I n ser t (u, k ey)$ :用键值key在Q中插入u。
4. $u = E x t r a c t - min ()$ :提取键值最小的项。
5. $Decre a se - Key (u, n e w - k ey)$ :将u的键值减小为new-key
利用 $p re d [A]$ 去存储每个顶点的存储顺序

分析

$t h e$ $l i g h es t$ $e d g e$ 本质上是在黑白分界点的这些边中寻找，因此每次更新都需要维护这些点( $k ey$ )。
初始的时候设为 $ini f ini t y$ ，每次加入新顶点时就找到它的所有边判断是否比现在的key是否更小了，如果更小了就可以更新并且换前驱
在这里插入图片描述

伪代码

for u ∈ V docolor[u] ← white,key[u] ← +∞
end
key[u] ← 0,pred[r] ← null;	//最开始的顶点
Q ← new PriQueue(V)   
while Q is  noempty dou ← Q.Extract-Min(); //the lighest edge   for v ∈ adj[u] doif(color[u] ← white && w[u,v] < key[u]) thenkey[u] ← w[u,v]Q.decrease-Key(v,key[u]) pred[v] ← uendendcolor[u] ← black
end

时间复杂度分析

创建优先队列 $O (V l o g V)$ ，每次循环 $E x t r a c t - M in$ 为 $l o g (V)$ ，总共V个顶点，总时间复杂度为 $O (V l o g V)$ 。每次循环 $Decre a se - Key$ 为 $O (l o g V)$ ，因为循环内每次更新都是针对边来说，所有边都遍历一遍，因此循环内总时间复杂度为 $O (El o g V)$ ，总时间复杂度为 $T (n) = O ((V + E) l o g V) = O (El o g V)$

三、克鲁斯卡尔算法（Kruskal算法）

分析

从一个空图开始。
尝试一次添加一条边，始终确保所构建的保持无循环。.
如果我们在每一步都确定生成的图是某个最小生成树的子集，我们就完成了。

与Prim的算法生长一棵树不同，Kruskal的算法生长一组树(森林)。
最初，这个森林只由顶点组成(没有边)。
在每一步中，添加不产生循环的权重最小的边。
继续直到森林“合并”成一棵树。

本质上，也是继承于一说的主算法：
设A为Kruskal算法选择的边集，设(u, v)为下一步要添加的边。这足以说明这一点：
$t h ere$ $i s$ $a$ $c u t$ $t ha t$ $res p ec t s$ $A$
$(u, v)$ $i s$ $t h e$ $l i g h t$ $e d g e$ $cross in g$ $t hi s$ $c u t$
在这里插入图片描述

算法流程

刚开始 $A$ 为空集， $F$ 存入所有边并且从小到大排序，
在F中选择一条权值最小的边e，检查将e加到A上是否形成一个循环。
构成循环，则从F移除
不构成循环，则从F添加进A
F为空集时停止操作

现在有个问题，怎么才能不形成环呢，
在框架算法的每一步中， $(V, A)$ 都是非循环的，因此它是一个森林，一个顶点延申两条枝干，且枝干之间没有路径，这样就是森林。因此：
如果 $u$ 和 $v$ 在同一棵树中，则将边 ${u,v}$ 添加到A中创建一个循环。
如果 $u$ 和 $v$ 不在同一棵树中，那么将边 ${u,v}$ 添加到 $A$ 中不会创建一个循环。

根据这个性质，如果一条边被选中，它的两个端点若在一个树上，那么再将这条边添加进树时，肯定会形成环，根据这一性质，我们可以维护并查集去判断是否成环

并查集-Find-set

本质上，并查集就是一个个树集合，每个元素都唯一指向它的父亲，根节点父亲就是子集，因此每棵树的唯一标识就是根节点。如果两个元素唯一标识一样，那它们就在一棵树上。
在这里插入图片描述

$j u d g e$ $f in d - se t (u)$ $==$ $f in d - se t (v)$ ，维护 $f in d - se t$ 过程如下：

$C re a t e - se t u)$ :创建包含单个元素 $u$ 的集合。 $O (1)$

x.parent ← x

$F in d - se t (u)$ :查找包含元素u的集合(假设每个集合都有唯一的ID，后面可知是树的根节点)。 $O (l o g n)$

while x != x.parent dox ← x.parent
end

$U ni o n (u, v)$ :将分别包含u和v的集合归并为一个公共集合。（当判断完不会形成环后，可以合并). $O (l o g n)$ （找树的根节点费时，其他都是 $O (1)$ 时间）
注意当我们将两棵树合并在一起时，我们总是将高树的根作为矮树的父树。不然会很畸形，费时。
如果两棵树有相同的高度，我们选择第一棵树的根指向第二棵树的根。树的高度增加了1（根节点+被合并的子树，因此高度+1）。其他情况下树的高度都是不变的。

a ← Find-Set(x)
b ← Find-Set(y)
if a.height <= b.height thenif a.height is equal to b.height thenb.hright++;enda.parent ← b
end
elseb.parent ← a
end

伪代码

sort E in increasing order by weight w;
A ← {}
for u ∈ V doCreate-Set(u);
end
for ei ∈E do  //ei两个端点为ui,viif(find-set(ui)!=find-set(vi)) thenadd {ui,vi} to AUnion(ui,vi)end
end
return

时间复杂度分析

排序用时 $O (El o g E)$ ， $cre a t e - se t$ 用时 $O (V)$ ，循环次数是边的次数 $E$ ，每次循环 $u ni o n$ 花费 $l o g (V)$ ，总时间复杂度 $O (El o g V)$ ，因此总花费 $T (n) = O (El o g E)$ （边比顶点多，取大的）