关于KM算法的详细解释

Posted on 2011-07-23 22:14 Mato_No1 阅读(7540) 评论(9) 编辑收藏引用所属分类: 图算法

【背景（神犇不要鄙视）】
本沙茶今年AHOI的时候，遇到裸的最佳匹配的题，竟然把KM算法搞忘了，幸亏是WJMZBMR神犇保佑，临时乱弄一通，想起来了……这MS反映出了本沙茶以前在看某些经典算法的时候看得不深，木有理解透彻……
前几天又遇到一道最佳匹配的题，发现KM算法竟然又忘了……米办法，只有把这个搞死人的算法的具体过程重新看了一遍，终于懂了……
【KM算法及其具体过程】
（1）可行点标：每个点有一个标号，记lx[i]为X方点i的标号，ly[j]为Y方点j的标号。如果对于图中的任意边(i, j, W)都有lx[i]+ly[j]>=W，则这一组点标是可行的。特别地，对于lx[i]+ly[j]=W的边(i, j, W)，称为可行边；
（2）KM算法的核心思想就是通过修改某些点的标号（但要满足点标始终是可行的），不断增加图中的可行边总数，直到图中存在仅由可行边组成的完全匹配为止，此时这个匹配一定是最佳的（因为由可行点标的的定义，图中的任意一个完全匹配，其边权总和均不大于所有点的标号之和，而仅由可行边组成的完全匹配的边权总和等于所有点的标号之和，故这个匹配是最佳的）。一开始，求出每个点的初始标号：lx[i]=max{e.W|e.x=i}（即每个X方点的初始标号为与这个X方点相关联的权值最大的边的权值），ly[j]=0（即每个Y方点的初始标号为0）。这个初始点标显然是可行的，并且，与任意一个X方点关联的边中至少有一条可行边；
（3）然后，从每个X方点开始DFS增广。DFS增广的过程与最大匹配的Hungary算法基本相同，只是要注意两点：一是只找可行边，二是要把搜索过程中遍历到的X方点全部记下来（可以用vst搞一下），以进行后面的修改；
（4）增广的结果有两种：若成功（找到了增广轨），则该点增广完成，进入下一个点的增广。若失败（没有找到增广轨），则需要改变一些点的标号，使得图中可行边的数量增加。方法为：将所有在增广轨中（就是在增广过程中遍历到）的X方点的标号全部减去一个常数d，所有在增广轨中的Y方点的标号全部加上一个常数d，则对于图中的任意一条边(i, j, W)（i为X方点，j为Y方点）：
<1>i和j都在增广轨中：此时边(i, j)的(lx[i]+ly[j])值不变，也就是这条边的可行性不变（原来是可行边则现在仍是，原来不是则现在仍不是）；
<2>i在增广轨中而j不在：此时边(i, j)的(lx[i]+ly[j])的值减少了d，也就是原来这条边不是可行边（否则j就会被遍历到了），而现在可能是；
<3>j在增广轨中而i不在：此时边(i, j)的(lx[i]+ly[j])的值增加了d，也就是原来这条边不是可行边（若这条边是可行边，则在遍历到j时会紧接着执行DFS(i)，此时i就会被遍历到），现在仍不是；
<4>i和j都不在增广轨中：此时边(i, j)的(lx[i]+ly[j])值不变，也就是这条边的可行性不变。
这样，在进行了这一步修改操作后，图中原来的可行边仍可行，而原来不可行的边现在则可能变为可行边。那么d的值应取多少？显然，整个点标不能失去可行性，也就是对于上述的第<2>类边，其lx[i]+ly[j]>=W这一性质不能被改变，故取所有第<2>类边的(lx[i]+ly[j]-W)的最小值作为d值即可。这样一方面可以保证点标的可行性，另一方面，经过这一步后，图中至少会增加一条可行边。
（5）修改后，继续对这个X方点DFS增广，若还失败则继续修改，直到成功为止；

下面分析整个算法的时间复杂度：每次修改后，图中至少会增加一条可行边，故最多增广M次、修改M次就可以找到仅由可行边组成的完全匹配（除非图中不存在完全匹配，这个可以通过预处理得到），故整个算法的时间复杂度为O(M * (N + 一次修改点标的时间))。而一次修改点标的时间取决于计算d值的时间，如果暴力枚举计算，这一步的时间为O(M)，优化：可以对每个Y方点设立一个slk值，表示在DFS增广过程中，所有搜到的与该Y方点关联的边的(lx+ly-W)的最小值（这样的边的X方点必然在增广轨中）。每次DFS增广前，将所有Y方点的slk值设为+∞，若增广失败，则取所有不在增广轨中的Y方点的slk值的最小值为d值。这样一次修改点标的时间降为O(N)，总时间复杂度降为O(NM)。

需要注意的一点是，在增广过程中需要记下每个X、Y方点是否被遍历到，即fx[i]、fy[j]。因此，在每次增广前（不是对每个X方点增广前）就要将所有fx和fy值清空。

代码：

void init_d()
{
    re(i, n) E[i].pre = E[i].next = i; m = n;
}
void add_edge(int a, int b, int len)
{
    E[m].a = a; E[m].b = b; E[m].len = len; E[m].pre = E[a].pre; E[m].next = a; E[a].pre = m; E[E[m].pre].next = m++;
}
inline int dist(int x, int y, int x0, int y0)
{
    return abs(x - x0) + abs(y - y0);
}
bool dfs(int x)
{
    int y, x0; fx[x] = _FLAG;
    for (int p=E[x].next; p != x; p=E[p].next) {
        y = E[p].b;
        if (lx[x] + ly[y] > E[p].len) {
            if (lx[x] + ly[y] - E[p].len < slk[y]) slk[y] = lx[x] + ly[y] - E[p].len;
        } else if (fy[y] != _FLAG) {
            fy[y] = _FLAG; x0 = z[y];
            if (x0 == -1 || dfs(x0)) {z[y] = x; return 1;}
        }
    }
    return 0;
}
void solve()
{
    re(i, n) {
        lx[i] = -INF;
        for (int p=E[i].next; p != i; p=E[p].next) if (E[p].len > lx[i]) lx[i] = E[p].len;
    }
    re(i, n0) {ly[i] = 0; z[i] = -1;}
    int d;
    re(i, n) {
        re(j, n0) slk[i] = INF; _FLAG++;
        while (!dfs(i)) {
            d = INF; re(j, n0) if (fy[j] != _FLAG && slk[j] < d) d = slk[j];
            re(j, n) if (fx[j] == _FLAG) lx[j] -= d;
            re(j, n0) {slk[j] = INF; if (fy[j] == _FLAG) ly[j] += d;}
            _FLAG++;
        }
    }
    res = 0; re(i, n) res += lx[i]; re(i, n0) res += ly[i];
}

Feedback

# re: 关于KM算法的详细解释回复 更多评论

2011-07-31 12:46 by Fusion

<3>j在增广轨中而i不在：此时边(i, j)的(lx[i]+ly[j])的值增加了d，也就是原来这条边不是可行边（若这条边是可行边，则在遍历到j时会紧接着执行DFS(i)，此时i就会被遍历到），现在仍不是；

这句话的‘若这条边是可行边，则在遍历到j时会紧接着执行DFS(i)，此时i就会被遍历到’好像有点问题吧！
因为遍历到j是时候，应该会直接遍历link[j]（即使与j匹配的点），如果j没有匹配点就退出吧

# re: 关于KM算法的详细解释回复 更多评论

2011-07-31 12:48 by Fusion

@Fusion
link[j]（即是与j匹配的点）

# re: 关于KM算法的详细解释回复 更多评论

2011-12-07 22:52 by dummyshooter

神犇，解释得太透彻了- -

# re: 关于KM算法的详细解释回复 更多评论

2012-02-01 14:47 by user

请问　add_edge　这个函数是作用是？

# re: 关于KM算法的详细解释回复 更多评论

2012-04-26 23:18 by lenohoo

太帅了

# re: 关于KM算法的详细解释[未登录] 回复 更多评论

2012-05-30 19:35 by 123

对鄙人非常有用，真的很谢谢

# re: 关于KM算法的详细解释回复 更多评论

2012-08-09 17:30 by vector

感觉时间复杂度分析不够，虽然每次减去D之后会出现增加一个可行边，但是你不能保证可行边就是以这点为出发的

你说的这句话：若还失败则继续修改，直到成功为止；
所以最多修改M次是不正确的，算法时间复杂度也被低估了

# re: 关于KM算法的详细解释 回复 更多评论

2014-05-22 22:39 by djdxh

ORZ

刷新评论列表

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！

相关文章: 【AHOI2013复仇】两道有关删边后最短路径维护的猥琐题 Tarjan算法——求有向图强连通分支关于KM算法的详细解释 NOI2008 party 2-SAT问题及其算法次小生成树的一种极其神犇的算法次小生成树最小度限制生成树最近捉的一些图论题在二分图中应用Dancing Link边表的一个实例

网站导航: 博客园 IT新闻 BlogJava 知识库博问管理

Mato is No.1

留言簿(21)

随笔分类

随笔档案

搜索

最新评论

阅读排行榜

评论排行榜