寻找最近公共祖先

在树这种数据结构中，有时候需要知道两个节点的最近的公共祖先。
我们经常只需要知道某两个节点的公共祖先，这样最简单的递归算法即可解决问题，分析如下：

1、对于当前节点t，如果其是要查询的两个节点a和b中的一个，则直接返回t；
2、否则如果a和b都在t的左子树或者右子树中，则递归左子树或右子树
3、直到a和b分属t的左子树与右子树为止。

后序遍历二叉树的递归算法如下：

1 typedef struct lca
2 {
3     int data;
4     struct lca *left, *right;
5 } lca;
6
7 int LCA(lca *root, lca *a, lca *b, lca **result)
8 {
9     int l, r;
10     if (root == NULL)
11         return 0;
12     if ((l = LCA(root->left, a, b, result)) == 2) return 2;
13     if ((r = LCA(root->right, a, b, result)) == 2) return 2;
14     if (l + r == 2) { *result = root; return 2; }
15     if (root == a || root == b) {
16         if (l + r == 1) { *result = root; return 2; }
17         return 1;
18     }
19     return l + r;
20 }
21

算法结果即最近公共祖先节点在result中。

不过有时候我们的查询量很大，针对同一颗树有成百上千次查询，这样上面的算法效率就太低了，不过不要急，Tarjan算法派上用场了~
Tarjan算法是一种离线算法，意思就是给定一棵树，然后给定若干询问，先缓存所有询问，然后再一次性的给出所有询问的回答。
设定如下数据结构：

1 vector<int> tree[MAX_NODE];
2 vector<int> query[MAX_QUERY];

由上面可知，树是有邻接表存储的(这样也是为了节约空间)。对于查询，如(3, 5)，query[3][5] 和query[5][3]都需要被置为1。
先看模板吧：

1 int find(int x)
2 {
3     if (x == parent[x])
4     {
5         return x;
6     }
7     else
8     {
9         parent[x] = find(parent[x]);
10     }
11
12     return parent[x];
13 }
14
15 void merge(int x, int y)
16 {
17     parent[y] = x;
18 }
19
20 void LCA_Tarjan(int u)
21 {
22     int i;
23     parent[u] = u;
24
25     for (i = 0; i < tree[u].size(); ++i)
26     {
27         LCA_Tarjan(tree[u][i]);
28         merge(u, tree[u][i]);
29         anscestor[find(u)] = u;
30     }
31
32     checked[u] = 1;
33
34     for (i = 0; i < query[u].size(); ++i)
35     {
36         if (checked[query[u][i]] == 1)
37         {
38             res = anscestor[find(query[u][i])];
39         }
40     }
41 }
42

其中find(x)、merge(x, y)是并查集（不知道并查集？去翻翻《算法导论》吧！）的标准操作，函数功能分别是寻找x的根节点；合并x和y这两棵树，将y的根节点的父指针指向x。
核心操作当然是LCA_Tarjan(u)了。它的思想如下：
1、看递归就知道其实还是深度遍历这棵树；
2、首先使当前节点u的父指针指向自己；
3、处理u的所有孩子节点，每处理完一个孩子节点就让孩子节点的父指针指向u，即将孩子节点所在的集合与u的集合合并；
4、u的全部孩子处理完毕则将u标记为处理结束，即checked[u] = 1;
5、处理所有和u相关的询问，比如query[u][i] = v，则如果v已经被处理结束，则u和v必然处在一棵并查集树上，并且这棵树的根节点一定是他们的公共祖先(为什么？画图找实例然后手动运行一遍不难理解，因为每个节点(比如为x)运行完之后就将x的父指针指向它的父亲(这时父亲节点的父指针依然指向自己)，然后再去运行x的兄弟节点，这时兄弟节点下的某个节点(比如y)如果在查询中，且查询如果恰好是(y, x的子孙)，则x所在并查集树中的根节点一定是x的父节点，而这个父节点也是y的祖先，因此可知(y, x的子孙)的祖先一定包含x的父节点，由上面过程知道不能可包含比x的父节点更低的祖先节点，因此x的祖先节点必然是(y, x的子孙)的最近公共祖先)；这样说必然很难理解，不过找个真正的实例运行一遍就一目了然了~

posted on 2011-05-12 21:42 myjfm 阅读(3161) 评论(0) 编辑收藏引用所属分类: 算法基础

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！

相关文章: 心急的C小加问题阶乘求和问题过河问题喷水问题的贪心解法会场安排问题求逆序数问题的若干种解法线段树简介 ac自动机求解多模式匹配问题 KMP算法实现及最长公共子串问题几种随机函数的实现

网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

常用链接

留言簿(10)

随笔分类

随笔档案

收藏夹

链接

搜索

最新评论

阅读排行榜

评论排行榜