随笔-80  评论-24  文章-0  trackbacks-0

在树这种数据结构中,有时候需要知道两个节点的最近的公共祖先。
我们经常只需要知道某两个节点的公共祖先,这样最简单的递归算法即可解决问题,分析如下:

1、对于当前节点t,如果其是要查询的两个节点a和b中的一个,则直接返回t;
2、否则如果a和b都在t的左子树或者右子树中,则递归左子树或右子树
3、直到a和b分属t的左子树与右子树为止。

后序遍历二叉树的递归算法如下:

 1 typedef struct lca
 2 {
 3     int data;
 4     struct lca *left, *right;
 5 } lca;
 6 
 7 int LCA(lca *root, lca *a, lca *b, lca **result)
 8 {
 9     int l, r;
10     if (root == NULL)
11         return 0;
12     if ((l = LCA(root->left, a, b, result)) == 2return 2;
13     if ((r = LCA(root->right, a, b, result)) == 2return 2;
14     if (l + r == 2) { *result = root; return 2; }
15     if (root == a || root == b) {
16         if (l + r == 1) { *result = root; return 2; }
17         return 1;
18     }
19     return l + r;
20 }
21 


算法结果即最近公共祖先节点在result中。

不过有时候我们的查询量很大,针对同一颗树有成百上千次查询,这样上面的算法效率就太低了,不过不要急,Tarjan算法派上用场了~
Tarjan算法是一种离线算法,意思就是给定一棵树,然后给定若干询问,先缓存所有询问,然后再一次性的给出所有询问的回答。
设定如下数据结构:

1 vector<int> tree[MAX_NODE];
2 vector<int> query[MAX_QUERY];


由上面可知,树是有邻接表存储的(这样也是为了节约空间)。对于查询,如(3, 5),query[3][5] 和query[5][3]都需要被置为1。
先看模板吧:

 1 int find(int x)
 2 {
 3     if (x == parent[x])
 4     {
 5         return x;
 6     }
 7     else
 8     {
 9         parent[x] = find(parent[x]);
10     }
11 
12     return parent[x];
13 }
14 
15 void merge(int x, int y)
16 {
17     parent[y] = x;
18 }
19 
20 void LCA_Tarjan(int u)
21 {
22     int i;
23     parent[u] = u;
24 
25     for (i = 0; i < tree[u].size(); ++i)
26     {
27         LCA_Tarjan(tree[u][i]);
28         merge(u, tree[u][i]);
29         anscestor[find(u)] = u;
30     }
31 
32     checked[u] = 1;
33 
34     for (i = 0; i < query[u].size(); ++i)
35     {
36         if (checked[query[u][i]] == 1)
37         {
38             res = anscestor[find(query[u][i])];
39         }
40     }
41 }
42 


其中find(x)、merge(x, y)是并查集(不知道并查集?去翻翻《算法导论》吧!)的标准操作,函数功能分别是寻找x的根节点;合并x和y这两棵树,将y的根节点的父指针指向x。
核心操作当然是LCA_Tarjan(u)了。它的思想如下:
1、看递归就知道其实还是深度遍历这棵树;
2、首先使当前节点u的父指针指向自己;
3、处理u的所有孩子节点,每处理完一个孩子节点就让孩子节点的父指针指向u,即将孩子节点所在的集合与u的集合合并;
4、u的全部孩子处理完毕则将u标记为处理结束,即checked[u] = 1;
5、处理所有和u相关的询问,比如query[u][i] = v,则如果v已经被处理结束,则u和v必然处在一棵并查集树上,并且这棵树的根节点一定是他们的公共祖先
(为什么?画图找实例然后手动运行一遍不难理解,因为每个节点(比如为x)运行完之后就将x的父指针指向它的父亲(这时父亲节点的父指针依然指向自己),然后再去运行x的兄弟节点,这时兄弟节点下的某个节点(比如y)如果在查询中,且查询如果恰好是(y, x的子孙),则x所在并查集树中的根节点一定是x的父节点,而这个父节点也是y的祖先,因此可知(y, x的子孙)的祖先一定包含x的父节点,由上面过程知道不能可包含比x的父节点更低的祖先节点,因此x的祖先节点必然是(y, x的子孙)的最近公共祖先);这样说必然很难理解,不过找个真正的实例运行一遍就一目了然了~

posted on 2011-05-12 21:42 myjfm 阅读(3157) 评论(0)  编辑 收藏 引用 所属分类: 算法基础

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   博问   Chat2DB   管理