首页 > 代码库 > LCA问题
LCA问题
基本概念
LCA:树上的最近公共祖先,对于有根树T的两个结点u、v,最近公共祖先LCA(T,u,v)表示一个结点x,满足x是u、v的祖先且x的深度尽可能大。
RMQ:区间最小值查询问题。对于长度为n的数列A,回答若干询问RMQ(A,i,j),返回数列A中下标在[i,j]里的最小值下标。
朴素LCA算法
求出树上每个结点的深度。
对于查询LCA(u,v),用p1、p2指向将u、v,将p1、p2中深度较大的结点不断指向其父结点,直到p1、p2深度相同。
之后p1、p2同步向上移动,直到p1=p2,此时p1、p2所指向的结点就是LCA(u,v)。
LCA向RMQ转化
对有根树进行DFS,将遍历到的结点按顺序记录下来,将会得到一个长度为2N-1的序列,称之为T的欧拉序列F。
每个结点都在欧拉序列中出现,记录结点u在欧拉序列中第一次出现的位置为pos[u]。
记录结点u的深度为dep[u],在深度序列中记录欧拉序列中的结点的深度B[1...2N-1]。
根据DFS的性质,对于两结点u、v,从pos[u]遍历到pos[v]的过程中会经过LCA[u,v],它的深度是深度序列B[pos[u]...pos[v]]中最小的。
那么求LCA(T,u,v),就等价于求RMQ(B,u,v)。
LCA的Tarjan算法
解决LCA问题的Tarjan算法利用并查集在一次DFS(深度优先遍历)中完成所有询问。它是时间复杂度为O(N+Q)的离线算法,这里的Q表示查询次数。
算法DFS有根树T,定义从根节点到当前正在遍历的结点u的路径为活跃路径P。
对于每个已经遍历过的结点x,我们使用并查集将其连接到P上距离其最近的结点F(x)。
记录与u有关的询问集合为Q(u)。
对于Q(u)中的任意一组询问LCA(u, v),如果v已经遍历过,那么答案即为F(v)。
我们只需要维护当前所有以遍历结点的F即可。
代码流程Tarjan_DFS(u):
- 创建并查集u
- 遍历Q(u)中的所有询问(u,v),如果v已经被标记,则Answer(u,v)=v所在集合的根。
- 对于u的每一个儿子v,调用Tarjan_DFS(v)。合并u与v所在的集合,设根为u。
- 标记u。
倍增LCA
与RMQ的ST算法类似,我们令F[i][0]为结点i的第2k个父结点。
则F[i][0]为i的父结点,令w为i的第2k-1个父结点即w=F[i][k-1],那么w的第2k-1个父结点就是i的第2k个父结点即F[i][k]=F[w][k-1]。
在查询LCA时,与朴素LCA类似,先将深度较大的结点u提升到与v的深度相同,而这一次我们利用倍增法,一次提升2k个父结点,加快了算法的效率。
之后,两个结点同时提高2k(k是使2k<=dep[u]最大的正整数)。直到u、v到达同一个结点。那么这个结点就是LCA(u,v)。
倍增法的优点在于,除了能求出LCA(u,v),还可以对树上的路径进行维护。
例如要求出结点u到结点v路径上最大的边权w,我们可以在预处理F[i][k]时,用一个数组maxCost[i][k]记录结点i到它的第2k个父结点的路径上最大的边权。
那么在查询LCA(u,v)的过程中,求出u、v到公共祖先的路径上的最大边权,即u到v的路径上的最大边权。
1 void preprocess(){ 2 for (int i=1;i<=n;i++){ 3 anc[i][0]=fa[i]; 4 maxCost[i][0]=cost[i]; 5 for (int j=1;(1<<j)<n;j++) anc[i][j]=-1; 6 } 7 for (int j=1;(1<<j)<n;j++){ 8 for (int i=1;i<=n;i++){ 9 if (anc[i][j-1]!=-1){ 10 int a=anc[i][j-1]; 11 anc[i][j]=anc[a][j-1]; 12 maxCost[i][j]=max(maxCost[i][j-1],maxCost[a][j-1]); 13 } 14 } 15 } 16 } 17 int query(int p,int q){ 18 int log; 19 if (L[p]<L[q]) swap(p,q); 20 for (log=1;(1<<log)<=L[p];log++);log--; 21 int ans=-INF; 22 for (int i=log;i>=0;i--){ 23 if (L[p]-(1<<i)>=L[q]){ 24 ans=max(ans,maxCost[p][i]); 25 p=anc[p][i]; 26 } 27 } 28 if (p==q) return ans; 29 for (int i=log;i>=0;i--){ 30 if (anc[p][i]!=-1&&anc[p][i]!=anc[q][i]){ 31 ans=max(ans,maxCost[p][i]); 32 p=anc[p][i]; 33 ans=max(ans,maxCost[q][i]); 34 q=anc[q][i]; 35 } 36 } 37 ans=max(ans,cost[p]); 38 ans=max(ans,cost[q]); 39 return ans; 40 }