首页 > 代码库 > 锋利的SQL2014:层次结构操作之Hierarchyid

锋利的SQL2014:层次结构操作之Hierarchyid

8.6.4节介绍了使用递归CTE查询层次结构数据的方法,本节将介绍一种使用hierarchyid数据类型解决此问题的方法。Hierarchyid数据类型是从SQL Server2008开始提供的,专门用于解决层次结构问题。

hierarchyid使用“/”符号来表示层次结构,如顶层(根节点)为“/”,其后的子节点可以是“/1/”、“/2/”等。再之后的节点可以是“/1/1/”、“/2/1/”,其中,“/1/1/”的父级是“/1/”,“/2/1/”的父级是“/2/”。在表中,这种层次结构是以16进制方式存储的。

hierarchyid实际上是CLR数据类型,因此与其他数据类型不同的是,它具有一些进行层次节点检索的方法,如表19-26所示。

19-26                                                    hierarchyid的方法

stu_name

exam_date

child.GetAncestor(n)

返回child的第n层节点的hierarchyid

parent.GetDescendant(child1  , child2)

返回作为父节点后代的一个子节点hierarchyid

如果父级为NULL,则返回NULL

如果父级不为NULL,而child1child2NULL,则返回父级的子级;

如果父级和child1不为NULL,而child2NULL,则返回一个大于child1的父级的子级;

如果父级和child2不为NULL,而child1NULL,则返回一个小于child2的父级的子级;

如果父级、child1child2都不为NULL,则返回一个大于child1且小于child2的父级的子级;

如果child1不为NULL且不是父级的子级,则引发异常;

如果child2不为NULL且不是父级的子级,则引发异常;

如果child1>=child2,则引发异常。

node.GetLevel( )

用于确定当前层次的深度(级别),最顶层(根节点)为0,然后依次加1

hierarchyid::GetRoot( )

返回最顶层(根节点)的hierarchyid

child.IsDescendantOf ( parent )

用于判断child节点是否是parent的后代,如果是,返回1;否则,返回0

node.ToString( )node.Parse(  )

在表中,hierarchyid是以16进制方式表示的。ToString( )用于将16进制转换为表示层次结构的字符串,Parse( )则反之。

node.GetReparentedValue ( oldRoot, newRoot )

用于通过将节点从oldRoot移动到newRoot来修改层次树。

首先使用下面的代码来创建示例表。注意,其中的Org_Level属于计算列,它使用GetLevel方法计算Org_Node中的当前层次的深度。在插入层次数据时,可以直接使用“/1/”形式的字符串,SQL Server会自动转换存储为16进制格式。

IFOBJECT_ID(‘dbo.Employees‘, ‘U‘) IS NOT NULL

DROP TABLE dbo.Employees;

 

CREATE TABLE dbo.Employees

(

   Org_Node hierarchyid NOT NULL,

   EmployeeId INT NOT NULL,

   Title VARCHAR(50) NOT NULL,

   Org_Level AS Org_Node.GetLevel()

);

GO

 

--插入员工数据,注意第一个列的格式,用于说明层级结构,以/开始和结束

INSERT INTO dbo.EmployeesVALUES

  (‘/‘,1,‘总经理‘),

  (‘/1/‘,2,‘副总经理A‘),

  (‘/2/‘,3,‘副总经理B‘),

  (‘/1/1/‘,4,‘部门经理A‘),

  (‘/1/2/‘,5,‘部门经理B‘),

  (‘/1/1/1/‘,6,‘员工A‘);

执行下面的语句,查看dbo.Employees中数据,可以看到Org_Node列中以16进制存储的节点数据,如表19-27所示。

SELECT *,

        Org_Node.ToString() AS Org_Node_Str

FROM dbo.Employees;

19-27                                              dbo.Employees中的数据

Org_Node

EmployeeId

Title

Org_Level

Org_Node_Str

0x

1

总经理

0

/

0x58

2

副总经理A

1

/1/

0x68

3

副总经理B

1

/2/

0x5AC0

4

部门经理A

2

/1/1/

0x5B40

5

部门经理B

2

/1/2/

0x5AD6

6

员工A

3

/1/1/1/

19.8.1  检索祖先节点

IsDescendantOf方法可以判断指定节点是否是另一个节点的后代,如果是,则返回1。下面的示例包含两个步骤,第一条SELECT语句用于获得EmployeeId4雇员(即部门经理A)的hierarchyid,将其存储在@EmpNode变量中。@EmpNode的数据类型为hierarchyid,因此可以使用IsDescendantOf方法。第二条SELECT语句则是根据获得hierarchyid(即“/1/1/”),从表中检索“/1/1/”是其后代的节点。

DECLARE @EmpNode AShierarchyid;

 

SELECT @EmpNode = Org_Node

FROM dbo.Employees

WHERE EmployeeId = 4;

 

SELECT *,Org_Node.ToString() AS Org_Node_Str

FROM dbo.Employees

WHERE@EmpNode.IsDescendantOf(Org_Node) = 1;

查询结果如表19-28所示。

19-28                                                部门经理A的祖先节点

Org_Node

EmployeeId

Title

Org_Level

Org_Node_Str

0x

1

总经理

0

/

0x58

2

副总经理A

1

/1/

0x5AC0

4

部门经理A

2

/1/1/

19.8.2  检索子树节点

将上面第二条SELECT语句中@EmpNodeOrg_Node调换一下位置,就可以检索指定节点的子树节点。下面的语句判断@EmpNode中的节点是否为当前Org_Node的祖先节点,即检索“/1/1/”节点的子树节点。

DECLARE @EmpNode AS hierarchyid;

 

SELECT @EmpNode = Org_Node

FROM dbo.Employees

WHERE EmployeeId = 4;   --节点为“/1/1/

 

SELECT *,Org_Node.ToString() AS Org_Node_Str

FROM dbo.Employees

WHERE Org_Node.IsDescendantOf(@EmpNode)= 1;

查询结果如表19-29所示。

19-29                                                部门经理A的子树节点

Org_Node

EmployeeId

Title

Org_Level

Org_Node_Str

0x5AC0

4

部门经理A

2

/1/1/

0x5AD6

6

员工A

3

/1/1/1/

在实际应用环境中,处于性能考虑,通常是仅读取必要层次的数据,而不是像上面这样全部读取。例如,为了填充一个组织的树形结构,我们可能仅填充树形的主干,当用户单击主干的某个节点时再读取其中的数据。hierarchyidGetAncestor方法就提供了这种分层检索功能。例如,下面的语句用于返回根节点的第一层数据,即副总经理级,查询结果如表19-30所示。

DECLARE @EmpNode AShierarchyid;

SELECT @EmpNode = CAST(‘/‘AS hierarchyid);

 

SELECT *,Org_Node.ToString() AS Org_Node_Str

FROM dbo.Employees

WHEREOrg_Node.GetAncestor(1) = @EmpNode;

19-30                                                   根节点的第一层数据

Org_Node

EmployeeId

Title

Org_Level

Org_Node_Str

0x58

2

副总经理A

1

/1/

0x68

3

副总经理B

1

/2/

使用GetAncestor(0)会返回当前层级的数据。对于上面的语句而言,返回的是根节点的数据。

19.8.3  插入新节点

可以像前面创建表时那样,直接指定节点层次来插入节点,例如,下面的语句在部门经理B下新增了一名雇员。

INSERT INTO dbo.EmployeesVALUES

  (‘/1/2/1/‘,7,‘员工B‘);

但是在层次比较多时,这种方式很有可能因为疏忽而造成节点隶属关系错误。比较有效的方法是使用GetDescendant方法。例如,下面的示例中第一条SELECT语句用于获得部门经理B的节点(即“/1/2/”),第二条SELECT语句用于获得部门经理B下面员工B的节点(即“/1/2/1/”),INSERT语句的作用是在部门经理B下面、员工B的后面新增一个节点(即“/1/2/2/”)。

DECLARE @Manager AShierarchyid, @Child1 AS hierarchyid;

 

SELECT @Manager = Org_Node

FROM dbo.Employees

WHERE EmployeeId = 5;  --获取部门经理B的节点

 

SELECT @Child1 = Org_Node

FROM dbo.Employees

WHERE EmployeeId = 7;  --获取上面语句新增员工B的节点

 

INSERT INTO dbo.EmployeesVALUES  --在“/1/2/1/”后面新增一个节点

  (@Manager.GetDescendant(@Child1, NULL), 8, ‘员工C‘);

执行下面的语句,查询结果如表19-31所示。

SELECT *, Org_Node.ToString()AS Org_Node_Str

FROM dbo.Employees;

19-31                                  使用GetDescendant插入节点后的数据

Org_Node

EmployeeId

Title

Org_Level

Org_Node_Str

0x

1

总经理

0

/

0x58

2

副总经理A

1

/1/

0x68

3

副总经理B

1

/2/

0x5AC0

4

部门经理A

2

/1/1/

0x5B40

5

部门经理B

2

/1/2/

0x5AD6

6

员工A

3

/1/1/1/

0x5B56

7

员工B

3

/1/2/1/

0x5B5A

8

员工C

3

/1/2/2/

对于父节点具有子节点的情况,应当像上面这样为GetDescendant指定Child1参数。如果没有,则可以使用NULL代替。例如,由表19-31可以看出,副总经理B下面没有节点,如果需要在其下面插入一个子节点,就可以使用NULL。参考下面的语句:

DECLARE @Manager AShierarchyid;

 

SELECT @Manager = Org_Node

FROM dbo.Employees

WHERE EmployeeId = 3;  --获取副总经理B的节点

 

INSERT INTO dbo.EmployeesVALUES  --在“/2/”下面新增一个节点

  (@Manager.GetDescendant(NULL, NULL), 9, ‘部门经理C‘);

部门经理C的节点为“/2/1/”。

如果需要在员工B和员工C之间插入一个节点,应当同时指定Child1Child2参数。参考下面的语句:

DECLARE @Manager AShierarchyid,

        @Child1 AS hierarchyid,

        @Child2 AS hierarchyid;

 

SELECT @Manager = Org_Node

FROM dbo.Employees

WHERE EmployeeId = 5;  --获取部门经理B的节点

 

SELECT @Child1 = Org_Node

FROM dbo.Employees

WHERE EmployeeId = 7;  --获取员工B的节点

 

SELECT @Child2 = Org_Node

FROM dbo.Employees

WHERE EmployeeId = 8;  --获取员工C的节点

 

INSERT INTO dbo.EmployeesVALUES 

  (@Manager.GetDescendant(@Child1, @Child2),10, ‘员工D‘);

执行下面的语句,查询结果如表19-32所示。可以看到,节点使用了小数格式,即“/1/2/1.1/”。

SELECT *,Org_Node.ToString() AS Org_Node_Str

FROM dbo.Employees;

19-32                                        在员工B和员工C之间插入节点

Org_Node

EmployeeId

Title

Org_Level

Org_Node_Str

0x

1

总经理

0

/

0x58

2

副总经理A

1

/1/

0x68

3

副总经理B

1

/2/

0x5AC0

4

部门经理A

2

/1/1/

0x5B40

5

部门经理B

2

/1/2/

0x5AD6

6

员工A

3

/1/1/1/

0x5B56

7

员工B

3

/1/2/1/

0x5B5A

8

员工C

3

/1/2/2/

0x6AC0

9

部门经理C

2

/2/1/

0x5B58B0

10

员工D

3

/1/2/1.1/

19.8.4  变更节点位置

变更节点位置应当使用GetReparentedValue方法,该方法接受两个参数,一个是原节点的hierarchyid,另一个是目标节点hierarchyid。由表19-32可以看出,部门经理A隶属于副总经理A,下面的语句将其调整到副总经理B下面。

DECLARE @oldRoot AShierarchyid,

        @newRoot AS hierarchyid;

 

SELECT @oldRoot = Org_Node

FROM dbo.Employees

WHERE EmployeeId = 4;  --当前节点为“/1/1/

 

SELECT @newRoot =CAST(‘/2/1/‘ AS hierarchyid);  --目标结点

 

UPDATE dbo.Employees

SET Org_Node =Org_Node.GetReparentedValue(@oldRoot, @newRoot)

WHEREOrg_Node.IsDescendantOf(@oldRoot) = 1;

执行下面的语句,查询结果如表19-33所示。

SELECT *,Org_Node.ToString() AS Org_Node_Str

FROM dbo.Employees;

19-33                                    将部门经理A移动到副总经理B下面

Org_Node

EmployeeId

Title

Org_Level

Org_Node_Str

0x

1

总经理

0

/

0x58

2

副总经理A

1

/1/

0x68

3

副总经理B

1

/2/

0x6AC0

4

部门经理A

2

/2/1/

0x5B40

5

部门经理B

2

/1/2/

0x5AD6

6

员工A

3

/2/1/1/

0x5B56

7

员工B

3

/1/2/1/

0x5B5A

8

员工C

3

/1/2/2/

0x6AC0

9

部门经理C

2

/2/1/

0x5B58B0

10

员工D

3

/1/2/1.1/

可以看到,部门经理A的节点变成了“/2/1/”,成功地变更到副总经理B下面。但是,这里存在一个问题,就是部门经理A与部门经理Chierarchyid是相同的,出现了重复值,hierarchyid数据类型虽然用于表示层次结构,但它并不强制实现层次结构,层次的准确性由用户自己掌控。当然,可以通过为hierarchyid类型列建立唯一索引的方式避免出现重复条目。当然,出现此问题的原因是我们没有判断副总经理B下面层级中的最大hierarchyid值,错误地指定了一个已存在hierarchyid。下面来看一下正确的解决方法。

首先使用下面的语句恢复数据的原状。

UPDATE dbo.Employees

SET Org_Node = ‘/1/1/‘

WHERE EmployeeId = 4;

 

UPDATE dbo.Employees

SET Org_Node = ‘/1/1/1/‘

WHERE EmployeeId = 6;

 

下面的语句创建了一个存储过程,可以实现节点的变更。该过程接受两个参数,一个是需要调整雇员的D,另一个是其目标管理人员的ID。注意第三条SELECT语句中MAX函数和GetAncestor方法的使用,该语句的作用是在目标管理人员下一层级最大hierarchyid值的基础上获得一个新的hierarchyid值。

CREATE PROCEDUREMoveOrg(@EmpID int, @newMgrID int )

AS

BEGIN

  DECLARE @nold hierarchyid, @nnew hierarchyid

  SELECT @nold = Org_Node FROM dbo.EmployeesWHERE EmployeeId = @EmpID ;

 

  SET TRANSACTION ISOLATION LEVEL SERIALIZABLE

  BEGIN TRANSACTION

    SELECT @nnew = Org_Node FROM dbo.EmployeesWHERE EmployeeId = @newMgrID ;

 

    SELECT @nnew = @nnew.GetDescendant(MAX(Org_Node), NULL)

    FROM dbo.Employees WHERE Org_Node.GetAncestor(1)=@nnew ;

 

    UPDATE dbo.Employees 

    SET Org_Node =Org_Node.GetReparentedValue(@nold, @nnew)

    WHERE Org_Node.IsDescendantOf(@nold) = 1 ;

 

  COMMIT TRANSACTION

END ;

执行存储过程,可以看到部门经理A成功地调整到了副总经理B下面,并且部门经理Ahierarchyid值是在层级最大值“/2/1/”的基础上递增获得“/2/2/”。查询结果如表19-34所示。

EXECUTE  dbo.MoveOrg 4, 3;  --执行存储过程

 

SELECT *,Org_Node.ToString() AS Org_Node_Str

FROM dbo.Employees;

19-34                        使用存储过程将部门经理A移动到副总经理B下面

Org_Node

EmployeeId

Title

Org_Level

Org_Node_Str

0x

1

总经理

0

/

0x58

2

副总经理A

1

/1/

0x68

3

副总经理B

1

/2/

0x6B40

4

部门经理A

2

/2/2/

0x5B40

5

部门经理B

2

/1/2/

0x6B56

6

员工A

3

/2/2/1/

0x5B56

7

员工B

3

/1/2/1/

0x5B5A

8

员工C

3

/1/2/2/

0x6AC0

9

部门经理C

2

/2/1/

0x5B58B0

10

员工D

3

/1/2/1.1/

19.8.5  hierarchyid的索引策略

用于对分层数据进行索引的策略有两种:深度优先和广度优先。深度优先索引,子树中各行的存储位置相邻,简而言之,就是以hierarchyid值排序的方式存储,如图19-2所示。对于本节的示例而言,就是经理管理的所有雇员都存储在其经理的记录附近。

技术分享

图19-2  深度优先索引策略

下面的语句基于Org_Node列,创建了深度优先索引。

CREATE UNIQUE INDEXOrgNode_Depth_First

ON dbo.Employees(Org_Node);

下面的查询语句按Org_Node排序输出,注意其中的Org_Node_Str列,这就是深度优先的索引存储方式。如表19-35所示。

SELECT *,Org_Node.ToString() AS Org_Node_Str

FROM dbo.Employees

ORDER BY Org_Node;

19-35                                               深度优先的索引存储方式

Org_Node

EmployeeId

Title

Org_Level

Org_Node_Str

0x

1

总经理

0

/

0x58

2

副总经理A

1

/1/

0x5B40

5

部门经理B

2

/1/2/

0x5B56

7

员工B

3

/1/2/1/

0x5B58B0

10

员工D

3

/1/2/1.1/

0x5B5A

8

员工C

3

/1/2/2/

0x68

3

副总经理B

1

/2/

0x6AC0

9

部门经理C

2

/2/1/

0x6B40

4

部门经理A

2

/2/2/

0x6B56

6

员工A

3

/2/2/1/

广度优先索引,是将层次结构中每个级别的各行存储在一起,简而言之,就是按层级排序的方式存储,如图19-3所示。对于本节的示例而言,同一经理直属的各雇员的记录存储在相邻位置。

技术分享

图19-3  广度优先索引策略

下面的语句基于Org_Node列,创建了广度优先索引。

CREATE CLUSTERED INDEXOrgNode_Breadth_First

ONdbo.Employees(Org_Level);

下面的查询语句按Org_Level排序输出,注意其中的Org_Level列,这就是广度优先的索引存储方式。如表19-36所示。

SELECT *,Org_Node.ToString() AS Org_Node_Str

FROM dbo.Employees

ORDER BY Org_Level;

19-36                                               广度优先的索引存储方式

Org_Node

EmployeeId

Title

Org_Level

Org_Node_Str

0x

1

总经理

0

/

0x58

2

副总经理A

1

/1/

0x68

3

副总经理B

1

/2/

0x6B40

4

部门经理A

2

/2/2/

0x5B40

5

部门经理B

2

/1/2/

0x6AC0

9

部门经理C

2

/2/1/

0x5B58B0

10

员工D

3

/1/2/1.1/

0x6B56

6

员工A

3

/2/2/1/

0x5B5A

8

员工C

3

/1/2/2/

0x5B56

7

员工B

3

/1/2/1/

 

锋利的SQL2014:层次结构操作之Hierarchyid