首页 > 代码库 > SQL Server排名函数与排名开窗函数

SQL Server排名函数与排名开窗函数

什么是排名函数?说实话我也不甚清楚,我知道 order by 是排序用的,那么什么又是排名函数呢?

接下来看几个示例就明白了。

首先建立一个表,随便插入一些数据。

技术分享

ROW_NUMBER 函数:直接排序,ROW_NUMBER函数是以上升进行直接排序,并且以连续的顺序给每一行数据一个唯一的序号。(即排名连续)

1 -- 以下是根据 U_Pwd 这一列进行排名(升序)
2 select *,
3 +convert(varchar,ROW_NUMBER() over(order by U_Pwd))+ RowNum
4 from UserInfo

技术分享

RANK 函数:并列排序,在 order by 子句中指定的列,如果返回一行数据与另一行具有相同的值,rank函数将给这些行赋予相同的排名数值。

在排名的过程中,保持一个内部计数值,当值有所改变时,排名序号将有一个跳跃。(即排名不连续)

1 -- 以下是根据 U_Pwd 这一列进行排名(升序)
2 select *,
3 +convert(varchar,rank() over(order by U_Pwd))+ RowNum
4 from UserInfo

技术分享

可以明确的看到有4行数据并列第2名,然后直接就是第6名,这是因为 order by 子句中指定的列 U_Pwd 的值相同。

DENSE_RANK 函数:并列排序,这一点与 RANK() 函数类似,order by 子句指定的列的值相同,排名数值相同,但是后面是连续的。(即排名连续)

1 -- 以下是根据 U_Pwd 这一列进行排名(升序)
2 select *,
3 +convert(varchar,DENSE_RANK() over(order by U_Pwd))+ RowNum
4 from UserInfo

技术分享

可以看到即使有4行数据并列第2名,但是接下来依然是第3名。

NTILE 函数:将查询的结果分发到指定数量的组中。 各个组有编号,编号从1开始。 对于每一行,NTILE 将返回此行所属的组的编号。

组中的行数计算方式为 total_num_rows(结果集的总行数) / num_groups(指定的组数)。

如果有余数 n,则前面 n 个组获得一个附加行。因此,可能不会所有组都获得相等数量的行,但是组大小最大只可能相差一行。

例如,如果总行数是 53,组数是 5,53 / 5 等于10余数是3,按上面个规则就是,每组分配10行,又因余数为3,所以前面3组每组附加一行。

则前三个组每组包含 11 行,其余两个组每组包含 10 行。

另一方面,如果总行数可被组数整除,则行数将在组之间平均分布。 例如,如果总行数为 50,有五个组,则每组将包含 10 行。

1 -- 以下是根据 U_Pwd 这一列进行分组
2 select *,
3 +convert(varchar,NTILE(3) over(order by U_Pwd))+ RowNum
4 from UserInfo

技术分享

这个表中有10条数据,指定分为3组,10/3等于3余数1。

PS:排名函数后面必须有 over() 子句。

 

排名开窗函数:

ROW_NUMBER、DENSE_RANK、RANK、NTILE属于排名函数,OVER()就是窗口函数。

窗口函数OVER()指定一组行,开窗函数计算从窗口函数输出的结果集中各行的值。

开窗函数不需要使用GROUP BY就可以对数据进行分组,还可以同时返回基础行的列和聚合列。

排名开窗函数可以单独使用ORDER BY 语句,也可以和PARTITION BY同时使用。

ODER BY 指定排名开窗函数的顺序。在排名开窗函数中必须使用ORDER BY语句。

PARTITION BY用于将结果集进行分组,开窗函数应用于每一组。

1 -- 以下是先根据 U_Pwd 这一列进行分组,然后每一组再根据 U_Pwd 排序
2 select *,
3 +convert(varchar,ROW_NUMBER() over(partition by U_Pwd order by U_Pwd))+ RowNum
4 from UserInfo

技术分享

因为 U_Pwd 这一列有4种不同的值,所以分为4组,然后 ROW_NUMBER 再在每一组中进行连续排序。

 

1 -- 以下是先根据 U_Pwd 这一列进行分组,然后每一组再根据 U_Pwd 排序
2 select *,
3 +convert(varchar,rank() over(partition by U_Pwd order by U_Pwd))+ RowNum
4 from UserInfo

技术分享

因为 U_Pwd 这一列有4种不同的值,所以同样是分为4组,然后 RANK 再在每一组中进行排序,因为RANK是并列排序,所以全部都是第一名。下面换个字段排序试试看。

1 -- 以下是先根据 U_Pwd 这一列进行分组,然后每一组再根据 U_Name 排序
2 select *,
3 +convert(varchar,rank() over(partition by U_Pwd order by U_Name))+ RowNum
4 from UserInfo

技术分享

 

1 -- 以下是先根据 U_Pwd 这一列进行分组,然后每一组再根据 U_Pwd 排序
2 select *,
3 +convert(varchar,DENSE_RANK() over(partition by U_Pwd order by U_Pwd))+ RowNum
4 from UserInfo

技术分享

因为 U_Pwd 这一列有4种不同的值,所以同样是分为4组,然后 DENSE_RANK 再在每一组中进行排序,因为DENSE_RANK也是并列排序,所以全部都是第一名。下面换个字段排序试试看。

1 -- 以下是先根据 U_Pwd 这一列进行分组,然后每一组再根据 U_Name 排序
2 select *,
3 +convert(varchar,DENSE_RANK() over(partition by U_Pwd order by U_Name))+ RowNum
4 from UserInfo

技术分享

 

1 -- 以下是先根据 U_Pwd 这一列进行分组,然后每一组再根据 NTILE(3) 指定的组数分组,最后在根据 order by 子句指定的字段 U_Pwd 排序 
2 select *,
3 +convert(varchar,NTILE(3) over(partition by U_Pwd order by U_Pwd))+ RowNum
4 from UserInfo

技术分享

因为 U_Pwd 这一列有4种不同的值,所以同样是分为4组。第1组有1条数据,所以就1个区。第2组有4条数据,4/3等于1余数1,所以第2组分为3个区,又因余数为1,所以第1个区附加1行。第3组有3条数据,3/3等于1余数为0,所以第3组有3个区。第4组有2条数据,所以分为2个区。

PS:在排序开窗函数中使用 PARTITION BY 子句需要放置在 ORDER BY子句之前。

 

参考:

http://www.cnblogs.com/jhxk/articles/2531595.html

SQL Server排名函数与排名开窗函数