SQL Server调优系列基础篇（联合运算符总结）

首页 > 代码库 > SQL Server调优系列基础篇（联合运算符总结）

SQL Server调优系列基础篇（联合运算符总结）

2024-08-06 13:56:14 218人阅读

前言

上两篇文章我们介绍了查看查询计划的方式，以及一些常用的连接运算符的优化技巧，本篇我们总结联合运算符的使用方式和优化技巧。

废话少说，直接进入本篇的主题。

技术准备

基于SQL Server2008R2版本，利用微软的一个更简洁的案例库（Northwind）进行解析。

一、联合运算符

所谓的联合运算符，其实应用最多的就两种：UNION ALL和UNION。

这两个运算符用法很简单，前者是将两个数据集结果合并，后者则是合并后进行去重操作，如果有过写T-SQL语句的码农都不会陌生。

我们来分析下这两个运算符在执行计划中的显示，举个例子

SELECT FirstName+N‘‘+LastName,City,Country FROM EmployeesUNION ALLSELECT ContactName,City,Country FROM Customers

就是上面这个图标了，这就是UNION ALL联合运算符的图标。

这个联合运算符很简单的操作，将两个数据集合扫描完通过联合将结果汇总。

我们来看一下UNION 这个运算符，例子如下

select City,Country from EmployeesUNIONSELECT City,Country FROM Customers

我们可以看到，UNION 运算符是在串联运算符之后发生了一个Distinct Sort排序操作，经过这个操作会将结果集合中的重复值去掉。

我们一直强调：大数据表的排序是一个非常耗资源的动作！

所以，到这里我们已经找到了可优化的选项，去掉排序，或者更改排序方式。

替换掉Distinct Sort排序操作的方式就是哈序聚合。Distinct Sort排序操作需要的内存和去除重复之前数据集合的数据量成正比，而哈希聚合需要的内存则是和去除重复之后的结果集成正比！

所以如果数据行中重复值很多，那么相比而言通过哈希聚合所消耗的内存会少。

我们来举个例子

select ShipCountry from OrdersUNIONSELECT ShipCountry FROM Orders

这个例子其实没啥用处，这里就是为了演示，我们来看一下结果

我们知道，这张表里这个ShipCountry是存在大面积重复值的，所以采用了哈希匹配来去重操作是最优的方式。

其实，相比哈希匹配连接还有一种更轻量级的去重的连接方式：合并连接

上一篇我已经分析了这个连接方法，用于两个数据集的连接方式，这里其实类似，应用前都必须先将原结果集合排序！

我们知道优化的方式可以采用建立索引来提高排序速度。

我们来重现这种去重方式，我们新建一个表，然后建立索引，代码如下

--新建表SELECT EmployeeID,FirstName+N‘ ‘+LastName AS ContactName,City,CountryINTO NewEmployeesFROM EmployeesGO--添加索引ALTER TABLE NewEmployees ADD CONSTRAINT PK_NewEmployees PRIMARY KEY(EmployeeID)CREATE INDEX ContactName ON NewEmployees(ContactName)CREATE INDEX ContactName ON CUSTOMERS(ContactName)GO--新建查询，这里一定要加上一个显示的Order by才能出现合并连接去重SELECT ContactName FROM NewEmployeesUNION ALLSELECT ContactName FROM CustomersORDER BY ContactName

我们采用索引扫描的方式可以避免显式的排序操作。

我们将UNION ALL改成UNION，该操作将会对两个数据集进行去重操作。

--新建查询，这里一定要加上一个显示的Order by才能出现合并连接去重SELECT ContactName FROM NewEmployeesUNION SELECT ContactName FROM CustomersORDER BY ContactName

这里我们知道UNION操作会对结果进行去重操作，上面应用了流聚合操作，流聚合一般应用于分组操作中，当然这里用它进行了分组去重。

在我们实际的应用环境中，最常用的方式还是合并连接，但是有一种情况最适合哈希连接，那就是一个小表和大表进行联合操作，尤其适合哪种大表中存在大量重复值的情况下。

哈希算法真是个好东西！

参考文献

微软联机丛书逻辑运算符和物理运算符引用
参照书籍《SQL.Server.2005.技术内幕》系列

结语

此篇文章先到此吧，简短一点，便于理解掌握，本篇主要介绍了查询计划中的联合操作运算符，下一篇我们分析SQL Server中的并行运算，在多核超线程云集的今天，来看SQL Server如何利用并行运算来最大化的利用现有硬件资源提升性能，有兴趣可提前关注，关于SQL Server性能调优的内容涉及面很广，后续文章中依次展开分析。

SQL Server这个软件一旦深入进去，你会发现它真的非常深，基本可以用深不见底来描述，如果想研究里面的性能调优这块，可以关注本系列内容，我们一起研究！

而且到现在还有很多人对SQL Server这套产品有误解，或者说观点有待纠正，以前就遇到过客户直接当我面大谈神马SQL Server导入数据一多就宕机了....

神马SQL Server只能做小数据量的应用...神马不如Oracle云云....!!!

还有一部分童鞋单纯的认为SQL Server是小儿科，没啥技术含量...简单的很....

关于这些观点，我不想吐槽啥，我只想让那些真正了解SQL Server的朋友一起来为SQL Server证明点什么。

文章最后给出上一篇的连接

SQL Server调优系列基础篇

SQL Server调优系列基础篇（常用运算符总结）

如果您看了本篇博客,觉得对您有所收获，请不要吝啬您的“推荐”。

SQL Server调优系列基础篇（联合运算符总结）

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > SQL Server调优系列基础篇（联合运算符总结）

SQL Server调优系列基础篇（联合运算符总结）

看完仍有疑问？有类似问题直接问程序猿