首页 > 代码库 > 数据库distinct、union、exists等技术总结

数据库distinct、union、exists等技术总结

一、mysql distinct技术点

1,创建table

create table t1 (id varchar, name varchar);

2,插入数据:

insert into t1 values(1,a);

insert into t1 values(2,b);

insert into t1 values(3,c);

insert into t1 values(4,c);

insert into t1 values(5,b);

3,查询不重复name

select distinct name from t1,得到abc

4,查询nameid字段:

select distinct nameid from t1,得到全部数据

即,只有当nameid都相同时,重复的记录才被排除

5,将distinct放在id后:

select id, distinct name from table,结果报错!

6,得到name不重复的每条记录:

select *,count(distinct name) from t1 group by name

二、union union all distinct技术点

1,  union合并后再进行distinct

2,  union all合并后不进行distinct

3,  (a) union = union all + distinct(b) union != distinct + union all

4,  对于3的理解(a)(b)的不同在于执行顺序

5,  只有当数据量级小的时候(如千条以下),没有明显的查询效率;当数据量级大时,应采用临时表merge策略替换union,用exists替换distinct

三、用EXISTS替换DISTINCT技术点

1,  示例:

SELECT DISTINCT DEPT_NO,DEPT_NAME FROM DEPT D , EMP E WHERED.DEPT_NO = E.DEPT_NO;   低效

SELECT DEPT_NO,DEPT_NAME FROM DEPT D WHERE EXISTS ( SELECT‘X‘ FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO);  高效

SELECT DEPT_NO,DEPT_NAME FROM DEPT, (SELECT DISTINCTDEPT_NO FROM EMP) TMP WHERE DEPT.DEPT_NO=TMP.DEPT_NO;  避免使用

2,解析:

   当提交一个包含一对多表信息(比如部门表和雇员表)的查询时,避免在SELECT子句中使用DISTINCT. 一般可以考虑用EXIST替换, EXISTS 使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果。

   用EXISTS的确可以替代DISTINCT,不过以上方案仅适合DEPT_NO为唯一主键的情况。

3,参考,如果要去掉重复记录,需参照以下方法:

SELECT * FROM EMP WHERE DEPT_NO EXISTS(select Max(DEPT_NO)FROM DEPT D , EMP E WHERE E.DEPT_NO = D.DEPT_NO GROUP BY D.DEPT_NO)

四、IN和EXISTS效率技术点

A(小表),表B(大表)

    select *from B where cc in (select cc from A)

这个语句中是先从A表中把cc找出来,然后根据cc再在B中去找相关的cc 由于A表的cc远小于B表的cc 所以可以节省时间。

    select *from B exists (select cc from A where cc=B.cc)

这句话是先从B表里把cc找出来然后再在A表里找相关的cc  由于B表的cc远多于A表的cc 所以这样做很浪费时间。

 

    总结: 外大内小用IN,外小内大用EXISTS


本文出自 “aeaiesb” 博客,请务必保留此出处http://aeaiesb.blog.51cto.com/9300472/1566697

数据库distinct、union、exists等技术总结