首页 > 代码库 > Sql语句优化——查询两表不同行NOT IN、NOT EXISTS、连接查询Left Join

Sql语句优化——查询两表不同行NOT IN、NOT EXISTS、连接查询Left Join

       在实际开发中,我们往往需要比较两个或多个表数据的差别,比较那些数据相同那些数据不相同,这时我们有一下三种方法可以使用:1. IN或NOT IN,2. EXIST或NOTEXIST,3.使用连接查询(inner join,left join 或者 right join)。

看下面的数据,我们准备选择出在depart_info中的pid在user_info中不存在的depart_信息。

有表1:depart_info

                 技术分享

   表2:user_info

               技术分享


   方法一:采用NOT IN

   IN和NOT IN后面接的是一个集合,in 是把外表和内表作hash 连接。

 

   SELECT d.* FROM depart_info d WHERE NOT EXISTS (SELECT * FROM user_info u WHERE d.pid = u.pid);

  经测试耗时在0.002s左右。


  方法二:采用NOT EXISTS

  EXISTS 和 NOT EXISTS是对外表作loop循环,每次loop循环再对内表进行查询,

  

  SELECT d.* FROM depart_info d WHERE NOT EXISTS (SELECT * FROM user_info u WHERE d.pid = u.pid);

经测试耗时在0.002s左右。


 方法三:采用连接查询

   连接查询包括:

     1、自连接(join 等同于inner join ):查询结果为两边都存在的数据

     2、左连接 left join :返回左边全部数据,右边存在返回,不存在为null

    3、 右连接 right join :返回右边全部数据,左边存在返回,不存在为null

    4、 全连接 full join :只要某个表中存在就返回,另一个不存在为nul


   SELECT d.* FROM depart_info d LEFT JOIN user_info u ON d.pid = u.pid WHERE u.pid IS NULL ;

 经测试耗时在0.001s左右

     技术分享


总结:

     1、对于小量数据exists 和in差不多,如果数据较多的话(在百万行)建议使用exists,更好的话使用关联查询。

      2、数量较小,如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in。

     3、如果子查询中返回的任意一条记录含有空值,则IN查询将不返回任何记录,这点需注意。

    4、返回数据是两个表的多个字段数据,建议使用关联查询。不仅速度快,而且返回数据可以自定义。

Sql语句优化——查询两表不同行NOT IN、NOT EXISTS、连接查询Left Join