首页 > 代码库 > group by 深入总结(转)

group by 深入总结(转)

http://www.cnblogs.com/wangtao_20/archive/2011/02/23/1959792.html

一、不兼容的语法问题。

先看使用如下sql:SELECT count(*),town FROM `players` 结果会报错。从这里涉及到sql的一个原则:值的集合与一个行mysql认为是不兼容的。这里,count(*)的结果是一个值。而town列出的结果是很多行,也就是值组成的集合。所以,两者不不兼容的。

而如果加上group by,就不一样了,如下:

SELECT count(*),town FROM `players` group by sex

上面的sql,并没有报错。因为使用了group by子句后,count(*),town所显示的结果不一样了。count((*)是根据group by子句的要求进行聚合,结果是值组成的集合。右边显示对应的城市(虽然不一定正确和得出子句想要的结果,但语法上通过的)。最后,sql所表示的实际意思是:统计出每个性别所对应多少行。

二、更好地理解group by的内部机制



假如语句是 SELECT sex,name FROM `players` GROUP BY sex
结果如下:
name     sex
王滔  "空值"     
刘惠   女
王小明 男


假如语句是 SELECT name FROM `players` GROUP BY sex

结果如下:
 name
王滔
刘惠
王小明

假如语句是 SELECT sex FROM `players` GROUP BY sex,
结果就是:
 sex
"空值"




理解:group by的原理是将其指定列的值一致的行归为一组。那么,空值也归为一组。
实质上,使用了group by,上面三个sql语句原理是一样的,只是select子句告诉mysql需要的取出的列有不同

SELECT sex FROM `players` GROUP BY sex 与 SELECT sex,name FROM `players` GROUP BY sex没什么区别。
因为group by已经指定了操作方式,select需要显示行的那些列,随时指定。可以理解早就按照group by的要求将所有行就已经分组好了,之后根据需要取每行的哪一列的值了。

通俗理解group by:根据group by指定的列,列值如果相同行划分到一组中去。

一直认为,使用group by显示最后的结果应该是下面这样的:
字段值   a组
字段值   a组
字段值   b组
字段值   b组

实际情况却不是这样

先看测试的一个例子

group by指定一个字段:SELECT * FROM `fanwe_goods` GROUP BY cate_id
大致结果显示类似:
cate_id 其他字段....
40       ....
41       ....
46       ....
48       ....

说明,根据类别cate_id进行分组。结果,每个类只显示了一行数据。

group by指定多个字段:SELECT * FROM `fanwe_goods` GROUP BY cate_i,city_id

结果是将多行取出来了(整个表的所有行没有取出)。结果类似:
cate_id   city_id
40     16
40     20
41     16
41     20
还有一些行和其他字段的值省略了
看cate_id和city_id的值,都有重复的值。不知道怎么计算的,取出的结果还是有意外。

结论:
1.group by 后面指定的列不止一个。当我使用如下语句时,也出现了多行的结果(将该组的所有行都列出来了):
SELECT * FROM players GROUP BY sex, town

2.假如group by 后面只指定了一列,那么即使一个组有多行值。也不会全部取出,只取出一个。这样的情况,是什么原因?
3.分组后,如果select子句想取出某个字段,那么它不可能将都属于a组的记录都取出来。只是从a组中取出一个代表性的值出来。不知道原因,大概是:已经按照group by的规则进行分组后,如果想取出所有

数据,mysql变得无所适从。group by只有在需要进行统计的的时候非常有效。






使用经验:group by常常跟聚合函数count进行使用,这样实现按照分组进行统计的效果。比如:需要统计每个地方的商品数量。那么就按照地方进行分组(同一个地方的先划到一组中),之后使用统计函数,就

是针对组的成员进行统计了。

进行分组之后的好处,是方便按组别进行统计,并不能实现像上面效果(按组别显示出所有行)。如果不是需要进行统计,使用group by,我认为就没有实际意义,因为此时取出的结果比较意外,并不是自己想

要的。也得不到如下结果:
字段值   a组
字段值   a组
字段值   b组
字段值   b组

group by 深入总结(转)