首页 > 代码库 > LINQ Group By操作

LINQ Group By操作

在上篇文章 .NET应用程序与数据库交互的若干问题 这篇文章中,讨论了一个计算热门商圈的问题,现在在这里扩展一下,假设我们需要从两张表中统计出热门商圈,这两张表内容如下:

  • 上表是所有政区,商圈中的餐饮个数,名为FoodDistrict
  • 下表是所有政区,商圈中的SPA个数,名为SPADistrict

现在要把这两张表,根据政区和商圈合并,然后相加Counts,根据Counts的总大小排序,统计热门商圈和热门政区。

 group by

在这里仅讨论合并的问题,以演示在SQLServer和C#中LINQ的实现方法:

通常,我们可以直接通过在SQLServer里面首先通过Union All,然后再通过GroupBy语句来执行查询操作即可满足要求,过程如下:

SELECT  d.CityLocationId ,        d.CityLocationName ,        d.BusinessDistrctID ,        d.BusinessDistrctName ,        SUM(Counts) AS CountsFROM    ( SELECT    *          FROM      FoodDistrict          UNION ALL          SELECT    *          FROM      SPADistrict        ) dGROUP BY d.CityLocationId ,        d.CityLocationName ,        d.BusinessDistrctID ,        d.BusinessDistrctNameORDER BY Counts DESC

执行结果为:

group by result 

这里面需要注意的是,Union和Union All的区别,Union会对相同的记录去重,所以这里采用的是Union All,另外Union或者Union All的两个字表或者查询中,不能够有Order By子句。一般是Union之后再进行Order By。

但是有些时候,以上两张表可能存在与不同的数据库中,或者即使存在同一个数据库中,业务逻辑方面也不应该都放到数据库中,否则容易会使得数据库性能成为瓶颈。所以在某些时候,以上操作可能需要移到业务逻辑中处理。

在C#中,我们可能会先取回两个List实体,这两个实体分别从数据库中获得,在C#中,我们使用LINQ语句的聚合,分组也能实现SQLServer类似的功能。

private List<BusinessDistrictWithCountModel> CombineDistrict(List<BusinessDistrictWithCountModel> foodBusinessDistrict,                                                              List<BusinessDistrictWithCountModel> spaBusinessDistrict){    List<BusinessDistrictWithCountModel> result;    result = new List<BusinessDistrictWithCountModel>();    result = foodBusinessDistrict.Concat(spaBusinessDistrict).                        GroupBy(x => new                        {                            x.CityLocationID,                            x.CityLocationName,                            x.BusinessDistrctID,                            x.BusinessDistrctName                        })                        .Select(g=> new BusinessDistrictWithCountModel                        {                            CityLocationID = g.Key.CityLocationID,                            CityLocationName = g.Key.CityLocationName,                            BusinessDistrctID = g.Key.BusinessDistrctID,                            BusinessDistrctName = g.Key.BusinessDistrctName,                            ProductCount = g.Sum(a => a.ProductCount)                        })                        .OrderByDescending(x => x.ProductCount)                        .ToList();    return result;}

在LINQ中将两个集合合并有两个方法,Union和Concat,其中Union会对集合中相同的元素进行去重,而Concat则不会。这两个关键字分别对应SQLServer中的Union和Union All。

Linq中的GroupBy和SQLServer中的GoupBy也类似,将需要Group的字段放到一个匿名对象里,然后在紧接着的Select中,我们可以从key中拿到Group里的字段,然后还可以进行一些诸如Sum,Count等统计操作。

另外,在C#中将一个集合对象转换为另外一个集合对象的时候,可以使用Select或者ConvertAll这两个关键字,Select是LINQ里面的扩展方法,对于任何实现IEnumerable<>泛型接口的对象都可以使用,在.NET 3.5及以上平台上支持,并且和其他LINQ操作符一样,他是延迟执行(lazy evaluation)的;而ConvertAll则是List<>对象的方法,在.NET 2.0及以上版本中均可以使用,它是立即执行,但是他们的作用相同,我们只需要传入转换的方法即可。