首页 > 代码库 > EntityFramework:支持同一事务提交的批量删除数据实现思路

EntityFramework:支持同一事务提交的批量删除数据实现思路

一切从一段代码说起。。。

下面一段代码是最近我在对一EF项目进行重构时发现的。

protected override void DoRemove(T entity){    this.dbContext.Entry(entity).State = EntityState.Deleted;    Committed = false;}protected override int DoRemove(System.Linq.Expressions.Expression<Func<T, bool>> predicate = null){    var set = dbContext.Set<T>().AsQueryable();    set = (predicate == null) ? set : set.Where(predicate);    int i = 0;    foreach (var item in set)    {        DoRemove(item);        i++;    }    return i;}    

没错,这是使用Expression表达式实现批量删除数据的代码。当中的foreach代码块循环调用DoRemove(T entity)方法来修改符合条件的实体的状态码,最后执行dbContext的SaveChanges方法来提交到数据库执行删除命令。正是这个foreach引起了我的思考,我们知道EF会自动生成SQL语句提交到数据库执行,删除一条记录的话,会生成一条delete语句。如果要删除多条记录,手写SQL的话,只需一条带where条件的delete语句即可(如:delete from [tableName] where [condition]),而通过执行上面代码的批量删除方法,EF会不会生成一条类似这样的SQL呢?通过SQL Server Profiler跟踪发现这样的结果:

一向NB的EF这下反而SB了,生成的是多条delete语句,一条记录生成一条SQL!这样搞的话,如果要删除的记录有上百条、上千条,甚至上万条的话,那不是把EF给累死,数据库DB也会跟着被连累:”老大,一句话可以说完的事,你给我拆开一个字一个字来说,欠揍啊!”。我们知道任何ORM框架在生成SQL时都会存在性能的损耗,某些SQL会被优化后生成,但在按指定条件批量删除记录这方面很多ORM框架都存在上面出现的尴尬场面。正如老赵在《扩展LINQ to SQL:使用Lambda Expression批量删除数据》一文所说这并不是ORM的问题,只是使用起来不方便。老赵一文所提的方法不失为一种好方案,主要思路是通过解析Expression表达式构造SQL的Where条件子句。看到这里大家估计也清楚了问题的焦点其实就是一条SQL。如果手写SQL的话上面的批量删除SQL语句会类似这样:delete from [DomainObjectA] where [Prop1] in (N‘prop2‘,N‘prop3‘,N‘prop5‘),而EF对于Expression参数的查询是十分给力的,自动生成的查询SQL是这样的:

SELECT     [Extent1].[ID] AS [ID],     [Extent1].[Prop1] AS [Prop1],     [Extent1].[Prop2] AS [Prop2]FROM [dbo].[DomainObjectA] AS [Extent1]WHERE [Extent1].[Prop1] IN (Nprop2,Nprop3,Nprop5)

大家发现了吧,EF生成的查询SQL跟手写的删除SQL语句结构上是如此的神似!如果我们把生成的SQL从SELECT到FROM那段替换成DELETE FROM的话,其实就是我们期望得到的一段SQL。那就按照这个思路动手吧,首先要获取EF生成的SQL语句,对于返回数据集是IQueryable<T>类型的,我们直接对结果ToString()即可获得,够简单吧。

var set = dbContext.Set<T>().AsQueryable();string sql = set.Where(predicate).ToString().Replace("\r", "").Replace("\n", "").Trim();

 对于获取到的SQL字符串我们要进行处理,去除换行符、回车符、多余的空白字符,最关键是要把select到from这一段替换掉。如何替换呢?其实还有个细节遗漏了,先看看替换后的SQL,等会再讲明。

DELETEFROM [dbo].[DomainObjectA] AS [Extent1]WHERE [Extent1].[Prop1] IN (Nprop2,Nprop3,Nprop5)

一眼看上去,似乎没问题,挺标准的一段SQL呀。问题恰恰是在太过标准了!在SQL查询器上运行会报这样的出错提示:“Incorrect syntax near the keyword ‘AS‘.” 原来delete from。。。这样的SQL不接受“AS”关键字啊!其实也不能说完全不接受“AS",如果改为下面这样是可以通过的。

DELETE    [dbo].[DomainObjectA]FROM (     SELECT         [Extent1].[ID] AS [ID],         [Extent1].[Prop1] AS [Prop1],         [Extent1].[Prop2] AS [Prop2]    FROM [dbo].[DomainObjectA] AS [Extent1]    WHERE [Extent1].[Prop1] IN (Nprop2,Nprop3,Nprop5)) AS [T1]        

细心的你可能已经发现了,括号里面的SQL其实就是EF生成的那段。如果这样做的话,我们完全可以把生成的SQL整段拿来用,只需在delete后再指定表名即可。
现在问题变为如何从生成的SQL中提取出表名了。从前面EF生成的SQL中可以看出,它的结构是比较固定的(SELECT...FROM... AS...[WHERE...],当返回所有结果的话WHERE不会被生成)。如果熟悉正则表达式的话你可能第一时间已经想到了,没错!其实我们一开始就可以用正则表达式来解决。只怪本人的正则表达式功力欠佳,走了很多弯路。这次只能求助“度娘”了。。。求助中。。。有答案了,原来很早很早前就已经有位大牛在一篇名为《Linq to Sql: 批量删除之投机取巧版》解决了我所面临的问题,看来园子里不差牛人,闲来多逛逛,还是有意外收获的。借用他文中的正则表达式得了,省时省力。写到这,插个题外话:作为开发人员,信息搜索能力也是必备的(甚至可以毫不夸张地说是开发人员的第一门学问),对遇到的问题难题能迅速搜索到解决方法,从中借鉴别人的经验(不代表抄袭别人的作品),可以少走弯路,节省的时间、精力可以更多花在业务知识方面。言归正传,上代码!

Regex reg = new Regex("^SELECT[\\s]*(?<Fields>.*)[\\s]*FROM[\\s]*(?<Table>.*)[\\s]*AS[\\s]*(?<TableAlias>.*)[\\s]*WHERE[\\s]*(?<Condition>.*)", RegexOptions.IgnoreCase);Match match = reg.Match(sql);if (!match.Success)    throw new ArgumentException("Cannot delete this type of collection");string table = match.Groups["Table"].Value.Trim();string tableAlias = match.Groups["TableAlias"].Value.Trim();string condition = match.Groups["Condition"].Value.Trim().Replace(tableAlias, table);string sql1 = string.Format("DELETE FROM {0} WHERE {1}", table, condition);

现在已经得到我们期望的SQL了,接下来是想办法让数据库去执行它即可,还好EF还是比较人性化的,它支持开放底层ADO.net框架,有三个API可以支持直接访问数据库。

1、DbContext.Database.ExecuteSqlCommand2、DbContext.Database.SqlQuery3、DbSet.SqlQuery

从名字我们知道后两个API主要用来查询数据,我们选用第一个API:DbContext.Database.ExecuteSqlCommand,而且返回是受影响的结果数,我们还能知道被删除的数据有多少条,简直是为此量身定制嘛。

protected override int DoRemove(System.Linq.Expressions.Expression<Func<T, bool>> predicate = null){    var set = dbContext.Set<T>().AsQueryable();    set = (predicate == null) ? set : set.Where(predicate);    string sql = set.ToString().Replace("\r", "").Replace("\n", "").Trim();    if (predicate == null && !string.IsNullOrEmpty(sql) && !string.IsNullOrWhiteSpace(sql))        sql += " WHERE 1=1";    Regex reg = new Regex("^SELECT[\\s]*(?<Fields>.*)[\\s]*FROM[\\s]*(?<Table>.*)[\\s]*AS[\\s]*(?<TableAlias>.*)[\\s]*WHERE[\\s]*(?<Condition>.*)", RegexOptions.IgnoreCase);    Match match = reg.Match(sql);    if (!match.Success)        throw new ArgumentException("Cannot delete this type of collection");    string table = match.Groups["Table"].Value.Trim();    string tableAlias = match.Groups["TableAlias"].Value.Trim();    string condition = match.Groups["Condition"].Value.Trim().Replace(tableAlias, table);    string sql1 = string.Format("DELETE FROM {0} WHERE {1}", table, condition);    int i = 0;    i = dbContext.Database.ExecuteSqlCommand(sql1);return i;}    

执行上面方法,通过SQL Server Profiler跟踪,发现确实是我们想要的结果,只有一条DELETE语句,而且满足条件的数据也确实被删除了。

搞定,收工!等等。。。还有什么问题呢?貌似还漏了点东西。嗯。。。还有”事务“!差点被人说成”标题党“啦。我们知道EF对于实体对象的新增(Add)、修改(Update)、删除(Remove)等操作都要等到最后DbContext.SaveChanges()方法执行后才最终提交到数据库执行。而DbContext.Database.ExecuteSqlCommand是绕过EF直接交给数据库去执行了,这样就出现很尴尬的情况:调用Remove(T entity)方法删除一条数据时要执行SaveChanges(),而通过批量删除的方法删除一条或更多的数据就不用经过SaveChanges()直接可以删除了。如何将SaveChanges和ExecuteSqlCommand放到同一个事务来提交呢?这正是下面要继续探讨的。通过查看DbContext.Database命名空间下面的方法,发现了这样一个方法:

DbContext.Database.UseTransaction(DbTransaction transaction)

这个方法的摘要说明如下:

// 摘要: //     Enables the user to pass in a database transaction created outside of the//     System.Data.Entity.Database object if you want the Entity Framework to execute//     commands within that external transaction.  Alternatively, pass in null to//     clear the framework‘s knowledge of that transaction.

也就是说,我们可以给EF指定一个外部的事务(参数:transaction)来控制其提交Commands到数据库,这样一来所有由EF产生的Commands的提交都要通过这个外部事务(参数:transaction)来控制了。

protected override int DoRemove(System.Linq.Expressions.Expression<Func<T, bool>> predicate = null){    var set = dbContext.Set<T>().AsQueryable();    set = (predicate == null) ? set : set.Where(predicate);    string sql = set.ToString().Replace("\r", "").Replace("\n", "").Trim();    if (predicate == null && !string.IsNullOrEmpty(sql) && !string.IsNullOrWhiteSpace(sql))        sql += " WHERE 1=1";    Regex reg = new Regex("^SELECT[\\s]*(?<Fields>.*)[\\s]*FROM[\\s]*(?<Table>.*)[\\s]*AS[\\s]*(?<TableAlias>.*)[\\s]*WHERE[\\s]*(?<Condition>.*)", RegexOptions.IgnoreCase);    Match match = reg.Match(sql);    if (!match.Success)        throw new ArgumentException("Cannot delete this type of collection");    string table = match.Groups["Table"].Value.Trim();    string tableAlias = match.Groups["TableAlias"].Value.Trim();    string condition = match.Groups["Condition"].Value.Trim().Replace(tableAlias, table);    string sql1 = string.Format("DELETE FROM {0} WHERE {1}", table, condition);    int i = 0;    dbContext.UseTransaction(efContext.Transaction);    i = dbContext.Database.ExecuteSqlCommand(sql1);    efContext.Committed = false;    return i;}    

接下来我们要把DbContext的SaveChanges()和事务Transaction的Commit()封装到同一个方法Commit中去,为此采用Repository模式来实现。具体的实现过程就不细说了,直接给出重构后的代码吧。

 1 public interface IEntityFrameworkRepositoryContext 2 { 3     DbContext Context { get; } 4  5     DbTransaction Transaction { get; set; } 6  7     bool Committed { get; set; } 8  9     void Commit();10 11     void Rollback();12 13 }
IEntityFrameworkRepositoryContext

 

 1 public class EntityFrameworkRepositoryContext : IEntityFrameworkRepositoryContext 2 { 3     private readonly DbContext efContext; 4     private readonly object sync = new object(); 5  6     public EntityFrameworkRepositoryContext(DbContext efContext) 7     { 8         this.efContext = efContext; 9     }10 11     public DbContext Context12     {13         get { return this.efContext; }14     }15 16     private DbTransaction _transaction = null;17     public DbTransaction Transaction18     {19         get20         {21             if (_transaction == null)22             {23                 var connection = this.efContext.Database.Connection;24                 if (connection.State != ConnectionState.Open)25                 {26                     connection.Open();27                 }28                 _transaction = connection.BeginTransaction();29             }30             return _transaction;31         }32         set { _transaction = value; }33     }34 35     private bool _committed;36     public bool Committed37     {38         get39         {40             return _committed;41         }    42         set43         {44             _committed = value;45         }46     }47 48     public void Commit()49     {50         if (!Committed)51         {52             lock (sync)53             {54                 efContext.SaveChanges();55 56                 if (_transaction != null)57                         _transaction.Commit();58             }59             Committed = true;60         }61     }62 63     public override void Rollback()64     {65         Committed = false;66         if (_transaction != null)67         _transaction.Rollback();68     }69 70     //其他方法略。。。71 72 }            
EntityFrameworkRepositoryContext

 

 1 public class EntityFrameworkRepository<T> : IRepository<T>          2     where T : class,IEntity 3 { 4     private readonly IEntityFrameworkRepositoryContext efContext; 5  6     public EntityFrameworkRepository(IEntityFrameworkRepositoryContext context) 7     { 8         this.efContext = context 9     }10 11     //Add, Update, Find等等其他方法略。。。12 13     public int Remove(System.Linq.Expressions.Expression<Func<T, bool>> predicate = null)14     {        15         var set = efContext.Context.Set<T>().AsQueryable();16         set = (predicate == null) ? set : set.Where(predicate);17 18         string sql = set.ToString().Replace("\r", "").Replace("\n", "").Trim();19         if (predicate == null && !string.IsNullOrEmpty(sql) && !string.IsNullOrWhiteSpace(sql))20             sql += " WHERE 1=1";21 22         Regex reg = new Regex("^SELECT[\\s]*(?<Fields>.*)[\\s]*FROM[\\s]*(?<Table>.*)[\\s]*AS[\\s]*(?<TableAlias>.*)[\\s]*WHERE[\\s]*(?<Condition>.*)", RegexOptions.IgnoreCase);23         Match match = reg.Match(sql);24 25         if (!match.Success)26             throw new ArgumentException("Cannot delete this type of collection");27         string table = match.Groups["Table"].Value.Trim();28         string tableAlias = match.Groups["TableAlias"].Value.Trim();29         string condition = match.Groups["Condition"].Value.Trim().Replace(tableAlias, table);30 31         string sql1 = string.Format("DELETE FROM {0} WHERE {1}", table, condition);32         int i = 0;33         efContext.Context.Database.UseTransaction(efContext.Transaction);34         i = efContext.Context.Database.ExecuteSqlCommand(sql1);35         efContext.Committed = false;36         return i;37     }38 39 }        
EntityFrameworkRepository

 

1 public interface IRepository<T>2 {3     void Add(T entity);4     void Update(T entity);5     void Remove(T entity);6     int Remove(Expression<Func<T, bool>> predicate = null);7     IQueryable<T> Find(Expression<Func<T, bool>> predicate = null);8     ......9 }
IRepository

 

EntityFramework:支持同一事务提交的批量删除数据实现思路