首页 > 代码库 > Hibernate缓存应用的积累与总结

Hibernate缓存应用的积累与总结

  Hibernate缓存一直比较难掌握,下面就分析和总结原因,相信你就会慢慢清楚了原来Hibernate缓存也是可以轻松掌握的,但前提要求大家必须跟着动手去验证一下,再用心体会,光看是没有用的

目录:

一、hibernate一级缓存(Session 级别的缓存)

二、一级缓存特征及其应用

三、管理一级缓存

四、Hibernate二级缓存(sessionFactory级别缓存)

五、总结

一、hibernate一级缓存(Session 级别的缓存) 

  hibernate是一个线程对应一个session,一个线程可以看成一个用户。也就是说session级缓存(一级缓存)只能给一个线程用,别的线程用不了,一级缓存就是和线程绑定了。hibernate一级缓存生命周期很短,和session生命周期一样,一级缓存也称session级的缓存或事务级缓存。如果tb事务提交或回滚了,我们称session就关闭了,生命周期结束了。

  实验1:体验一级缓存:(动手做做)

 //同一个session中,发出两次load方法查询

Employee  emp= (Employee )session.load(Employee .class, 1);

System.out.println( emp.getName());

//不会发出查询语句,load使用缓存

emp = (Employee )session.load(Employee .class, 1);

System.out.println(emp.getName());

  第二次查询第一次相同的数据,第二次load方法就是从缓存里取数据,不会发出sql语句到数据库里查询。

  缓存主要是用于查询 ,hibernate的很多方法都是首先从缓存中取数据如果没有在从数据库中获取,以提升查询效率如:get()/load()、iterate(),而且持久态的对象是会存储在缓存中的。例如:先save保存实体对象,再用load方法查询刚刚save的实体对象,则load方法不会发出sql语句到数据库查询的,而是到缓存里取数据,因为save方法也支持缓存.

二、一级缓存特征及其应用:

  1.Session 级别的缓存,它同session邦定。它的生命周期和session相同。Session消毁,它也同时消毁;

  2.两个session 不能共享一级缓存,因它会伴随session的生命周期的创建和消毁;

  3.Session缓存是实体级别的缓存,就是只有在查询对象级别的时候才使用,如果使用HQL和SQL是查询属性级别的,是不使用一级缓存的!切记!!!

  4.iterate 查询使用缓存,会发出查询Id的SQL和HQL语句,但不会发出查实体的,它查询完会把相应的实体放到缓存里边,一些实体查询如果缓存里边有,就从缓存中查询,但还是会发出查询id的SQL和HQL语句。如果缓存中没有它会数据库中查询,然后将查询到的实体一个一个放到缓存中去,所以会有N+1问题出现。

  5.List()和iterate 查询区别:(动手做做)

  使用iterate,list查询实体对象*N+1问题,在默认情况下,使用query.iterate查询,有可以能出现N+1问题

  所谓的N+1是在查询的时候发出了N+1条sql语句1:首先发出一条查询对象id列表的sqlN:

  根据id列表到缓存中查询,如果缓存中不存在与之匹配的数据,那么会根据id发出相应的sql语句list和iterate的区别?

  list每次都会发出sql语句,list会向缓存中放入数据,而不利用缓存中的数据

  iterate:在默认情况下iterate利用缓存数据,但如果缓存中不存在数据有可以能出现N+1问题

  6.Get()和load(),iterate方法都会使用一级缓存,

  Get与load的区别? (动手做做)

  1. 对于get方法,hibernate会确认一下该id对应的数据是否存在,首先在session缓存中查找,然后在二级缓存中查找,还没有就查询数据库,数据库中没有就返回null。

  2. load方法加载实体对象的时候,根据映射文件上类级别的lazy属性的配置(默认为true),分情况讨论:

    (1)若为true,则首先在Session缓存中查找,看看该id对应的对象是否存在,不存在则使用延迟加载,返回实体的代理类对象(该代理类为实体类的子类,由CGLIB动态生成)。等到具体使用该对象(除获取OID以外)的时候,再查询二级缓存和数据库,若仍没发现符合条件的记录,则会抛出一个ObjectNotFoundException。

    (2)若为false,就跟get方法查找顺序一样,只是最终若没发现符合条件的记录,则会抛出一个ObjectNotFoundException。

  小结:

        1、get方法首先查询session缓存,没有的话查询二级缓存,最后查询数据库;而load方法首先查询session缓存,没有就创建代理,实际使用数据时才查询二级缓存和数据库

        2、如果未能发现符合条件的记录,get方法返回null,而load方法会抛出一个ObjectNotFoundException。

        3、load使用代理延迟加载数据,而get方法往往返回有实体数据的对象

        使用:

        1、如果想对一个对象进行增删改查之类,该使用load方法,性能提高,可以使用代理对象,省去了一次和数据库交互的机会,当真正用到该对象的属性时,才跟数据库交互

        2、如果你想加载一个对象使用它的属性,该使用get方法

  7.hiberate3 session 存储过程如下:

  例如 object 对象Session.save(object);

  这时候不会把数据放到数据库,会先放到session缓存中去,数据库中没有相应记录,session.flush();才发SQL和HQL语句,数据库中有了相应记录,

  但是数据库用select查不到,这是跟数据库事物级别有关系。

  Session.beginTrransaction()。commit();

  事物提交后可以查询到了。

  Session.flush()语句但是为什么不写呢,因为commit()会默认调用flush();  

三、管理一级缓存

  无论何时,当你给save()、update()或 saveOrUpdate()方法传递一个对象时,或使用load()、 get()、list()、iterate() 或scroll()方法获得一个对象时, 该对象都将被加入到Session的内部缓存中。当随后flush()方法被调用时,对象的状态会和数据库取得同步。 如果你不希望此同步操作发生,或者你正处理大量对象、需要对有效管理内存时,你可以调用evict() 方法,从一级缓存中去掉这些对象及其集合。

ScrollableResult cats = sess.createQuery("from Cat as cat").scroll();
while ( cats.next() ) {
    Cat cat = (Cat) cats.get(0);
    doSomethingWithACat(cat);
    sess.evict(cat);
}

Session还提供了一个contains()方法,用来判断某个实例是否处于当前session的缓存中。如若要把所有的对象从session缓存中彻底清除,则需要调用Session.clear()。

四、Hibernate二级缓存(sessionFactory级别缓存)

  二级缓存需要sessionFactory来管理,它是进初级的缓存,所有人都可以使用,它是共享的。Hibernate二级缓存支持对象缓存、集合缓存、查询结果集缓存,对于查询结果集缓存可选。

  二级缓存比较复杂,一般用第三方产品。hibernate提供了一个简单实现,用Hashtable做的,只能作为我们的测试使用,商用还是需要第三方产品。

  几种优秀缓存方案:

  1、Memcached 分布式缓存系统 2、JBOSS CACHE   3 、EhCache   Ehcache 2.1起提供了针对Hibernate的JTA支持。 4、Infinispan 开源数据网格平台

  使用缓存,肯定是长时间不改变的数据,如果经常变化的数据放到缓存里就没有太大意义了。因为经常变化,还是需要经常到数据库里查询,那就没有必要用缓存了。hibernate做了一些优化,和一些第三方的缓存产品做了集成。这里采用EHCache缓存产品。

  和EHCache二级缓存产品集成:EHCache的jar文件在hibernate的lib里,我们还需要设置一系列的缓存使用策略,需要一个配置文件ehcache.xml来配置。

  hibernate.cfg.xml 配置(动手做做) 

<!-- 开启二级缓存 -->  
<property name="hibernate.cache.use_second_level_cache">true</property>  
<!-- 开启查询缓存 -->  
<property name="hibernate.cache.use_query_cache">true</property>  
<!-- 二级缓存区域名的前缀 -->  
<!--<property name="hibernate.cache.region_prefix">h3test</property>-->  
<!-- 高速缓存提供程序  第三方产品-->  
<property name="hibernate.cache.region.factory_class">  
net.sf.ehcache.hibernate.EhCacheRegionFactory  
</property>  
<!-- 指定缓存配置文件位置 -->  
<property name="hibernate.cache.provider_configuration_file_resource_path">  
ehcache.xml  
</property>  
<!-- 强制Hibernate以更人性化的格式将数据存入二级缓存 -->  
<property name="hibernate.cache.use_structured_entries">true</property>  
<!-- Hibernate将收集有助于性能调节的统计数据 -->  
<property name="hibernate.generate_statistics">true</property>   

  ehcache配置(ehcache.xml)(动手做做)

<?xml version="1.0" encoding="UTF-8"?>  
<ehcache name="h3test">      <!--指定区域名-->
<defaultCache  
maxElementsInMemory="100"      <!--缓存在内存中的最大数目-->
eternal="false"                          <!--缓存是否持久-->
timeToIdleSeconds="1200"     <!--当缓存条目闲置n秒后销毁-->
timeToLiveSeconds="1200"    <!--当缓存条目存活n秒后销毁-->
overflowToDisk="false">    <!--硬盘溢出-->
</defaultCache>  
</ehcache>    

  实体只读缓存

      只读缓存 read only,不须要锁与事务,因为缓存自数据从数据库加载后就不会改变。如果数据是只读的,例如引用数据,那么总是使用“read-only”策略,因为它是最简单、最高效的策略,也是集群安全的策略。是性能第一的策略

<hibernate-mapping>  
<class name="com.ljb.entity.Voucher" table="Voucher">  
<cache usage="read-only"/>  
     ……  
</hibernate-mapping>

  二级缓存测试代码(动手做做)

Session session1 = sf.openSession();  
Transaction t1 = session1.beginTransaction();  
//确保数据库中有标识符为1的Voucher 
Voucher voucher = (Vocher) session1.get(Vocher.class, 1);  
//如果修改将报错,只读缓存不允许修改  
 //voucher.setName("aaa");  
t1.commit();  
session1.close();
Session session2 = sf.openSession();  
Transaction t2 = session2.beginTransaction();  
          
voucher = (Vocher) session2.get(Vocher.class, 1);   //在二级缓存中查找结果,不会产出sql语句,不操作数据库
t2.commit();  
session2.close();  
sf.close();   

  只读缓存不允许更新,将报错Can‘t write to a readonly object。允许新增,( 新增直接添加到二级缓存)

  读写缓存 read write

  对缓存的更新发生在数据库事务完成后。缓存需要支持锁。在一个事务中更新数据库,在这个事务成功完成后更新缓存,并释放锁。锁只是一种特定的缓存值失效表述方式,在它获得新数据库值前阻止其他事务读写缓存。那些事务会转而直接读取数据库  

     实体读/写缓存

<hibernate-mapping>  
<class name="com.ljb.entity.Voucher" table="Voucher">  
<cache usage="read-write"/>  
        ……  
</hibernate-mapping> 

  二级缓存测试代码

Session session1 = sf.openSession();  
Transaction t1 = session1.beginTransaction();  
//确保数据库中有标识符为1的Voucher 
Voucher voucher = (Vocher) session1.get(Vocher.class, 1);  
//如果修改将报错,只读缓存不允许修改  
voucher.setName("aaa");  
t1.commit();  
session1.close();        
Session session2 = sf.openSession();  
Transaction t2 = session2.beginTransaction();  
voucher = (Vocher) session2.get(Vocher.class, 1);   //该条目已经被别的事务修改了,此时重新查询一次数据库   
t2.commit();  
session2.close();  
sf.close();   

  允许更新,更新后自动同步到缓存。允许新增,新增记录后自动同步到缓存。保证read committed隔离级别及可重复读隔离级别(通过时间戳实现)整个过程加锁,如果当前事务的时间戳早于二级缓存中的条目的时间戳,说明该条目已经被别的事务修改了,此时重新查询一次数据库,否则才使用缓存数据,因此保证可重复读隔离级别

  非严格读写缓存 nonstrict read write

  在一个事务中更新数据库,在这个事务完成前就清除缓存,为了安全起见,无论事务成功与否,在事务完成后再次清除缓存。既不需要支持缓存锁,也不需要支持事务。如果是缓存集群,“清除缓存”调用会让所有副本都失效,这通常被称为“拉(pull)”更新策略。如果你的数据读很多或者很少有并发缓存访问和更新,那么可以使用“nonstrict-read-write”策略。感谢它的轻量级“拉”更新策略,它通常是性能第二好的策略。

  实体非严格读/写缓存

<hibernate-mapping> 
<class name="com.ljb.entity.Voucher" table="Voucher"> 
<cache usage="nonstrict-read-write"/> 
     …… 
</hibernate-mapping>  

  测试代码 略(我想大家会验证了)

  验证结果

  允许更新,更新后缓存失效,需再查询一次。 允许新增,新增记录自动加到二级缓存中。整个过程不加锁,不保证。

  事务缓存 transactional (一定要在JTA环境中)

  对缓存和数据库的更新被包装在同一个JTA事务中,这样缓存与数据库总是保持同步的。数据库和缓存都必须支持JTA。除非你真的想将缓存更新和数据库更新放在一个JTA事务里,否则不要使用“transactional”策略,因为JTA需要漫长的两阶段提交处理,这导致它基本是性能最差的策略。

  需要特定缓存的支持和JTA事务支持,此处不演示。 

  集合缓存

  演示读/写缓存示例,和之前实体缓存测试差不多,其他自测

<hibernate-mapping>  
  <class name="cn.javass.h3test.model.UserModel" table="TBL_USER">  
    <cache usage="read-write" />  
    <set name="vouchers" cascade="all" inverse="true" lazy="false">  
      <cache usage="read-write"/>  
      <key column="fk_user_id"/>  
      <one-to-many class="cn.ljb.entity.Voucher"/>  
    </set>  
  </class>  
</hibernate-mapping>    
SessionFactory sf =   
new Configuration().configure().buildSessionFactory();  
Session session1 = sf.openSession();  
Transaction t1 = session1.beginTransaction();  
 //确保数据库中有标识符为1的UserModel  
UserModel user = (UserModel) session1.get(UserModel.class, 1);  
user.getVouchers();  
t1.commit();  
session1.close();  
      
Session session2 = sf.openSession();  
Transaction t2 = session2.beginTransaction();  
user = (UserModel) session2.get(UserModel.class, 1);  
user.getVouchers();  
t2.commit();  
session2.close();  
sf.close();  

  测试结论:   

  和实体并发策略有相同含义; 但集合缓存只缓存集合元素的标识符,在二级缓存中只存放相应实体的标识符,然后再通过标识符去二级缓存查找相应的实体最后组合为集合返回。

  查询缓存 (动手做做)

  1、保证全局配置中有开启了查询缓存。

  2、修改FarmModel.hbm.xml,添加如下红色部分配置,表示实体缓存并读/写

<hibernate-mapping>  
    <class name="com.lijb.entity.Voucher" table="voucher">  
        <cache usage="read-write"/>  
         ……  
</hibernate-mapping>   

  3、测试代码

SessionFactory sf =   .new Configuration().configure().buildSessionFactory();  
Session session1 = sf.openSession();  
Transaction t1 = session1.beginTransaction();  
Query query = session1.createQuery("fromVoucher");  
//即使全局打开了查询缓存,此处也是必须的  
query.setCacheable(true);  
List<Voucher> voucherList = query.list();  
t1.commit();  
session1.close();  
Session session2 = sf.openSession();  
Transaction t2 = session2.beginTransaction();  
query = session2.createQuery("from Voucher");  
//即使全局打开了查询缓存,此处也是必须的  
query.setCacheable(true);  
voucherList = query.list();  
t2.commit();  
session2.close();  
sf.close();  

  结论:

  和实体并发策略有相同含义; 和集合缓存类似,只缓存集合元素的标识符,在二级缓存中只存放相应实体的标识符,然后再通过标识符 去二级缓存查找相应的实体最后组合为集合返回。

      什么时候需要查询缓存?

      大多数时候无法从结果集高速缓存获益。必须知道:每隔多久重复执行同一查询。对于那些查询非常多但插入、删除、更新非常少的应用程序来说,查询缓存可提升性能。但写入多查询少的没有用,总失效。

  管理二级缓存

  对于二级缓存来说,在SessionFactory中定义了许多方法, 清除缓存中实例、整个类、集合实例或者整个集合。

sessionFactory.evict(Cat.class, catId); //evict a particular Cat
sessionFactory.evict(Cat.class);  //evict all Cats
sessionFactory.evictCollection("Cat.kittens", catId); //evict a particular collection of kittens
sessionFactory.evictCollection("Cat.kittens"); //evict all kitten collections
sessionFactory.evictQueries()//evict all queries

//CacheMode参数用于控制具体的Session如何与二级缓存进行交互。
//CacheMode.NORMAL - 从二级缓存中读、写数据。
//CacheMode.GET - 从二级缓存中读取数据,仅在数据更新时对二级缓存写数据。
//CacheMode.PUT - 仅向二级缓存写数据,但不从二级缓存中读数据。
//CacheMode.REFRESH - 仅向二级缓存写数据,但不从二级缓存中读数据。通过 hibernate.cache.use_minimal_puts的设置,强制二级缓存从数据库中读取数据,刷新缓存内容

  监控二级缓存

  如若需要查看二级缓存或查询缓存区域的内容,你可以使用统计(Statistics) API。通过sessionFactory.getStatistics();获取Hibernate统计信息。此时,你必须手工打开统计选项。

 hibernate.generate_statistics true
 hibernate.cache.use_structured_entries true

 五、总结

  不要想当然的以为缓存一定能提高性能,仅仅在你能够驾驭它并且条件合适的情况下才是这样的。hibernate的二级缓存限制还是比较多的,不方便用jdbc可能会大大的降低更新性能。在不了解原理的情况下乱用,可能会有1+N的问题。不当的使用还可能导致读出脏数据。

  如果受不了hibernate的诸多限制,那么还是自己在应用程序的层面上做缓存吧。

  在越高的层面上做缓存,效果就会越好。就好像尽管磁盘有缓存,数据库还是要实现自己的缓存,尽管数据库有缓存,咱们的应用程序还是要做缓存。因为底层的缓存它并不知道高层要用这些数据干什么,只能做的比较通用,而高层可以有针对性的实现缓存,所以在更高的级别上做缓存,效果也要好些。

Hibernate缓存应用的积累与总结