首页 > 代码库 > Effective Java Item7:Avoid Finalizers,解释为什么finalize是不安全的,不建议使用

Effective Java Item7:Avoid Finalizers,解释为什么finalize是不安全的,不建议使用

我的上一篇博客:System.gc()和-XX:+DisableExplicitGC启动参数,以及DirectByteBuffer的内存释放  在讨论如何回收堆外内存的时候,提到“NIO中direct memory的释放并不是通过finalize(),因为finalize不安全而且影响能”。Effective Java一书中也提到:Avoid Finalizers。人都有潜在的叛逆意识,别人给的结论或者制定的规范,除非有足够的理由说服你,除非懂得这么做背后的原因,否则只能是死记硬背,没有形象深入的理解,不能学到真正的东西。本文通过自己的理解和一些实际的例子,和大家一起更形象的理解finalize。还是那句经典的话“talking is cheap,show me the code”。


我们先看下TestObjectHasFinalize这个类提供了finalize方法

package finalize;

public class TestObjectHasFinalize
{
	public static void main(String[] args)
	{
		while (true)
		{
			TestObjectHasFinalize heap = new TestObjectHasFinalize();
			System.out.println("memory address=" + heap);
		}
	}

	@Override
	protected void finalize() throws Throwable
	{
		super.finalize();
		System.out.println("finalize.");
	}
}
运行这段程序,使用jmap命令查看对象占用的内存情况。

C:\Documents and Settings\Administrator>jps
4232 Jps
3236 TestObjectHasFinalize
5272

C:\Documents and Settings\Administrator>jmap -histo:live 3236

 num     #instances         #bytes  class name
----------------------------------------------
   1:        106983        3423456  java.lang.ref.Finalizer
   2:        106977         855816  finalize.TestObjectHasFinalize
   3:           642         841384  [I
   4:          5204         521984  <constMethodKlass>
   5:          8678         460712  <symbolKlass>
   6:          5204         460672  <methodKlass>
   7:          1694         206832  [C
   8:           351         206024  <constantPoolKlass>
   9:           351         142864  <instanceKlassKlass>
  10:           325         140040  <constantPoolCacheKlass>
  11:           421          79648  [B
  12:          1701          40824  java.lang.String
  13:           420          40320  java.lang.Class
  14:           519          33720  [S
  15:           547          32800  [[I
  16:           758          24256  java.util.TreeMap$Entry
  17:            94          18024  <methodDataKlass>
  18:            40          13120  <objArrayKlassKlass>
  19:           312          12776  [Ljava.lang.Object;
  20:            76           6080  java.lang.reflect.Method
  21:           181           5840  [Ljava.lang.String;
  22:            37           2664  java.lang.reflect.Field
  23:             8           2624  <typeArrayKlassKlass>
可以发现占用内存较多的是java.lang.ref.Finalizer对象和TestObjectHasFinalize,为什么会有这么多个Finalizer对象呢?为什么要这么多的TestObjectHasFinalize对象呢?类似的,我们看下没有finalize()方法的情况

public class TestObjectNoFinalize
{
	public static void main(String[] args)
	{
		while (true)
		{
			TestObjectNoFinalize heap = new TestObjectNoFinalize();
			System.out.println("object no finalize method." + heap);
		}
	}
}
C:\Documents and Settings\Administrator>jps
4436 TestObjectNoFinalize
6012 Jps
5272

C:\Documents and Settings\Administrator>jmap -histo:live 4436

 num     #instances         #bytes  class name
----------------------------------------------
   1:          5203         521896  <constMethodKlass>
   2:          8677         460696  <symbolKlass>
   3:          5203         460584  <methodKlass>
   4:          1689         206544  [C
   5:           351         205992  <constantPoolKlass>
   6:           351         142864  <instanceKlassKlass>
   7:           325         140024  <constantPoolCacheKlass>
   8:           421          79640  [B
   9:          1696          40704  java.lang.String
  10:           420          40320  java.lang.Class
  11:           519          33720  [S
  12:           547          32800  [[I
  13:           758          24256  java.util.TreeMap$Entry
  14:           407          22088  [I
  15:            74          14720  <methodDataKlass>
  16:            40          13120  <objArrayKlassKlass>
  17:           312          12776  [Ljava.lang.Object;
  18:            76           6080  java.lang.reflect.Method
  19:           181           5840  [Ljava.lang.String;
  20:            37           2664  java.lang.reflect.Field
  21:             8           2624  <typeArrayKlassKlass>
  22:           100           1976  [Ljava.lang.Class;
  23:            20           1664  [Ljava.util.HashMap$Entry;
  24:            12           1440  <klassKlass>
  25:            59           1416  java.util.Hashtable$Entry
  26:            13            728  java.net.URL
  27:            18            720  java.util.HashMap
  28:             7            680  [Ljava.util.Hashtable$Entry;
  29:             6            672  java.lang.Thread
  30:            10            640  java.lang.reflect.Constructor
可以发现,java.lang.ref.Finalizer和TestObjectHasFinalize没有占用大量的堆内存。没有提供finalize()方法的类,占用的堆内存更少,垃圾回收速度更快,而且JVM也不会创建那么多java.lang.ref.Finalizer对象

1、使用finalize会导致严重的内存消耗和性能损失

《Effective Java》中提到“使用finalizer会导致严重的性能损失。在我的机器上,创建和销毁一个简单对象的实践大约是5.6ns,增加finalizer后时间增加到2400ns。换言之,创建和销毁带有finalizer的对象会慢430倍”。额外的内存消耗这个很容看出,因为使用了finalize的时候,堆内存中会多出很多java.lang.ref.Finalizer对象。性能损失这个可以通过分析得出结论,因为使用了finalize的时候,堆内存会驻留大量的无用TestObjectHasFinalize对象。为什么有这么多TestObjectHasFinalize对象呢?很简单,垃圾回收的速度变慢了,对象的销毁速度小于对象的创建速度。为什么有这么多的java.lang.ref.Finalizer对象对象呢?这是JVM内部的机制,用来保证finalize只被调用一次。


2、JVM不确保finalize一定会被执行,而且执行finalize的时间也不确定。

从一个对象变为不可达,到其finalizer被执行,可能会经过任意长时间。这意味着你不能在finalizer中执行任何注重时间的任务。依靠finalizer来关闭文件就是一个严重错误,因为打开文件的描述符是一个有限资源。JVM会延迟执行finalizer,所以大量文件会被保持在打开状态,当一个程序不再能打开文件的时候,就会运行失败。

import sun.misc.Unsafe;

public class RevisedObjectInHeap
{
	private long address = 0;

	private Unsafe unsafe = GetUsafeInstance.getUnsafeInstance();

	public RevisedObjectInHeap()
	{
		address = unsafe.allocateMemory(2 * 1024 * 1024);
	}

	@Override
	protected void finalize() throws Throwable
	{
		super.finalize();
		unsafe.freeMemory(address);
	}

	public static void main(String[] args)
	{
		while (true)
		{
			RevisedObjectInHeap heap = new RevisedObjectInHeap();
			System.out.println("memory address=" + heap.address);
		}
	}

}
运行这段代码,很快就会出现堆外内存溢出。为什么呢?就是因为RevisedObjectInHeap.finalize方法不能及时执行,不能及时释放堆外内存。可以参考我的另一篇博客:java中使用堆外内存,关于内存回收需要注意的事和没有解决的遗留问题

当然使用finalize还有其他问题,具体的可以参考《Effective Java》。接下来介绍下JVM执行finalize方法的一些理论知识。实现了finalize()的对象,创建和回收的过程都更耗时。创建时,会新建一个额外的Finalizer 对象指向新创建的对象。 而回收时,至少需要经过两次GC


先来看下新建对象的时候发生的事,测试步骤如下:

1、在TestObjectNoFinalize和TestObjectHasFinalize这2个类的while循环中打上断点,在java.lang.ref.Finalizer的Finalizer()和register()打上断点

2、分别debug运行TestObjectNoFinalize和TestObjectHasFinalize,观察进入Finalizer断点的次数


测试结果如下:

1、TestObjectNoFinalize没有finalize()方法

      进入Finalizer断点的次数很少(3次,指向的是JarFile、Inflater、FileInputStream),之后进入while循环中的断点,不会再进入Finalizer中的断点。也就是说:创建TestObjectNoFinalize对象的时候,不会创建相应的Finalizer对象。

2、TestObjectHasFinalize提供了finalize()方法

      每次创建TestObjectHasFinalize对象的时候,都会创建相应的Finalizer对象指向它。


再看下回收对象的时候发生的事:加上-XX:+PrintGCDetails参数,观察下垃圾回收的过程。



可以看到TestObjectNoFinalize中都是在新生代中发生时的垃圾回收,很快就回收掉了内存。


TestObjectHasFinalize进行了几次新生代内存回收之后,频繁的进行[Full GC。这是以为回收内存的速度太慢,导致新生代内存不能及时释放,所以必须进行Full GC以期望获取空闲的内存空间。这个实验虽然不能直接证明至少需要进行2次GC,但是可以清楚的看到:含有finalize()的对象垃圾回收速度会很慢。


finalize机制的一些总结:

1、如果一个类A实现了finalize()方法,那么每次创建A类对象的时候,都会多创建一个Finalizer对象(指向刚刚新建的对象);如果类没有实现finalize()方法,那么不会创建额外的Finalizer对象

2、Finalizer内部维护了一个unfinalized链表,每次创建的Finalizer对象都会插入到该链表中。源码如下

// 存储Finalizer对象的链表头指针
static private Finalizer unfinalized = null;
static private Object lock = new Object();

private Finalizer next = null, prev = null;

private void add() 
{
	synchronized (lock) 
	{
		if (unfinalized != null) {
		this.next = unfinalized;
		unfinalized.prev = this;
		}
		unfinalized = this;
	}
}

3、如果类没有实现finalize方法,那么进行垃圾回收的时候,可以直接从堆内存中释放该对象。这是速度最快,效率最高的方式

4、如果类实现了finalize方法,进行GC的时候,如果发现某个对象只被java.lang.ref.Finalizer对象引用,那么会将该Finalizer对象加入到Finalizer类的引用队列(F-Queue)中,并从unfinalized链表中删除该结点。这个过程是JVM在GC的时候自动完成的。

 /* Invoked by VM */	
private void remove()
{
	synchronized (lock) 
	{
	    if (unfinalized == this) {
		if (this.next != null) {
		    unfinalized = this.next;
		} else {
		    unfinalized = this.prev;
		}
	    }
	    if (this.next != null) {
		this.next.prev = this.prev;
	    }
	    if (this.prev != null) {
		this.prev.next = this.next;
	    }
	    this.next = this;	/* Indicates that this has been finalized */
	    this.prev = this;
	}
}
 // 这就是F-Queue队列,存放的是Finalizer对象  
 static private ReferenceQueue queue = new ReferenceQueue();


5、含有finalize()的对象从内存中释放,至少需要两次GC。

第一次GC, 检测到对象只有被Finalizer引用,将这个对象放入 java.lang.ref.Finalizer.ReferenceQueue 此时,因为Finalizer的引用,对象还无法被GC。java.lang.ref.Finalizer$FinalizerThread 会不停的清理Queue的对象,remove掉当前元素,并执行对象的finalize方法。清理后对象没有任何引用,在下一次GC被回收。

6、Finalizer是JVM内部的守护线程,优先级很低。Finalizer线程是个单一职责的线程。这个线程会不停的循环等待java.lang.ref.Finalizer.ReferenceQueue中的新增对象。一旦Finalizer线程发现队列中出现了新的对象,它会弹出该对象,调用它的finalize()方法,将该引用从Finalizer类中移除,因此下次GC再执行的时候,这个Finalizer实例以及它引用的那个对象就可以回垃圾回收掉了。

 private static class FinalizerThread extends Thread 
 {
	FinalizerThread(ThreadGroup g) {
	    super(g, "Finalizer");
	}
	public void run() {
	    for (;;) {
		try {
		    Finalizer f = (Finalizer)queue.remove();
		    f.runFinalizer();
		} catch (InterruptedException x) {
		    continue;
		}
	    }
	}
 }

7、使用finalize容易导致OOM,因为如果创建对象的速度很快,那么Finalizer线程的回收速度赶不上创建速度,就会导致内存垃圾越来越多


结束语:终于写完了,欢迎各位看官品读。有不到位或者不准确的地方, 欢迎提出意见。



Effective Java Item7:Avoid Finalizers,解释为什么finalize是不安全的,不建议使用