首页 > 代码库 > 深入理解Java虚拟机 - 学习笔记 1

深入理解Java虚拟机 - 学习笔记 1

Java内存区域

程序计数器 (Program Counter Register)

是一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。

 

在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)都只会执行一个线程中的指令。因此每个线程都需要有一个独立的程序计数器。此类内存为“线程私有”的内存。


如果线程正在执行的是java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地质;如果正在执行的是Native方法,这个计数器为空。此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryErro情况的区域。


字节码 (byte code)

是一种包含执行程序的二进制文件。对于Java来说class文件就是由字节码组成,对于机器来说不可直接运行,是由JVM负责解释执行(将字节码转换成机器码)。

Java字节码的执行需要经过以下3个步骤:

(1)由类装载器(class loader)负责把类文件(.class文件)加载到Java虚拟机中。在此过程需要检验该类文件是否符合类文件规范。


(2)字节码校验器(bytecode verifier)检查该类文件的代码中是否存在着某些非法操作,例如Applet程序中写本地计算机文件系统的操作。


(3)如果字节码校验器检验通过,由Java解释器负责把该类文件解释成为机器码进行执行。


Java虚拟机采用“沙箱”运行模式,即把Java程序的代码和数据都限制在一定内存空间里执行,不允许程序访问该内存空间以外的内存。如果是Applet程序,还不允许访问客户端机器的文件系统。

Java虚拟机栈 (Java Virtual Machine Stacks)

与程序计数器一样,,也是线程私有的,,生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链表、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。


通常有人将java内存区域粗略分为堆内存和栈内存,栈指得就是虚拟机栈,或者说是虚拟机栈中局部变量表部分。局部变量表存放了编译期可知的各种基本数据类型(boolean, byte, char, short, int, float, long, double)、对象引用(reference类型,不同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)和returnAddress类型(指向了一条字节码指令的地址)。


64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用一个。如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常,如果虚拟机栈可以动态扩展(大部分java虚拟机都可以)而无法申请到足够的内存,就会抛出OutOfMemoryError异常。

本地方法栈(Native Method Stack)

与虚拟机栈所发挥的作用是非常相似的,区别不过是虚拟机战为虚拟机执行java方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的native方法服务。本地方法栈也会抛出出StackOverflowError和OutOfMemoryError异常。

Java堆(Java Heap)

是Java虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域唯一的目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。Java虚拟机规范中的描述是:所有的对象实例以及数组都要在堆上分配。但是随着JIT编译器的发展和逃逸分析技术的逐渐成熟,栈上分配、标量替换优化技术将会导致一些微妙的变化发生,所有对象都分配在堆上也渐渐变得不是那么绝对了。


Java堆是垃圾收集器管理的主要区域,因此很多时候也被称为“GC堆”(Garbage Collected Heap)。从内存回收角度来看,由于现在收集器都采用分代收集算法,所以Java堆还可以细分为新生代和老年代,再细致一点有Eden空间,From Survivor空间,To Survivor空间等。从内存分配角度来看,线程共享的Java堆中可能划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer, TLLAB)。无论那个区域,存放的都是对象实例。 如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。

方法区(Method Area)

与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即使编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但它有一个别名叫Non-Heap,目的应该是与Java堆区分开来。这区域的内存回收主要是针对常量池的回收和对类型的卸载。


很多人习惯于将方法区成为“永久代”(Permanent Generation),本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把GC分代收集扩展至方法区,或者说用永久代来实现方法区而已,这样HotSpot的垃圾收集器可以像管理Java堆一样管理这部分内存,能够省去专门为方法区编写内存管理代码的工作。对于其他虚拟机是不存在永久代概念的。使用永久代来实现方法区并不是一个好主意,因为更容易遇到内存溢出问题而且极少数方法(如String.intern())会因为这个原因导致不同虚拟机下有不同的表现。Java8已经取消永久代而采用元空间(Metaspace)的概念,元空间大小基于本地内存(Native Memory)及整个系统的可用内存,极大的缓解了OutOfMemoryError的问题。Metaspace背后的一个思想是,类和它的元数据的生命周期是和它的类加载器的生命周期一致的。也就是说,只要类的类加载器是存活的,在Metaspace中的类元数据也是存活的,不能被释放。

运行时常量池(Runtime Constant Pool)

是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号的引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。当常量池无法再申请到内存时会抛出OutOfMemoryError异常。

直接内存(Direct Memory)

并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域。但是这部分内存也被频繁地使用,也可能导致OutOfMemoryError的出现。例如NIO中引入了一种基于Channel和Buffer的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中显著地提高性能,因为避免了在Java堆和Native堆中来回复制数据。

 

深入理解Java虚拟机 - 学习笔记 1