Java 虚拟机入门教程之一 JVM 内存结构

大纲

JVM 的内存结构

JVM 内存结构主要有三大块:栈、堆内存、方法区。堆内存是 JVM 中最大的一块,由新生代和老年代组成,不包括永久代(方法区);而新生代内存又被分成 Eden 空间、From Survivor 空间、To Survivor 空间,默认情况下新生代按照 8:1:1 的比例来分配。方法区存储类信息、静态变量、常量、常量池等数据,是线程共享的区域,为了与 Java 堆区分,方法区还有一个别名 Non-Heap (非堆)。栈又分为 Java 虚拟机栈和本地方法栈,主要用于方法的执行。

java-jvm-architecture

堆内存

堆内存(Heap)是 Java 虚拟机所管理内存最大的一块,各个线程之间共享,在虚拟机启动时创建,此区域的唯一目的就是存放实例对象,几乎所有的实例对象都在这里分配内存。堆内存是垃圾收集器(GC)管理的主要区域,因此很多时候被称为 “GC 堆”。由于现在垃圾收集器基本采用分代收集算法,所以堆内存还可以被分为新生代和老年代,而新生代内存又被分成 Eden 空间、From Survivor 空间、To Survivor 空间。Java 虚拟机规范的规定,堆内存可以在物理不连续的内存空间上,只要逻辑上是连续的即可。如果在堆内存中没有足够的内存完成实例分配,并且堆内存也无法再扩展时,将会抛出 OutOfMemoryError 异常。

方法区

方法区(Method Area)包含了类信息、静态变量、常量、常量池,是各个线程共享的内存区域。它存储已被虚拟机加载的类信息、静态变量、常量、常量池,即编译器编译后的代码等数据。为了与 Java 堆区分,方法区还有一个别名 Non-Heap (非堆)。对于习惯在 HotSpot 虚拟机上开发和部署程序的开发者来说,很多人愿意把方法区称为” 永久代”(Permanent Generation),本质上两者并不等价,仅仅是因为 HotSpot 虚拟机的设计团队选择把 GC 分代收集扩展至方法区,或者说使用永久代来实现方法区而已。相对而言,垃圾收集行为在这个区域是比较少出现的,但并非数据进入了方法区就如永久代的名字一样” 永久” 存在了。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说这个区域的回收 “成绩” 比较难以令人满意,尤其是类型的卸载,条件相当苛刻,但是这部分区域的回收确实是有必要的。当方法区无法满足内存分配需求时,将抛出 OutOfMemoryError 异常。方法区中的常量和静态变量引用的对象,可作为 GC Root。

Java 虚拟机栈

Java 虚拟机栈(Java Virtual Machine Stacks),是线程私有的,生命周期和线程相同。每个方法执行的同时,会创建一个栈帧(Stacks Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。方法的执行,对应栈帧在虚拟机中入栈到出栈的过程(一句话总结:创建栈帧执行方法,程序计数器会指向栈顶)。局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、double、long)、对象引用(Reference 类型,它不等同于对象本身,根据不同的虚拟机实现,它可能是一个指向对象起始地址的引用指针,也可能指向一个代表对象的句柄或者其他与此对象相关的位置)和 ReturnAddress 类型(指向了一条字节码指令的地址)。其中 64 位长度的 long 和 double 类型的数据会占用 2 个局部变量空间(Slot),其余的数据类型只占用 1 个。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。在 Java 虚拟机规范中,对这个区域规定了两种异常状况:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出 StackOverflowError 异常;如果虚拟机栈可以动态扩展(当前大部分的 Java 虚拟机都支持动态扩展,只不过 Java 虚拟机规范中也允许固定长度的虚拟机栈),当扩展时无法申请到足够的内存时会抛出 OutOfMemoryError 异常。Java 虚拟机栈引用的对象可作为 GC Root。

本地方法栈

本地方法栈(Native Method Stack),与 Java 虚拟机栈发挥的作用相似,它们之间的区别不过是 Java 虚拟机栈为虚拟机执行 Java 方法(也就是字节码)服务,而本地方法栈则为虚拟机使用的 Native 方法服务。Java 虚拟机规范中对本地方法栈中的方法使用的语言、使用方式与数据结构并没有强制规定,因此具体的虚拟机可以自由实现它。甚至有的虚拟机(譬如 Sun HotSpot 虚拟机)直接就把本地方法栈和 Java 虚拟机栈合二为一。与 Java 虚拟机栈一样,本地方法栈区域也会抛出 StackOverflowError 和 OutOfMemoryError 异常。本地方法栈 Native 方法引用的对象可作为 GC Root。

程序计数器

程序计数器(Program Counter Register)是一块较小的内存空间,它的作用可以看做是当前线程所执行的字节码的行号指示器,即保证线程切换后恢复到正确的执行位置。在虚拟机的概念模型里(仅是概念模型,各种虚拟机可能会通过一些更高效的方式去实现),字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。由于 Java 虚拟机的多线程是通过线程切换并获取时间片的方式来实现的,在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储,一般称这类内存区域为 “线程私有” 的内存。如果线程正在执行的是一个 Java 方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址。如果正在执行的是 Natvie 方法,这个计数器值则为空(Undefined)。此内存区域是唯一一个在 Java 虚拟机规范中没有规定任何 OutOfMemoryError 异常情况的区域。

运行时常量池

运行时常量池(Runtime Constant Pool)是方法区的一部分,用于存放编译期生成的各种字面量和符号引用。这部分内容在类加载后进入方法区的运行时常量池存放。运行时常量池另一个重要特征就是具有动态性。Java 语言并不要求常量一定只有编译期才能产生,运行期间也可以将新的常量放入池中,这种特性被开发人员利用的比较多的就是 String 类的 intern() 方法。

直接内存

直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,也不是 Java 虚拟机规范中定义的内存区域,但是这部分内存也被频繁的使用,而且也可能导致 OutOfMemoryError 异常。在 JDK1.4 中新加入的 NIO 类,引入了一种基于通道(Channel)与缓存区(Buffer)的 I/O 方式。它可以使用 Native 函数库直接分配堆外内存,然后通过一个存储在 Java 堆中的 DirectByteBuffer 对象作为这块内存的引用进行操作。这样能在一些场景中提高性能,因为避免了 Java 堆和 Native 堆中来回复制数据。值得注意的是,本机的直接内存的分配不会受到 Java 堆大小的限制,但是会受到本机总内存的限制,这可能导致各个内存区域总和大于物理内存的限制,从而导致动态扩展时出现 OutOfMemoryError 异常。

JVM 的方法区

方法区的别名

在 JDK 7 及以前,方法区的名称叫永久代。在 JDK 8 及以后,方法区的名称叫元空间。元空间的作用和永久代类似,都是对 JVM 规范中方法区的实现。不过元空间与永久代最大的区别在于:元空间不在虚拟机设置的内存中,而是使用本地内存。特别注意,永久代、元空间二者并不只是名字变了,内部结构也调整了。值得一提的是,对于 HotSpot JVM 而言,为了与 Java 堆区分,方法区还有一个别名叫非堆内存(Non Heap)。

方法区的演变

首先明确一点,只有 Hotspot 虚拟机才有永久代。相对于 BEAJRockit、IBM 9 等商业虚拟机来说,是不存在永久代的概念的。原则上如何实现方法区属于虚拟机实现细节,不受《Java 虚拟机规范》管束,并不要求统一。Hotspot 中方法区的演变如下表所示。

JDK 版本方法区的演变
1.6 及以前有永久代 ,静态变量存放在永久代上
1.7 有永久代,但已经逐步 去永久代,字符串常量池、静态变量保存在堆中
1.8 及以后无永久代,类型信息、字段、方法、常量保存在本地内存的元空间,但字符串常量池、静态变量仍保存在堆中

JVM 的内存调优

控制各区域的内存大小

java-jvm-memory

  • -Xms,设置堆内存的最小空间大小
  • -Xmx,设置堆内存的最大空间大小
  • -XX:NewSize,设置新生代最小空间大小
  • -XX:MaxNewSize,设置新生代最大空间大小
  • -XX:PermSize,设置永久代(方法区)最小空间大小
  • -XX:MaxPermSize,设置永久代(方法区)最大空间大小
  • -Xss,设置每个线程的堆栈大小

特别注意

JVM 没有提供直接设置老年代的参数,但是可以设置堆空间大小和新生代空间大小来间接控制,老年代空间大小 = 堆空间大小 - 新生代大空间大小。