关于JVM内存模型的学习,均基于JDK1.8

一、JVM内存模型

JVM 内存布局规定了 Java 在运行过程中内存申请、分配、管理的策略,保证了 JVM 的高效稳定运行。不同的 JVM 对于内存的划分方式和管理机制存在着部分差异。

1 1.8同1.7比,最大的差别就是:元空间取代了永久代。元空间的本质和永久代类似,都是对JVM规范中方法区的实现。不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。程序计数器、虚拟机栈、本地方法栈都是线程私有的,堆和方法区是线程共享的。

二、 各区域介绍

1、程序计数器

线程私有,程序计数器就是当前线程所执行的字节码的行号指示器。字节码解释器的工作就是通过改变计数器的值,来选取下一行指令,通过它来实现跳转、循环、恢复线程等功能,如果当前线程执行的是native方法,则其值为null。

2、Java虚拟机栈

Java 虚拟机栈是 Java 虚拟机(JVM)中重要的内存区域之一,主要用于管理方法的调用和执行。每个线程都有自己的虚拟机栈,虚拟机栈是线程私有的,栈的生命周期与线程一致(栈不存在垃圾回收问题)。

1

2.1 栈帧(Stack Frame)

每当一个方法被调用时,JVM 会为该方法创建一个栈帧。栈帧是虚拟机栈的基本单位,主要包含以下几个部分:

  • 局部变量表(Local Variable Table)

    • 功能:存储方法的参数和局部变量。
    • 特点
      • 局部变量在编译时确定大小,包括基本数据类型和对象引用。
      • 索引从 0 开始,方法的第一个参数通常是 this(对于实例方法)。
  • 操作数栈(Operand Stack)

    • 功能:用于存放方法执行过程中的中间数据。
    • 特点
      • 支持后进先出(LIFO)的操作。
      • 在方法执行期间,操作数栈用于存放操作数和计算结果。
  • 动态链接(Dynamic Linking)

    • 功能:指向方法的运行时常量池。
    • 特点
      • 支持方法的动态解析,以便当方法中需要调用其它方法的时候能够从运行时常量池中找到对应的符号引用, 然后将符号引用转换为直接引用,这样就能直接调用对应的方法。
  • 方法返回地址(Return Address)

    • 功能:指向调用该方法后,继续执行的代码位置。
    • 特点
      • 存储调用方法的下一条指令的地址,以便方法执行完后能够正确返回。

方法结束有两种方式,一种是 正常执行完成,另一种是出现未处理的异常,非正常退出。无论通过哪种方式退出,在方法退出后都返回到该方法被调用的位置。方法正常退出时,调用者的 PC 寄存器的值作为返回地址,即调用该方法的指令的下一条指令的地址。而通过异常退出的,返回地址是要通过异常表来确定的,栈帧中一般不会保存这部分信息。方法退出的时候相当于把栈帧出栈。

2.2 栈的生命周期

  • 入栈:当方法被调用时,新的栈帧被压入栈中。
  • 出栈:当方法执行完成后,栈帧被弹出,返回控制权给调用方法。

2.3 栈的大小

  • 可通过 JVM 启动参数进行设置,例如 -Xss
  • 栈的大小影响到方法的递归深度和局部变量的数量。

-Xss 为jvm启动的每个线程分配的内存大小,默认JDK1.4中是256K,JDK1.5+中是1M

2.4 线程私有

每个线程都有自己的虚拟机栈,互不干扰。线程之间的局部变量和操作数栈是独立的。

2.5 内存管理

  • 虚拟机栈的创建和销毁速度快,适合存储短期使用的局部变量和方法调用信息。
  • 栈帧的大小在方法调用时确定,通常不会发生动态改变。

2.6 异常处理

如果方法调用过程中发生异常,JVM 会通过栈帧的结构来查找异常处理器,确保程序能够正确处理异常。 虚拟机栈可能会抛出两种异常:

  • 如果线程请求的栈深度大于虚拟机所规定的栈深度(栈帧的数量过多或者某些栈帧过大),则会抛出StackOverFlowError即SOE栈溢出
  • 如果虚拟机的栈容量可以动态扩展,那么当虚拟机栈申请不到内存时会抛出OutOfMemoryError即OOM内存溢出

3、本地方法栈

本地方法栈与Java虚拟机栈相似。都是线程私有的,生命周期也与线程相同,都会抛出OutOfMemoryError和StackOverFlowError,但区别在于本地方法栈为虚拟机使用到的本地native方法服务。

4、堆

堆是JVM内存占用最大,在虚拟机启动的时候就已经创建且被所有线程共享。其唯一的用途就是存放对象实例(new出来的数据),所有的对象实例及数组都在堆上进行分配。当堆没有内存分配给对象实例时,会抛出OutOfMemoryError。这部分空间可通过 GC 进行回收。

堆进一步的内存分块划分:

  • 新生带(年轻代):新对象和没达到一定年龄的对象都在新生代
  • 老年代(养老区):被长时间使用的对象,老年代的内存空间应该要比年轻代更大
  • 永久代(JDK1.7及以前):一些方法中的操作临时对象等,JDK1.8 之前是占用 JVM 内存,JDK1.8 之后直接使用物理内存被元空间替代,所以JDK1.8以后永久代不再存在。

设置堆大小

内存大小-Xmx/-Xms 使用示例: -Xmx20m -Xms5m 说明: 当下Java应用最大可用内存为20M, 最小内存为5M

5、元空间

元空间也叫元数据区取代了1.7版本及以前的永久代。元空间和永久代本质上都是方法区的实现。方法区存放虚拟机加载的类信息静态变量常量编译后的代码缓存等数据。

三、 垃圾回收简介

什么是垃圾回收

垃圾回收是Java虚拟机(JVM)用于自动管理程序中不再使用的内存资源。在Java中,当对象不再被引用时,即没有任何指针指向该对象时,该对象就可以被认为是垃圾。

垃圾收集主要是针对堆和方法区进行;程序计数器、虚拟机栈和本地方法栈这三个区域属于线程私有的,只存在于线程的生命周期内,线程结束之后也会消失,因此不需要对这三个区域进行垃圾回收。

为什么要垃圾回收

如果不进行垃圾回收,内存迟早都会被消耗空,因为我们在不断的分配内存空间,如果不进行回收,将会造成内存溢出等问题。所以,垃圾回收是必须的。

哪些内存需要回收

哪些内存需要回收是垃圾回收机制第一个要考虑的问题,所谓“要回收的垃圾”无非就是那些不可能再被任何途径使用的对象。那么如何找到这些对象?

引用计数算法

这个算法的实现是给对象中添加一个引用计数器,每当一个地方引用这个对象时,计数器值+1,当引用失效时,计数器值-1。引用计数为 0 的对象可被回收。两个对象出现循环引用的情况下,此时引用计数器永远不为 0,导致无法对它们进行回收。正因为循环引用的存在,因此 Java 虚拟机不使用引用计数算法。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
public class ReferenceCountingGC
{
    private Object instance = null;
    private static final int _1MB = 1024 * 1024;

    /** 这个成员属性唯一的作用就是占用一点内存 */
    private byte[] bigSize = new byte[2 * _1MB];

    public static void main(String[] args)
    {
        ReferenceCountingGC objectA = new ReferenceCountingGC();
        ReferenceCountingGC objectB = new ReferenceCountingGC();
        objectA.instance = objectB;
        objectB.instance = objectA;
        objectA = null;
        objectB = null;

        System.gc();
    }
}

可达性分析算法

通过GC Roots作为起始点进行搜索,能够到达到的对象都是存活的,不可达的对象可被回收。

在Java语言中,可以作为GCRoots的对象包括下面几种:

  • 虚拟机栈中引用的对象
  • 本地方法栈中引用的对象
  • 方法区中类静态属性引用的对象
  • 方法区中的常量引用的对象
1

由图可知,Object5、Object6、Object7都没有到GCRoots对象的引用链,即便Object5、Object6、Object7之间有引用链,他们还是会被当成垃圾处理,可以进行回收。

四种引用状态

无论是通过引用计数算法判断对象的引用数量,还是通过可达性分析算法判断对象是否可达,判定对象是否可被回收都与引用有关。

  • 强引用 代码中普遍存在的类似"Object obj = new Object()“这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。
1
Object obj = new Object();
  • 软引用 描述有些还有用但并非必需的对象。在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围进行二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。Java中的类SoftReference表示软引用。
1
2
3
Object obj = new Object();
SoftReference<Object> sf = new SoftReference<Object>(obj);
obj = null;
  • 弱引用 描述非必需对象。被弱引用关联的对象只能生存到下一次垃圾回收之前,垃圾收集器工作之后,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。Java中的类WeakReference表示弱引用。
1
2
3
Object obj = new Object();
WeakReference<Object> wf = new WeakReference<Object>(obj);
obj = null;
  • 虚引用 这个引用存在的唯一目的就是在这个对象被收集器回收时收到一个系统通知,被虚引用关联的对象,和其生存时间完全没关系。Java中的类PhantomReference表示虚引用。
1
2
3
Object obj = new Object();
PhantomReference<Object> pf = new PhantomReference<Object>(obj);
obj = null;

方法区的回收

因为方法区主要存放元空间(JDK1.7 永久代)对象,而元空间对象的回收率比新生代低很多,因此在方法区上进行回收性价比不高。主要是对废弃常量的回收和对无用类的卸载。

在大量使用反射、动态代理、CGLib 等 ByteCode 框架、动态生成 JSP 以及 OSGi 这类频繁自定义 ClassLoader 的场景都需要虚拟机具备类卸载功能,以保证不会出现内存溢出。

对常量的回收,例如如果一个字符串“abc”已经进入常量池,但是当前系统没有任何一个String对象引用了叫做“abc”的字面量,那么,如果发生垃圾回收并且有必要时,“abc”就会被系统移出常量池。常量池中的其他类(接口)、方法、字段的符号引用也与此类似。

类的卸载条件很多,需要满足以下三个条件,并且满足了也不一定会被卸载:

  • 该类所有的实例都已经被回收,也就是堆中不存在该类的任何实例。
  • 加载该类的 ClassLoader 已经被回收。
  • 该类对应的 Class 对象没有在任何地方被引用,也就无法在任何地方通过反射访问该类方法。

可以通过 -Xnoclassgc 参数来控制是否对类进行卸载。

3.4 垃圾回收算法

  • 标记-清除

    将存活的对象进行标记,然后清理掉未被标记的对象。但标记和清除效率过程效率不高,会产生大量不连续的内存碎片,导致无法给大对象分配内存。

  • 标记-整理

    让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。

  • 复制

    将内存划分为大小相等的两块,每次只使用其中一块,当这一块内存用完了就将还存活的对象复制到另一块上面,然后再把使用过的内存空间进行一次清理。不足之处是只使用了内存的一半。现在的商业虚拟机都采用这种收集算法来回收新生代,但是并不是将新生代划分为大小相等的两块,而是分为一块较大的 Eden 空间和两块较小的 Survivor 空间,每次使用 Eden 空间和其中一块 Survivor。在回收时,将 Eden 和 Survivor 中还存活着的对象一次性复制到另一块 Survivor 空间上,最后清理 Eden 和使用过的那一块 Survivor。HotSpot 虚拟机的 Eden 和 Survivor 的大小比例默认为 8:1,保证了内存的利用率达到 90%。如果每次回收有多于 10% 的对象存活,那么一块 Survivor 空间就不够用了,此时需要依赖于老年代进行分配担保,也就是借用老年代的空间存储放不下的对象。

  • 分代收集

    现在的商业虚拟机采用分代收集算法,它根据对象存活周期将内存划分为几块,不同块采用适当的收集算法。

    一般将堆分为新生代和老年代。

    • 新生代使用: 复制算法
    • 老年代使用: 标记 - 清除 或者 标记 - 整理 算法

3.5 垃圾收集器

  • Serial收集器

  • ParNew 收集器

  • Parallel Scavenge 收集器

  • Serial Old 收集器

  • Parallel Old 收集器

  • CMS 收集器

  • G1 收集器

四、类加载过程

类的生命周期

类从被加载到虚拟机内存中开始到卸载出内存为止,它的整个生命周期可以简单概括为 7 个阶段:加载验证准备解析初始化使用卸载。其中,验证、准备和解析这三个阶段可以统称为连接

1

类加载过程包括了加载验证准备解析初始化五个阶段,加载、验证、准备、初始化顺序都是确定的,但解析阶段不一定,为了支持java运行时绑定(动态绑定),可以在初始化后再开始。

加载

加载是类加载过程的第一个阶段,在加载阶段,虚拟机需要完成以下三件事情:

  • 通过一个类的全限定名来获取其定义的二进制字节流。
  • 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
  • 在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口。

加载阶段,开发人员既可以使用系统提供的类加载器来完成加载,也可以自定义加载器来完成加载。

加载.class文件的方式:

  • 从本地系统中直接加载
  • 通过网络下载.class文件
  • 从zip,jar等归档文件中加载.class文件
  • 从专有数据库中提取.class文件
  • 将Java源文件动态编译为.class文件

验证

验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。验证阶段大致会完成4个阶段的检验动作:

  • 文件格式验证: 验证字节流是否符合Class文件格式的规范;例如: 是否以0xCAFEBABE开头、主次版本号是否在当前虚拟机的处理范围之内、常量池中的常量是否有不被支持的类型。

  • 元数据验证: 对字节码描述的信息进行语义分析(注意: 对比javac编译阶段的语义分析),以保证其描述的信息符合Java语言规范的要求;例如: 这个类是否有父类,除了java.lang.Object之外。

  • 字节码验证: 通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。

  • 符号引用验证: 确保解析动作能正确执行。

验证阶段是非常重要的,但不是必须的,它对程序运行期没有影响,如果所引用的类经过反复验证,那么可以考虑采用-Xverifynone参数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间。

准备

准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些内存都将在方法区中分配。对于该阶段有以下几点需要注意:

  • 这时候进行内存分配的仅包括类变量(static),而不包括实例变量,实例变量会在对象实例化时随着对象一块分配在Java堆中。

  • 这里所设置的初始值通常情况下是数据类型默认的零值(如00Lnullfalse等),而不是被在Java代码中被显式地赋予的值。

解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,解析动作主要针对接口字段类方法接口方法方法类型方法句柄调用点限定符7类符号引用进行。符号引用就是一组符号来描述目标,可以是任何字面量。

直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。

初始化

初始化为类的静态变量赋予正确的初始值,JVM负责对类进行初始化,主要对类变量进行初始化。在Java中对类变量进行初始值设定有两种方式:

  • 声明类变量是指定初始值
  • 使用静态代码块为类变量指定初始值

JVM初始化步骤

  • 假如这个类还没有被加载和连接,则程序先加载并连接该类
  • 假如该类的直接父类还没有被初始化,则先初始化其直接父类
  • 假如类中有初始化语句,则系统依次执行这些初始化语句

类初始化时机: 只有当对类的主动使用的时候才会导致类的初始化,类的主动使用包括以下六种:

  • 创建类的实例,也就是new的方式
  • 访问某个类或接口的静态变量,或者对该静态变量赋值
  • 调用类的静态方法
  • 反射(如Class.forName(“com.pdai.jvm.Test”))
  • 初始化某个类的子类,则其父类也会被初始化
  • Java虚拟机启动时被标明为启动类的类,直接使用java.exe命令来运行某个主类

使用

类访问方法区内的数据结构的接口, 对象是Heap区的数据。

卸载

Java虚拟机将结束生命周期的几种情况

  • 执行了System.exit()方法
  • 程序正常执行结束
  • 程序在执行过程中遇到了异常或错误而异常终止
  • 由于操作系统出现错误而导致Java虚拟机进程终止