JVM 的内存模型

了解jvm的内存模型,便于我们更好的管理客户端的内存

Posted by Yuriy on January 26, 2020

JVM 的内存模型

为什么要了解?

很多做Android开发的同学会问,我们为什么要了解这个呢?首先移动端资源有限,我们了解jvm的内存模型,便于我们更好的管理客户端的内存。

什么是JVM?

  • java代码的执行过程如下图:
  • 运行时数据区可分为:方法区、堆、虚拟机栈、本地方法栈、程序计数器五个部分。

概述

  • 方法区:线程共享数据,存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
  • 堆:线程共享数据,主要是存放对象实例和数组。内部会划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer, TLAB)。可以位于物理上不连续的空间,但是逻辑上要连续。
  • 虚拟机栈:线程隔离数据,每个方法在执行时都会床创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行结束,就对应着一个栈帧从虚拟机栈中入栈到出栈的过程。
  • 本地方法栈:线程隔离数据,区别于 Java 虚拟机栈的是,Java 虚拟机栈为虚拟机执行 Java 方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的 Native 方法服务。
  • 程序计数器:线程隔离数据,字节码解释器工作是就是通过改变这个计数器的值来选取下一条需要执行指令的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖计数器完成。

1.方法区

  Java虚拟机规范中定义方法区是堆的一个逻辑部分,但是别名Non-Heap(非堆),以与Java堆区分。方法区中存放已经被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。

特点

  • 线程共享:方法区是堆的一个逻辑部分,因此和堆一样,都是线程共享的。整个虚拟机中只有一个方法区。
  • 永久代:方法区中的信息一般需要长期存在,而且它又是堆的逻辑分区,因此用堆的划分方法,我们把方法区称为永久代。
  • 内存回收效率低:Java虚拟机规范对方法区的要求比较宽松,可以不实现垃圾收集。方法区中的信息一般需要长期存在,回收一遍内存之后可能只有少量信息无效。对方法区的内存回收的主要目标是:对常量池的回收和对类型的卸载允许固定大小,也允许可扩展的大小,还允许不实现垃圾回收。
  • 异常当方法区内存空间无法满足内存分配需求时,将抛出OutOfMemoryError异常。

2.堆(Java Heap)

  Heap是OOM故障最主要的发源地,它存储着几乎所有的实例对象,堆由垃圾收集器自动回收,堆区由各子线程共享使用。通常情况下,它占用的空间是所有内存区域中最大的,但如果无节制地创建大量对象,也容易消耗完所有的空间。堆的内存空间既可以固定大小,也可运行时动态地调整,通过如下参数设定初始值和最大值。

  1. -Xms256M. -Xmx1024M
    • 其中-X表示它是JVM运行参数
    • ms是memorystart的简称 最小堆容量
    • mx是memory max的简称 最大堆容量

  但是在通常情况下,服务器在运行过程中,堆空间不断地扩容与回缩,势必形成不必要的系统压力,所以在线上生产环境中,JVM的Xms和Xmx设置成一样大小,避免在GC后调整堆大小时带来的额外压力

  1. 堆分成两大块:新生代和老年代   对象产生之初在新生代,步入暮年时进入老年代,但是老年代也接纳在新生代无法容纳的超大对象。   新生代= 1个Eden区 + 2个Survivor区。   绝大部分对象在Eden区生成,当Eden区装填满的时候,会触发Young GC。垃圾回收的时候,在Eden区实现清除策略,没有被引用的对象则直接回收。依然存活的对象会被移送到Survivor区,这个区真是名副其实的存在。   Survivor 区分为S0和S1两块内存空间,送到哪块空间呢?每次Young GC的时候,将存活的对象复制到未使用的那块空间,然后将当前正在使用的空间完全清除,交换两块空间的使用状态。   如果YGC要移送的对象大于Survivor区容量上限,则直接移交给老年代。假如一些没有进取心的对象以为可以一直在新生代的Survivor区交换来交换去,那就错了。每个对象都有一个计数器,每次YGC都会加1。
  2. -XX:MaxTenuringThreshold 参数能配置计数器的值到达某个阈值的时候,对象从新生代晋升至老年代。如果该参数配置为1,那么从新生代的Eden区直接移至老年代。默认值是15,可以在Survivor 区交换14次之后,晋升至老年代 若Survivor区无法放下,或者超大对象的阈值超过上限,则尝试在老年代中进行分配; 如果老年代也无法放下,则会触发Full Garbage Collection(Full GC); 如果依然无法放下,则抛OOM。 堆出现OOM的概率是所有内存耗尽异常中最高的。 出错时的堆内信息对解决问题非常有帮助,所以给JVM设置运行参数-
  3. XX:+HeapDumpOnOutOfMemoryError 让JVM遇到OOM异常时能输出堆内信息。 在不同的JVM实现及不同的回收机制中,堆内存的划分方式是不一样的。 存放所有的类实例及数组对象。 除了实例数据,还保存了对象的其他信息,如Mark Word(存储对象哈希码,GC标志,GC年龄,同步锁等信息),Klass Pointy(指向存储类型元数据的指针)及一些字节对齐补白的填充数据(若实例数据刚好满足8字节对齐,则可不存在补白)

特点

  • Java虚拟机所需要管理的内存中最大的一块。
  • 堆内存物理上不一定要连续,只需要逻辑上连续即可,就像磁盘空间一样。堆是垃圾回收的主要区域,所以也被称为GC堆。
  • 堆的大小既可以固定也可以扩展,但主流的虚拟机堆的大小是可扩展的(通过-Xmx和-Xms控制),因此当线程请求分配内存,但堆已满,且内存已满无法再扩展时,就抛出OutOfMemoryError。
  • 线程共享,整个Java虚拟机只有一个堆,所有的线程都访问同一个堆。
  • 它是被所有线程共享的一块内存区域,在虚拟机启动时创建。而程序计数器、Java虚拟机栈、本地方法栈都是一个线程对应一个。

3.虚拟机栈(JVM Stack)

  相对于基于寄存器的运行环境来说,JVM是基于栈结构的运行环境。栈结构移植性更好,可控性更强。JVM中的虚拟机栈是描述Java方法执行的内存区域,它是线程私有的。栈中的元素用于支持虚拟机进行方法调用,每个方法从开始调用到执行完成的过程,就是栈帧从入栈到出栈的过程。在活动线程中,只有位于栈顶的帧才是有效的,称为当前栈帧。正在执行的方法称为当前方法。栈帧是方法运行的基本结构。在执行引擎运行时,所有指令都只能针对当前栈帧进行操作。 StackOverflowError表示请求的栈溢出,导致内存耗尽,通常出现在递归方法中。   虚拟机栈通过压/出栈的方式,对每个方法对应的活动栈帧进行运算处理,方法正常执行结束,肯定会跳转到另一个栈帧上。在执行的过程中,如果出现异常,会进行异常回溯,返回地址通过异常处理表确定。栈帧在整个JVM体系中的地位颇高,包括局部变量表、操作栈、动态连接、方法返回地址等。

  • 局部变量表 存放方法参数和局部变量。 相对于类属性变量的准备阶段和初始化阶段来说,局部变量没有准备阶段,必须显式初始化。 如果是非静态方法,则在index[0]位置上存储的是方法所属对象的实例引用,随后存储的是参数和局部变量。 字节码指令中的STORE指令就是将操作栈中计算完成的局部变量写回局部变量表的存储空间内。
  • 操作栈 操作栈是一个初始状态为空的桶式结构栈。 在方法执行过程中,会有各种指令往栈中写入和提取信息。 JVM的执行引擎是基于栈的执行引擎,其中的栈指的就是操作栈。 字节码指令集的定义都是基于栈类型的,栈的深度在方法元信息的stack属性中。 下面用一段简单的代码说明操作栈与局部变量表的交互 详细的字节码操作顺序如下: 第1处说明:局部变量表就像个中药柜,里面有很多抽屉,依次编号为0, 1, 2,3,.,. n。 字节码指令istore_ 1就是打开1号抽屉,把栈顶中的数13存进去。 栈是一个很深的竖桶,任何时候只能对桶口元素进行操作,所以数据只能在栈顶进行存取。 某些指令可以直接在抽屉里进行,比如inc指令,直接对抽屉里的数值进行+1操作。 程序员面试过程中,常见的i++和++i的区别,可以从字节码上对比出来。
  • iload_ 1从局部变量表的第1号抽屉里取出一个数,压入栈顶,下一步直接在抽屉里实现+1的操作,而这个操作对栈顶元素的值没有影响,所以istore_ 2只是把栈顶元素赋值给a。
  • 表格右列,先在第1号抽屉里执行+1操作,然后通过iload_ 1 把第1号抽屉里的数压入栈顶,所以istore_ 2存入的是+1之后的值。 这里延伸一个信息,i++并非原子操作。即使通过volatile关键字进行修饰,多个线程同时写的话,也会产生数据互相覆盖的问题。

  • 动态连接 每个栈帧中包含一个在常量池中对当前方法的引用,目的是支持方法调用过程的动态连接。
  • 方法返回地址 方法执行时有两种退出情况
    • 正常退出 正常执行到任何方法的返回字节码指令,如RETURN、IRETURN、ARETURN等。
    • 异常退出 无论何种退出情况,都将返回至方法当前被调用的位置。方法退出的过程相当于弹出当前 栈帧。

退出可能有三种方式:

  • 返回值压入,上层调用栈帧
  • 异常信息抛给能够处理的栈帧
  • PC计数器指向方法调用后的下一条指令

Java虚拟机栈是描述Java方法运行过程的内存模型。

Java虚拟机栈会为每一个即将运行的Java方法创建“栈帧”。

用于存储该方法在运行过程中所需要的一些信息。

  • 局部变量表 存放基本数据类型变量、引用类型的变量、returnAddress类型的变量。
  • 操作数栈
  • 动态链接
  • 当前方法的常量池指针
  • 当前方法的返回地址
  • 方法出口等信息

每一个方法从被调用到执行完成的过程,都对应着一个个栈帧在JVM栈中的入栈和出栈过程。

注意:人们常说,Java的内存空间分为“栈”和“堆”,栈中存放局部变量,堆中存放对象。 这句话不完全正确!这里的“堆”可以这么理解,但这里的“栈”就是现在讲的虚拟机栈,或者说Java虚拟机栈中的局部变量表部分.
真正的Java虚拟机栈是由一个个栈帧组成,而每个栈帧中都拥有:局部变量表、操作数栈、动态链接、方法出口信息。

特点

局部变量表的创建是在方法被执行的时候,随着栈帧的创建而创建,而且表的大小在编译期就确定,在创建的时候只需分配事先规定好的大小即可,在方法运行过程中,表的大小不会改变。

Java虚拟机栈会出现两种异常:

  • StackOverFlowError 若Java虚拟机栈的内存大小不允许动态扩展,那么当线程请求的栈深度大于虚拟机允许的最大深度时(但内存空间可能还有很多),就抛出此异常
  • OutOfMemoryError 若Java虚拟机栈的内存大小允许动态扩展,且当线程请求栈时内存用完了,无法再动态扩展了,此时抛出OutOfMemoryError异常 Java虚拟机栈也是线程私有的,每个线程都有各自的Java虚拟机栈,而且随着线程的创建而创建,随着线程的死亡而死亡。

4.本地方法栈(Native Method Stack)

  本地方法栈和Java虚拟机栈实现的功能与抛出异常几乎相同,只不过虚拟机栈是为虚拟机执行Java方法(也就是字节码)服务,本地方法区则为虚拟机使用到的Native方法服务。

  在JVM内存布局中,也是线程对象私有的,但是虚拟机栈“主内”,而本地方法栈“主外”。这个“内外”是针对JVM来说的,本地方法栈为Native方法服务。线程开始调用本地方法时,会进入一个不再受JVM约束的世界。本地方法可以通过JNI(Java Native Interface)来访问虚拟机运行时的数据区,甚至可以调用寄存器,具有和JVM相同的能力和权限。当大量本地方法出现时,势必会削弱JVM对系统的控制力,因为它的出错信息都比较黑盒。对于内存不足的情况,本地方法栈还是会拋出native heap OutOfMemory。最著名的本地方法应该是System.currentTimeMillis(),JNI 使Java深度使用OS的特性功能,复用非Java代码。但是在项目过程中,如果大量使用其他语言来实现JNI,就会丧失跨平台特性,威胁到程序运行的稳定性。假如需要与本地代码交互,就可以用中间标准框架进行解耦,这样即使本地方法崩溃也不至于影响到JVM的稳定。当然,如果要求极高的执行效率、偏底层的跨进程操作等,可以考虑设计为JNI调用方式。

5.程序计数寄存器(Program Counter Register)

  Register 的命名源于CPU的寄存器,CPU只有把数据装载到寄存器才能够运行 寄存器存储指令相关的现场信息,由于CPU时间片轮限制,众多线程在并发执行过程中,任何一个确定的时刻,一个处理器或者多核处理器中的一个内核,只会执行某个线程中的一条指令。这样必然导致经常中断或恢复,如何保证分毫无差呢? 每个线程在创建后,都会产生自己的程序计数器和栈帧,程序计数器用来存放执行指令的偏移量和行号指示器等,线程执行或恢复都要依赖程序计数器。程序计数器在各个线程之间互不影响,此区域也不会发生内存溢出异常。

定义

  程序计数器是一块较小的内存空间,可看作当前线程正在执行的字节码的行号指示器。 如果当前线程正在执行的是

  • Java方法 计数器记录的就是当前线程正在执行的字节码指令的地址
  • 本地方法 那么程序计数器值为undefined

作用

  1. 字节码解释器通过改变程序计数器来依次读取指令,从而实现代码的流程控制,如:顺序执行、选择、循环、异常处理。
  2. 在多线程的情况下,程序计数器用于记录当前线程执行的位置,从而当线程被切换回来的时候能够知道该线程上次运行到哪儿了。

特点

  • 一块较小的内存空间。
  • 线程私有。每条线程都有一个独立的程序计数器。
  • 是唯一一个不会出现OOM的内存区域。
  • 生命周期随着线程的创建而创建,随着线程的结束而死亡。

课后题目

public class DemoTest {

 int y;// 分布在堆上
 
 public static void main(String[] args) {
    int x = 1; //分配在栈上
    String name = new String("cat"); //数据在堆上,name变量的指针在栈上
    String address = "杭州"; //数据在常量池,属于堆空间,指针在栈
    Integer price = 4; //包装类型同样是引用类型,编译时会自动装拆相,所以数据在堆上,指针在栈
 }
}

了解更移动开发知识,欢迎关注公众号: