JVM 实战(4)

11、JVM 实战 - 执行引擎篇

一、执行引擎是做什么的

执行引擎是Java虚拟机的核心组成部分之一
虚拟机是一个相对于“物理机”的概念，这两种机器都有代码执行能力，其区别是物理机的执行引擎是直接建立在处理器、缓存、指令集和操作系统层面上的，而虚拟机的执行引擎则是由软件自行实现的，因此可以不受物理条件制约地定制指令集与执行引擎的结构体系，能够执行那些不被硬件直接支持的指令集格式。
JVM的主要任务是负责装载字节码到其内部，但字节码并不能够直接运行在操作系统之上，因为字节码指令并非等价于本地机器指令，它内部包含的仅仅只是一些能够被JVM识别的字节码指令、符号表和其他辅助信息
所以，如果想让一个Java程序运行在操作系统上，执行引擎的任务就是将字节码指令解释/编译为对应平台上的本地机器指令才可以。也就是说，JVM中的执行引擎充当了将高级语言翻译为机器语言的翻译者

二、执行引擎是怎么工作的

1、执行引擎在执行的过程中究竟需要执行什么样的字节码指令完全依赖于PC寄存器；
2、每当执行完一项指令操作后，PC寄存器就会更新下一条需要被执行的指令地址；
3、在方法的执行过程中，执行引擎也有可能会通过存储在局部变量表中的对象引用准确定位到存储在Java堆区中的对象实例信息，进而还可以通过对象头中的元数据指针(类型指针)定位到方法区中目标对象的类型信息；

从外观上来看，所有Java虚拟机的执行引擎输入、输出都是一致的：

输入的是字节码二进制流
处理的过程是将字节码文件进行解释执行的过程
输出的是执行结果

三、代码编译和执行的过程

大部分的程序代码转换成物理机的目标代码或虚拟机能执行的指令集之前，都需要经过下面几个步骤。

过程一：javac.exe的执行
Java代码编译是由Java源码编译器来完成，流程图如下所示：

过程二：java.exe的执行
Java字节码的执行是由JVM执行引擎来完成，流程图如下所示：

1、编译器

Java 语言的 “编译期” 其实是一段 “不确定” 的操作过程。

1、因为它可能是指一个前端编译器（其实叫“编译器的前端”更准确一些）把.java文件转变成.class文件的过程；
2、也可能是指虚拟机的后端运行期编译器（JIT编译器，JustInTimeCompiler）把字节码转变成机器码的过程；
3、还可能是指使用静态提前编译器（AOT编译器，AheadOfTimeCompiler）直接把.java文件编译成本地机器代码的过程；

2、解释器

事实上，计算机并不认识高级语言，在执行过程中我们会把高级语言转换成计算机所能理解的一种中间格式（如汇编语言），然后才能理解计算机如何解释和执行这些中间的程序，以及系统的哪一部分影响程序的执行效率。

当Java虚拟机启动时会根据预定义的规范对字节码采用逐行解释的方式执行，将每条字节码文件中的内容“翻译”为对应平台的本地机器指令执行。

现状：

由于解释器在设计和实现上非常简单，因此除了Java语言之外，还有许多高级语言同样也是基于解释器执行的，比如Python、Perl、Ruby等。但是在今天，基于解释器执行已经沦落为低效的代名词，并且时常被一些C/C++程序员所调侃。
为了解决这个问题，JVM平台支持一种叫作即时编译的技术。即时编译的目的是避免函数被解释执行，而是将整个函数体编译成为机器码，每次函数执行时，只执行编译后的机器码即可，这种方式可以使执行效率大幅度提升。
不过无论如何，基于解释器的执行模式仍然为中间语言的发展做出了不可磨灭的贡献。

四、HotSpot VM 执行方式

解释器和JIT并存的架构

为什么说Java是半编译半解释型语言？

解释器是逐行解释，重复字节码也会解释。
JIT可以缓存热点代码。
比如在系统刚启动时，解释器可以立刻开始工作，而JIT还没完成热点缓存。

采用基于计数器的热点探测，HotSpot VM将会为每一个方法都建立2个不同类型的计数器：

方法调用计数器（Invocation Counter）：用于统计方法的调用次数
回边计数器（Back Edge Counter）：用于统计循环体执行的循环次数

两个编译器

在HotSpot VM中内嵌有两个JIT编译器，分别为Client Compiler和Server Compiler，但大多数情况下我们简称为C1编译器和C2编译器。开发人员可以通过如下命令显式指定Java虚拟机在运行时到底使用哪一种即时编译器，如下所示：

-client：指定Java虚拟机运行在client模式下，并使用C1编译器。
1、 C1编译器会对字节码进行简单和可靠的优化，耗时短。以达到更快的编译速度。
2、 client启动快，占用内存小，执行效率没有server快，默认情况下不进行动态编译，适用于桌面应用程序。
-server：指定Java虚拟机运行在Server模式下，并使用C2编译器。
1、 C2进行耗时较长的优化，以及激进优化。但优化的代码执行效率更高。
2、 server启动慢，占用内存多，执行效率高，适用于服务器端应用；

由-XX:+RewriteFrequentPairs参数控制。client模式默认关闭，server模式默认开启。

C1和C2不同的优化策略

在不同的编译器上有不同的优化策略，C1 编译器上主要有方法内联，去虚拟化、冗余消除。

方法内联：将引用的函数代码编译到引用点处，这样可以减少栈帧的生成，减少参数传递以及跳转过程。
去虚拟化：对唯一的实现类进行内联。
冗余消除：在运行期间把一些不会执行的代码折叠掉。

C2的优化主要是在全局层面，逃逸分析是优化的基础。基于逃逸分析在 C2 上有如下几种优化：

标量替换：用标量值代替聚合对象的属性值。
栈上分配：对于未逃逸的对象分配对象在栈而不是堆。
同步消除：清除同步操作，通常指 synchronized