文章目录
- 前言
- 代码示例
- 1.魔数
- 2.版本
- 3.常量池
- 4.访问标识与继承信息
- 访问标识
- 继承信息
- 5.Field 信息
- 6 Method 信息
- 构造方法分析(method-main)
- main方法分析(method-main)
- 7.附加属性
前言
在 Java 中,JVM 可以理解的代码就叫做字节码(即扩展名为 .class 的文件),它不面向任何特定的处理器,只面向虚拟机。Java 语言通过字节码的方式,在一定程度上解决了传统解释型语言执行效率低的问题,同时又保留了解释型语言可移植的特点。
所以 Java 程序运行时比较高效,而且,由于字节码并不针对一种特定的机器,因此,Java 程序无须重新编译便可在多种不同操作系统的计算机上运行。
根据 JVM 规范,类文件结构通过 ClassFile 定义,有点类似 C 语言的结构体。
ClassFile 的结构如下:
ClassFile {u4 magic;//魔术u2 minor_version;//版本u2 major_version;//版本u2 constant_pool_count;//常量池长度cp_info constant_pool[constant_pool_count-1];//常量池信息u2 access_flags;//访问标识u2 this_class;u2 super_class;u2 interfaces_count;u2 interfaces[interfaces_count];u2 fields_count;//成员变量数量field_info fields[fields_count];//成员变量信息u2 methods_count;//方法数量method_info methods[methods_count];//方法信息u2 attributes_count;attribute_info attributes[attributes_count];
}
通过分析 ClassFile 的内容,我们便可以知道 class 文件的组成。
代码示例
一个简单的 HelloWorld.java
// HelloWorld 示例
public class HelloWorld {public static void main(String[] args) {System.out.println("hello world");}
}
执行 javac -parameters -d . HellowWorld.java
编译为 HelloWorld.class 后是这个样子的:
[root@localhost ~]# od -t xC HelloWorld.class
0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09
0000020 00 16 00 17 08 00 18 0a 00 19 00 1a 07 00 1b 07
0000040 00 1c 01 00 06 3c 69 6e 69 74 3e 01 00 03 28 29
0000060 56 01 00 04 43 6f 64 65 01 00 0f 4c 69 6e 65 4e
0000100 75 6d 62 65 72 54 61 62 6c 65 01 00 12 4c 6f 63
0000120 61 6c 56 61 72 69 61 62 6c 65 54 61 62 6c 65 01
0000140 00 04 74 68 69 73 01 00 1d 4c 63 6e 2f 69 74 63
0000160 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c 6f
0000200 57 6f 72 6c 64 3b 01 00 04 6d 61 69 6e 01 00 16
0000220 28 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72
0000240 69 6e 67 3b 29 56 01 00 04 61 72 67 73 01 00 13
0000260 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69
0000300 6e 67 3b 01 00 10 4d 65 74 68 6f 64 50 61 72 61
0000320 6d 65 74 65 72 73 01 00 0a 53 6f 75 72 63 65 46
0000340 69 6c 65 01 00 0f 48 65 6c 6c 6f 57 6f 72 6c 64
0000360 2e 6a 61 76 61 0c 00 07 00 08 07 00 1d 0c 00 1e
0000400 00 1f 01 00 0b 68 65 6c 6c 6f 20 77 6f 72 6c 64
0000420 07 00 20 0c 00 21 00 22 01 00 1b 63 6e 2f 69 74
0000440 63 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c
0000460 6f 57 6f 72 6c 64 01 00 10 6a 61 76 61 2f 6c 61
0000500 6e 67 2f 4f 62 6a 65 63 74 01 00 10 6a 61 76 61
0000520 2f 6c 61 6e 67 2f 53 79 73 74 65 6d 01 00 03 6f
0000540 75 74 01 00 15 4c 6a 61 76 61 2f 69 6f 2f 50 72
0000560 69 6e 74 53 74 72 65 61 6d 3b 01 00 13 6a 61 76
0000600 61 2f 69 6f 2f 50 72 69 6e 74 53 74 72 65 61 6d
0000620 01 00 07 70 72 69 6e 74 6c 6e 01 00 15 28 4c 6a
0000640 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69 6e 67 3b
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01
0000700 00 07 00 08 00 01 00 09 00 00 00 2f 00 01 00 01
0000720 00 00 00 05 2a b7 00 01 b1 00 00 00 02 00 0a 00
0000740 00 00 06 00 01 00 00 00 04 00 0b 00 00 00 0c 00
0000760 01 00 00 00 05 00 0c 00 0d 00 00 00 09 00 0e 00
0001000 0f 00 02 00 09 00 00 00 37 00 02 00 01 00 00 00
0001020 09 b2 00 02 12 03 b6 00 04 b1 00 00 00 02 00 0a
0001040 00 00 00 0a 00 02 00 00 00 06 00 08 00 07 00 0b
0001060 00 00 00 0c 00 01 00 00 00 09 00 10 00 11 00 00
0001100 00 12 00 00 00 05 01 00 10 00 00 00 01 00 13 00
0001120 00 00 02 00 14
1.魔数
0~3 字节,表示它是否是【class】类型的文件
0000000 ca fe ba be
00 00 00 34 00 23 0a 00 06 00 15 09
每个 Class 文件的头 4 个字节称为魔数(Magic Number),它的唯一作用是确定这个文件是否为一个能被虚拟机接收的 Class 文件。Java 规范规定魔数为固定值:0xCAFEBABE。如果读取的文件不是以这个魔数开头,Java 虚拟机将拒绝加载它。
2.版本
4~7 字节,表示类的版本 00 34(52) 表示是 Java 8
0000000 ca fe ba be 00 00 00 34
00 23 0a 00 06 00 15 09
紧接着魔数的四个字节存储的是 Class 文件的版本号:第 5 和第 6 个字节是次版本号,第 7 和第 8 个字节是主版本号。
每当 Java 发布大版本(比如 Java 8,Java9)的时候,主版本号都会加 1。你可以使用 javap -v 命令来快速查看 Class 文件的版本号信息。
高版本的 Java 虚拟机可以执行低版本编译器生成的 Class 文件,但是低版本的 Java 虚拟机不能执行高版本编译器生成的 Class 文件。所以,我们在实际开发的时候要确保开发的的 JDK 版本和生产环境的 JDK 版本保持一致。
3.常量池
紧接着主次版本号之后的是常量池,常量池的数量是 constant_pool_count-1(常量池计数器是从 1 开始计数的,将第 0 项常量空出来是有特殊考虑的,索引值为 0 代表“不引用任何一个常量池项”)。
常量池主要存放两大常量:字面量和符号引用。字面量比较接近于 Java 语言层面的的常量概念,如文本字符串、声明为 final 的常量值等。而符号引用则属于编译原理方面的概念。包括下面三类常量:
- 类和接口的全限定名
- 字段的名称和描述符
- 方法的名称和描述符
常量池中每一项常量都是一个表,这 14 种表有一个共同的特点:开始的第一位是一个 u1 类型的标志位 -tag 来标识常量的类型,代表当前这个常量属于哪种常量类型。
.class 文件可以通过javap -v class类名 指令来看一下其常量池中的信息(javap -v class类名-> temp.txt:将结果输出到 temp.txt 文件)。
4.访问标识与继承信息
访问标识
在常量池结束之后,紧接着的两个字节代表访问标志,这个标志用于识别一些类或者接口层次的访问信息,包括:这个 Class 是类还是接口,是否为 public 或者 abstract 类型,如果是类的话是否声明为 final 等等。
0000660 29 56 00 21
00 05 00 06 00 00 00 00 00 02 00 01
21 表示20+1,所以该 class 是一个类,公共的
类访问和属性修饰符:
继承信息
类索引、父类索引和接口索引集合按照顺序排在访问标志之后,Java 类的继承关系由类索引、父类索引和接口索引集合三项确定。
类索引用于确定这个类的全限定名,父类索引用于确定这个类的父类的全限定名,由于 Java 语言的单继承,所以父类索引只有一个,除了 java.lang.Object 之外,所有的 Java 类都有父类,因此除了 java.lang.Object 外,所有 Java 类的父类索引都不为 0。
接口索引集合用来描述这个类实现了哪些接口,这些被实现的接口将按 implements (如果这个类本身是接口的话则是extends) 后的接口顺序从左到右排列在接口索引集合中。
0000660 29 56 00 21 00 05
00 06 00 00 00 00 00 02 00 01
05 表示根据常量池中 #5 找到本类全限定名
0000660 29 56 00 21 00 05 00 06
00 00 00 00 00 02 00 01
06 表示根据常量池中 #6 找到父类全限定名
0000660 29 56 00 21 00 05 00 06 00 00
00 00 00 02 00 01
表示接口的数量,本类为 0
5.Field 信息
0000660 29 56 00 21 00 05 00 06 00 00 00 00
00 02 00 01
表示成员变量数量,本类为 0
字段表(field info)用于描述接口或类中声明的变量。字段包括类级变量以及实例变量,但不包括在方法内部声明的局部变量。
field info(字段表) 的结构:
- access_flags: 字段的作用域(public ,private,protected修饰符),是实例变量还是类变量(static修饰符),可否被序列化(transient 修饰符),可变性(final),可见性(volatile 修饰符,是否强制从主内存读写)。
- name_index: 对常量池的引用,表示的字段的名称;
- descriptor_index: 对常量池的引用,表示字段和方法的描述符;
- attributes_count: 一个字段还会拥有一些额外的属性,attributes_count 存放属性的个数;
- attributes[attributes_count]: 存放具体属性具体内容。
上述这些信息中,各个修饰符都是布尔值,要么有某个修饰符,要么没有,很适合使用标志位来表示。而字段叫什么名字、字段被定义为什么数据类型这些都是无法固定的,只能引用常量池中常量来描述。
6 Method 信息
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02
00 01
表示方法数量,本类为 2
一个方法由 访问修饰符,名称,参数描述,方法属性数量,方法属性组成
构造方法分析(method-main)
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01
代表访问修饰符(本类中是 public)
0000700 00 07
00 08 00 01 00 09 00 00 00 2f 00 01 00 01
代表引用了常量池 #07 项作为方法名称
0000700 00 07 00 08
00 01 00 09 00 00 00 2f 00 01 00 01
代表引用了常量池 #08 项作为方法参数描述
0000700 00 07 00 08 00 01
00 09 00 00 00 2f 00 01 00 01
代表方法属性数量,本方法是 1
0000700 00 07 00 08 00 01 00 09 00 00 00 2f 00 01 00 01
0000720 00 00 00 05 2a b7 00 01 b1 00 00 00 02 00 0a 00
0000740 00 00 06 00 01 00 00 00 04 00 0b 00 00 00 0c 00
0000760 01 00 00 00 05 00 0c 00 0d 00 00 00 09 00 0e 00
代表方法属性
- 00 09 表示引用了常量池 #09 项,发现是【Code】属性
- 00 00 00 2f 表示此属性的长度是 47
- 00 01 表示【操作数栈】最大深度
- 00 01 表示【局部变量表】最大槽(slot)数
- 00 00 00 05 表示字节码长度,本例是 5
- 2a b7 00 01 b1 是字节码指令(构造方法内部真正要执行这五个字节的代码)
- 00 00 00 02 表示方法细节属性数量,本例是 2
- 00 0a 表示引用了常量池 #10 项,发现是【LineNumberTable】属性
- 00 00 00 06 表示此属性的总长度,本例是 6
- 00 01 表示【LineNumberTable】长度
- 00 00 表示【字节码】行号 00 04 表示【java 源码】行号
- 00 0b 表示引用了常量池 #11 项,发现是【LocalVariableTable】属性
- 00 00 00 0c 表示此属性的总长度,本例是 12
- 00 01 表示【LocalVariableTable】长度
- 00 00 表示局部变量生命周期开始,相对于字节码的偏移量
- 00 05 表示局部变量覆盖的范围长度
- 00 0c 表示局部变量名称,本例引用了常量池 #12 项,是【this】
- 00 0d 表示局部变量的类型,本例引用了常量池 #13 项,是【Lcn/qf/jvm/HelloWorld;】
- 00 00 表示局部变量占有的槽位(slot)编号,本例是 0
main方法分析(method-main)
0000760 01 00 00 00 05 00 0c 00 0d 00 00 00 09
00 0e 00
代表访问修饰符(本类中是 public static)
0000760 01 00 00 00 05 00 0c 00 0d 00 00 00 09 00 0e 00
代表引用了常量池 #14 项作为方法名称
0000760 01 00 00 00 05 00 0c 00 0d 00 00 00 09 00 0e 00
0001000 0f
00 02 00 09 00 00 00 37 00 02 00 01 00 00 00
代表引用了常量池 #15 项作为方法参数描述
0001000 0f 00 02
00 09 00 00 00 37 00 02 00 01 00 00 00
代表方法属性数量,本方法是 2
0001000 0f 00 02 00 09 00 00 00 37 00 02 00 01 00 00 00
0001020 09 b2 00 02 12 03 b6 00 04 b1 00 00 00 02 00 0a
0001040 00 00 00 0a 00 02 00 00 00 06 00 08 00 07 00 0b
0001060 00 00 00 0c 00 01 00 00 00 09 00 10 00 11 00 00
代表方法属性(属性1)
- 00 09 表示引用了常量池 #09 项,发现是【Code】属性
- 00 00 00 37 表示此属性的长度是 55
- 00 02 表示【操作数栈】最大深度
- 00 01 表示【局部变量表】最大槽(slot)数
- 00 00 00 05 表示字节码长度,本例是 9
- b2 00 02 12 03 b6 00 04 b1 是字节码指令
- 00 00 00 02 表示方法细节属性数量,本例是 2
- 00 0a 表示引用了常量池 #10 项,发现是【LineNumberTable】属性
- 00 00 00 0a 表示此属性的总长度,本例是 10
- 00 02 表示【LineNumberTable】长度
- 00 00 表示【字节码】行号 00 06 表示【java 源码】行号
- 00 08 表示【字节码】行号 00 07 表示【java 源码】行号
- 00 0b 表示引用了常量池 #11 项,发现是【LocalVariableTable】属性
- 00 00 00 0c 表示此属性的总长度,本例是 12
- 00 01 表示【LocalVariableTable】长度
- 00 00 表示局部变量生命周期开始,相对于字节码的偏移量
- 00 09 表示局部变量覆盖的范围长度
- 00 10 表示局部变量名称,本例引用了常量池 #16 项,是【args】
- 00 11 表示局部变量的类型,本例引用了常量池 #17 项,是【[Ljava/lang/String;】
- 00 00 表示局部变量占有的槽位(slot)编号,本例是 0
红色代表方法属性(属性2)
0001100 00 12 00 00 00 05 01 00 10 00 00
00 01 00 13 00
- 00 12 表示引用了常量池 #18 项,发现是【MethodParameters】属性
- 00 00 00 05 表示此属性的总长度,本例是 5
- 01 参数数量
- 00 10 表示引用了常量池 #16 项,是【args】
- 00 00 访问修饰符 00 01表示final修饰
7.附加属性
0001100 00 12 00 00 00 05 01 00 10 00 00 00 01 00 13 00
0001120 00 00 02 00 14
00 01 表示附加属性数量
00 13 表示引用了常量池 #19 项,即【SourceFile】
00 00 00 02 表示此属性的长度
00 14 表示引用了常量池 #20 项,即【HelloWorld.java】
参考文献
Java Virtual Machine Specification - Chapter 4. The class File Format