Android---字节码层面分析Class类文件

Java 提供了一种可以在所有平台上都能使用的一种中间代码---字节码文件(.class文件)。有了字节码,无论是那个平台只要安装了虚拟机都可以直接运行字节码文件。有了虚拟机,解除了 java 虚拟机与 java 代码之间的耦合。

Java 虚拟机当初被设计出来时就不单单只运行 java 这一种语言,目前 java 虚拟机已经可以支持很多除 java 语言以外的其它语言了,比如 Groovy, JRuby, json, skilla等。之所以可以支持其它语言,是因为这些语言经过编译之后,也可以生成能够被 JVM 解析并执行的字节码文件。而虚拟机并不关心字节码是由哪一种语言编译而来,如下图所示:

class 文件

从纵观的角度看,class 文件里只有两种数据结构:无符号数

\bullet 无符号数:属于基本的数据类型。以 u1,u2,u4,u8来分别代表 1 个字节、2个字节、4个字节和8个字节的无符号数。无符号数可以用来描述数字、索引引用,数量值或者字符串(UTF-8编码)。

\bullet 表:表由多个无符号数或者其它表作为数据项构成的复合数据类型。class 文件中所有的表都以“_info”结尾。整个 class 文件本质上就是一张表。

表和无符号数之间的关心

class 文件结构

无符号数和表组成了 class 中的各个结构,这些结构按照预先规定好的顺序紧密的从前向后排列,相邻的项之间没有任何间隙。当 JVM 加载某个 class 文件时,JVM 就是根据上图中的结构去解析 class 文件。加载 class 文件到内存中,并在内存中分配相应的内存空间,具体某种结构需要占用多大的空间,可以参考如下图:

实例解析:

把 test.java 编译成 test.class 文件。用十六进制编辑器打开 .class 文件(可以用在线的编辑器 HexD.it)。

package software_test;import java.io.Serializable;public class test implements Serializable, Cloneable {private int num = 1;public int add(int i) {int j = 10;num = num + i + j;return num;}}

打开 test.class 文件的内容

1. 魔数(magic number)

在 class 文件开头的四个字节是 class 文件的魔数,它是一个固定的值--0XCAFEBABE。魔数是 class 文件的标志,它是判断一个文件是不是 class 格式文件的标准。

2. 版本号

前两个字节 0000代表次版本号(minor_version),后两个字节 0034 是主版本号(major_version),对应的十进制值为52,当前 class 文件的主版本号为52,次版本号为0,所以综合版本号是52.0,也就是 jdk1.8.0。

3. 常量池

紧跟在版本号之后的是一个叫做常量池的表(cp_info)。在常量池中保存了类的各种相关信息,比如类的名称父类的名称类中的方法名参数名称参数类型等。

常量池中的每一项都是一个表,其项目类型共有14种。常量池中的每一项都会有一个 u1 大小的 tag 值,是表的标识。

JVM 解析 class 文件时,通过 tag 值来判断当前数据结构是哪一个表。例如,CONSTANT_Class_info 表:

tag:占用一个字节大小,值为为7,说明是 CONSTANT_Class_info 类型表。

name_index:是一个索引值,可以将它理解为一个指针,指向常量池中索引为 name_index 的常量表。比如 name_index = 7,则它指向常量池中第7个常量表(表与表之间是有关联的)。

再例如 CONSTANT_Utf8_info 表:

tag:值为1,表示是 CONSTANT_Utf8_info类型表。

length:表示 u1[]的长度,比如length = 5,则表示接下来的数据是 5 个连续的u1类型数据。

bytes: u1 类型数组,长度为上面第2个参数 length 的值。

面试题:Java 源文件中 String 字符串的长度 有限制吗?

有(字符串存储在Class文件的常量池中)。在 Java 代码中声明的 String 字符串最终在 class 文件中的存储格式是 CONSTANT_utf8_info因此一个字符串最大长度也就是 u2 所能代表的最大值 65536(2^16) 个,但是需要使用2个来保存null值,因此一个字符串的最大长度为 65536 - 2 = 65534。

class 文件在常量池的前面使用2个字节的容量计数器,用来代表当前类中常量池的大小。

001D 转化为十进制为29,即常量计数器的值为29。其中下标为0的常量被 JVM 留作其他特殊用途,因此 Test.class 中时间的常量池大小为这个计数器的值减1,也就是28个。

第一个常量:

0A 转化为十进制为10,通过查看常量池14种表格图,可以查到 tag=10的表类型为 CONSTANT_Methodref_info,因此常量池中的第一个常量类型为类的方法引用表。其结构如下:

也就是说,0A之后的两个直接是指向该方法所属类,再紧跟的两个字节指向此方法的名称和类型。

0006:十进制为6,表示指向常量池中的第6个常量;

000F:十进制为15,表示指向常量池中的第 15 个常量。

至此,第一个常量解读完毕!

第二个常量:

09转化为十进制为9,即tag = 9,表示是字段引用表 CONSTANT_Fieldref_info,其结构如下:

同理,

0010:指向常量池中第 16 个常量,0011指向常量池中第17个常量。

至此,我们已经解析了常量池中的2个常量,剩下的26个常量也是如此。

4. 访问标志

紧跟在常量池之后的常量是访问标志,占用两个字节。访问标志代表类或者接口的访问信息。比如:该 class 文件是类还是接口,是否被定义成 public,是否是 abstract,如果是类,是否被声明成 final 等。各种访问标志如下图所示:

我们定义的 test.java 是一个普通 Java 类,不是接口、枚举或注解,并且被 public 修饰但没有被声明为 final 和 abstract,因此它所对应的 access_flags 为 0021(0X0001 和 0X0020相结合)。

5. 类索引、父类索引和接口索引计时器

访问标志后的2个字节就是类索引,类索引后的2个字节就是父类索引,父类索引后的2个字节则是接口索引计数器。如下图所示:

 综上所述,我们可以得出当前类为 Test继承自 Object 类,并实现了 “Serializable”和“Cloneable”这两个接口。 

6. 字段表

紧跟在接口索引集合后面的就是字段表,字段表的主要功能是用来描述类或者接口中声明的变量。这里的字段包含了类级别变量以及实例变量,但不包含方法中的局部变量。其具体结构如下:

字段访问标志

其中,第7和8个常量就 num 和 i。因此可以得出,类中有一个为num,类型为 int  的变量。

7. 方法表

字段之后跟着的就是方法表常量,方法表常量应该也是以一个计数器开始的,因为一个类中的方法数量是不固定的。

上图表示 test.class中有两个方法,但是我们只在 test.java 中声明了一个 add 方法,因为默认构造器方法也被包含在方法表常量中。方法表结构如下:

访问标志

8. 属性表

在之前解析字段和方法的时候,在它们的具体结构中,都能看到有一个叫做 attributes_info 的表,这就是属性表。属性表没有一个固定结构,各种不同的属性只要满足以下结构即可:

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/149315.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何搭建一个 websocket

环境: NodeJssocket.io 4.7.2 安装依赖 yarn add socket.io创建服务器 引入文件 特别注意: 涉及到 colors 的代码,请采取 console.log() 打印 // 基础老三样 import http from "http"; import fs from "fs"; import { Server } from &quo…

安装NodeJS并使用yarn下载前端依赖

文章目录 1、安装NodeJS1.1 下载NodeJS安装包1.2 解压并配置NodeJS1.3 验证是否安装成功2、使用yarn下载前端依赖2.1 安装yarn2.2 使用yarn下载前端依赖参考目标:在Windows下安装新版NodeJS,并使用yarn下载前端依赖,实现运行前端项目。 1、安装NodeJS 1.1 下载NodeJS安装包…

面试题:Redis和MySQL的事务区别是什么?

大家好,我是小米!今天我要和大家聊聊一个在技术面试中经常被问到的问题:“Redis和MySQL的事务区别是什么?”这个问题看似简单,但实际上涉及到了数据库和缓存两个不同领域的知识,让我们一起来深入了解一下吧…

阿里云ECS和轻量服务器有什么区别?

阿里云服务器ECS和轻量应用服务器有什么区别?轻量和ECS优缺点对比,云服务器ECS是明星级云产品,适合企业专业级的使用场景,轻量应用服务器是在ECS的基础上推出的轻量级云服务器,适合个人开发者单机应用访问量不高的网站…

FFmpeg:打印音/视频信息(Meta信息)

多媒体文件基本概念 多媒体文件其实是个容器在容器里面有很多流(Stream/Track)每种流是由不同的编码器编码的从流中读出的数据称为包在一个包中包含着一个或多个帧 几个重要的结构体 AVFormatContextAVStreamAVPacket FFmpeg操作流数据的基本步骤 打印音/视频信息(Meta信息…

模糊搜索利器:Python的thefuzz模块详解

文章目录 thefuzz模块简介thefuzz模块的参数和方法使用thefuzz实现模糊搜索在Python中,thefuzz模块是一个用于实现模糊搜索的强大工具。它可以帮助我们在处理字符串时,快速找到相似的匹配项。本文将详细介绍thefuzz模块的功能和用法,并结合代码示例演示如何实现模糊搜索。 t…

pyqt5使用经验总结

pyqt5环境配置注意: 安装pyqt5 pip install PyQt5 pyqt5-tools 环境变量-创建变量名: 健名:QT_QPA_PLATFORM_PLUGIN_PATH 值为:Lib\site-packages\PyQt5\Qt\plugins pyqt5经验2: 使用designer.exe进行设计&#xff1…

三、【色彩模式与颜色填充】

文章目录 Photoshop常用的几种颜色模式包括:1. RGB模式2. CMYK模式3. 灰度模式4. LAB模式5. 多通道模式 Photoshop颜色填充1.色彩基础2.拾色器认识3.颜色填充最后附上流程图: Photoshop常用的几种颜色模式包括: 1. RGB模式 详细可参考&…

高速公路堵车动力学

S/t trace 图可以分析牛顿力学时间序列的一切。 下例分析了当车距太小时,一个轻微的刹车扰动如何触发大堵车的: 堵车由以下因素促成: 刹车反应时间,刹车反应很快,看见灯即可,即使这样越往后刹车必须越狠&…

基于混合蛙跳优化的BP神经网络(分类应用) - 附代码

基于混合蛙跳优化的BP神经网络(分类应用) - 附代码 文章目录 基于混合蛙跳优化的BP神经网络(分类应用) - 附代码1.鸢尾花iris数据介绍2.数据集整理3.混合蛙跳优化BP神经网络3.1 BP神经网络参数设置3.2 混合蛙跳算法应用 4.测试结果…

lv7 嵌入式开发-网络编程开发 12 IP协议与ethernet协议

目录 1 IP协议作用和意义 2 IP数据报首部格式 3 IP数据报分片 4 以太网协议作用和意义(链路层) 5 练习 1 IP协议作用和意义 IP网的意义 当互联网上的主机进行通信时,就好像在一个网络上通信一样,看不见互连的各具体的网络异…

基于Matlab求解高教社杯数学建模竞赛(cumcm2010A题)-储油罐的变位识别与罐容表标定(附上源码+数据+题目)

文章目录 题目解题源码数据下载 题目 通常加油站都有若干个储存燃油的地下储油罐,并且一般都有与之配套的“油位计量管理系统”,采用流量计和油位计来测量进/出油量与罐内油位高度等数据,通过预先标定的罐容表(即罐内油位高度与储…

Vue中如何进行分布式搜索与全文搜索(如Elasticsearch)

在Vue中实现分布式搜索与全文搜索(使用Elasticsearch) 分布式搜索和全文搜索在现代应用程序中变得越来越重要,因为它们可以帮助用户快速查找和检索大量数据。Elasticsearch是一种强大的分布式搜索引擎,它可以用于实现高性能的全文…

Windows系统上使用CLion远程开发Linux程序

CLion远程开发Linux程序 情景说明Ubuntu配置CLion配置同步 情景说明 在Windows系统上使用CLion开发Linux程序,安装CLion集成化开发环境时会自动安装cmake、mingw,代码提示功能也比较友好。 但是在socket开发时,包含sys/socket.h头文件时&am…

基于SSM的医院预约挂号管理系统

基于SSM的医院预约挂号管理系统的设计与实现 开发语言:Java数据库:MySQL技术:SpringSpringMVCMyBatis工具:IDEA/Ecilpse、Navicat、Maven 系统展示 前台界面 登录界面 管理员界面 医生界面 摘要 医院预约挂号管理系统是现代医疗…

调试器通用波形显示工具

前言:事情起因是我们实验室买了个无线调试器是CMSIS-DAP的,无法使用J-SCOPE显示波形来方便调PID,所以我就在网上找到了个开源工具链接:http://t.csdnimg.cn/ZqZPY使用方法:工具是好工具,就是没有使用手册&a…

【数据结构】排序算法(二)—>冒泡排序、快速排序、归并排序、计数排序

👀樊梓慕:个人主页 🎥个人专栏:《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》 🌝每一个不曾起舞的日子,都是对生命的辜负 目录 前言 1.冒泡排序 2.快速排序 2.1Hoare版 2.2占…

IPT2602协议-USB 快速充电端口控制器

产品描述: IPT2602是一款USB端口快速充电协议控制芯片。IPT2602智能识别多种快速充电协议,对手机等受电设备进行快速充电。IPT2602根据受电设备发送的电压请求能够精确的调整VBUS输出电压,从而实现快速充电。 IPT2602在调整5V输出电压前会自动…

【Qt基础篇】信号和槽

文章目录 一些常见的bug:字符集不对产生的错误VS平台中文乱码 QT的优点关于.pro文件QtCreator快捷键最简单的qt程序按钮的创建对象模型**Qt窗口坐标**体系信号和槽机制connect函数系统自带的信号和槽案例:实现点击按钮-关闭窗口的案例 自定义信号和槽案例…

golang gin框架1——简单案例以及api版本控制

gin框架 gin是golang的一个后台WEB框架 简单案例 package mainimport ("github.com/gin-gonic/gin""net/http" )func main() {r : gin.Default()r.GET("/ping", func(c *gin.Context) {//以json形式输出,还可以xml protobufc.JSON…