`
bsr1983
  • 浏览: 1101207 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

深入理解JVM学习笔记——第六章 类文件结构

    博客分类:
  • JVM
 
阅读更多

注:本系列文章均摘录自《深入理解Java虚拟机:JVM高级特性与最佳实践》,作者周志明,我看的是第一版,现在第二版已经出了,

 

第六章 类文件结构
    1.各种不同平台的虚拟机与所有平台都统一使用的程序存储格式——字节码(ByteCode)是构成平台无关性的基石。
    虚拟机并不关心Class的来源是什么语言,只要它符合Class应有的结构就可以在Java虚拟机中运行。
    Java语言的各种变量、关键字和运算符号的语义最终都是由多条字节码命令组合而成的,因此字节码命令所能提供的语义描述能力肯定会比Java语言本身更强大。
    2.Class文件是一组以8位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑地排列在Class文件之中,中间没有添加任何分隔符,这使得整个Class文件中存储的内容几乎全部都是程序运行的必要数据,没有空隙存在。当遇到需要占用8位字节以上空间的数据项时,则会按照高位在前的方式风格成若干个8位字节进行存储。
    3.Class文件格式中只有两种数据类型:无符号数和表。
    无符号数以u1、u2、u4、u8分别代表1个字节、2个字节、4个字节和8个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值或者安装UTF-8编码构成字符串值。
    表是由多个无符号数或其他表作为数据项构成的复合数据类型,所有表都习惯性地以”_info“结尾。表用于描述有层次关系的复合结构的数据。整个Class文件本质上就是一张表。
    4.每个Class文件的头4个字节称为魔数(Magic Number),它的唯一作用是用于确定这个文件是否为一个能被虚拟机接收的Class文件。Class文件的魔数值为0xCAFEBABE
    5.紧接着魔数的4个字节存储的是Class文件的版本号:第5和第6个字节是次版本号(Minor Version),第7个和第8个字节是主版本号(Major Version)。
    6.Java的版本号是从45开始的,JDK1.1之后的每个JDK大版本发布主版本号向上加1(JDK1.0~JDK1.1使用了45.0~45.3的版本号),高版本的JDK能向下兼容以前版本的Class文件,但不能运行以后版本的Class文件,即使文件格式并未发生变化。
    7.紧接着主次版本号之后的是常量池入口,常量池是Class文件结构中与其他项目关联最多的数据类型,也是占用Class文件空间最大的数据项目之一,同时它还是在Class文件中第一个出现的表类型数据项目。
    由于常量池中常量的数量是不固定的,所以在常量池的入口需要放置一项u2类型的数据,代表常量池容量计数值(constant_pool_count)。这个容量计数是从0开始的。
    制定Class文件格式规范时,将第0常量项空出来是为了满足某些指向常量池的索引值的数据在特定情况下需要表达”不引用任何一个常量池项目“的意思。
    对于其他集合类型,包括接口索引集合、字段表集合、方法表集合等的容量计数都与一般习惯相同,是从0开始的。
    10.常量池中主要存放两大类常量:字面量(Literal)和符号引用(Symbolic References)。
    Java程序中如果定义了超过64KB英文字符的变量或方法名,将会无法编译。
    11.在常量池结束之后,紧接着的2个字节代码访问标志(access_flags),这个标志用于识别一些类或接口层次的访问信息,包括:这个Class是类还是接口;是否定义为public类型;是否定义为abstract类型;如果是类的话,是否被声明为final等等。
    access_flags中一共有16个标志可以使用,当前只定义了其中8个,没有使用到的标志位要求一律为0。  
    12.类索引(this_class)和父类索引(super_class)都是一个u2类型的数据,而接口索引集合(interfaces)是一组u2类型的数据集合,Class文件中由这三项数据来确定这个类的继承关系。除了java.lang.Object之外,所有Java类的父类索引都不为0。
    13.字段表(field_info)用于描述接口或类中声明的变量。字段(field)包括了类级变量或实例级变量,但不包括在方法内部声明的变量。
    全限定名”com/ibsrapp/Demo“是com.ibsrapp.Demo类的全限定名。简单名称就是没有类型和参数修饰的方法或字段名称。
    描述符的作用是用来描述字段的数据类型、方法的参数列表(包括数量、类型以及顺序)和返回值。基本数据类型(byte->B,char -> C,double->D,float->F,int->I,long->J,short->S,boolean->Z) 及代表无返回值的void类型都用一个大写字符来表示,而对象则用字符L加对象的全限定名称来表示。  
    对于数组类型,每一纬度将使用一个前置的"["来描述,如一个定义为”java.lang.String[][]“类型的二维数组,将被记录为:”[[Ljava/lang/String;“,一个整型数组"int[]"将被记录为"[I";                         
    用描述符来描述方法时,按照先参数列表,后返回值的顺序描述,参数列表按照参数的严格顺序方在一组小括号”()“之内。
    字段表集合中不会列出从超类或父类接口中继承而来的字段,但有可能列出原本Java代码之中不存在的字段,譬如在内部类中为了保持对外部类的访问性,会自动添加指向外部类实例的字段。
    14.Class文件存储格式中对方法的描述与对字段的描述几乎采用了完全一致的方式,方法表的结构如同字段表一样,依次包括了访问标志、名称索引、描述符索引、属性表集合几项。
    方法里的Java代码,经过编译器编译成字节码指令以后,存放在方法属性表集合中一个名为”Code“的属性里面。
    如果父类方法在子类中没有被重写(Override),方法表中就不会出现来自父类的方法信息。但有可能出现有编译器自动添加的方法,最典型的就是类构造器”<clinit>“方法和实例构造器”<init>“方法。
    特征签名就是一个方法中各个参数在常量池中的字段符合引用的集合,也就是因为返回值不会包含在特征签名之中,因此Java语言里面是无法仅仅依靠返回值的不同来对一个已有方法进行重载的。
    15.属性表(attribute_info)在Class文件、字段表、方法表中都可以携带自己的属性表集合,用以描述某些场景专有的信息。
    属性表不要求各个属性表具有严格的顺序,并且只要不与已有的属性名重复,任何人实现的编译器都可以向属性表中写入自己定义的属性信息,Java虚拟机运行时会忽略掉它不认识的属性。
    对于每个属性,它的名称需要从常量池中引用一个CONSTANT_Utf8_info类型的常量来表示,而属性值的结构则是完全自定义的,只需要说明属性值所占用的位数长度即可。
    16.Java程序方法体里面的代码经过Javac编译器处理之后,最终变为字节码指令存储在Code属性内。
    15. Code属性出现在方法表的属性集合之中,但并非所有的方法表都必须存在这个属性,譬如接口或抽象类中的方法就不存在Code属性。
    Slot是虚拟机为局部变量分配内存所使用的最小单位。对于byte、char、float、int、short、boolean、reference和returnAddress等长度不超过32位的数据类型,每个局部变量占用1个Slot,而double和long这两种64位的数据类型则需要2个Slot来存放。
    16.虚拟机规范中限制了一个方法不允许超过65535条字节码指令,如果超过这个限制,Javac编译器就会拒绝编译。
    17.在任何实例方法中,都可以通过”this“关键字访问到此方法所属的对象。这个访问机制对Java程序的编写非常重要,而它的实现却非常简单,仅仅是通过Javac编译器在编译的时候把对this关键字的访问转变为对一个普通方法参数的访问,然后在虚拟机调用实例方法时自动传入此参数即可。
    实例方法的局部变量表中至少会存在一个指向当前对象实例的局部变量,局部变量表中也会预留出第一个Slot位来存放对象实例的引用,方法参数值从1开始计算。
    18.异常表实际上是Java代码的一部分,编译器使用异常表而不是简单的跳转命令来实现Java异常及finally处理机制。
    19.Exceptions属性是在方法表中与Code属性平级的一项属性,它的作用是列举出方法中可能抛出的受查异常(Checked Exceptions),也就是在方法描述时在throws关键字后面列举的异常。
    20.LineNumberTable属性用于描述Java源码行号与字节码行号(字节码的偏移量)之间的对应关系。可以在Javac中使用-g:none或-g:lines选项来取消或要求生成这项信息。如果选择不生成LineNumberTable属性,对程序运行产生的最主要的影响就是在抛出异常时,堆栈中将不会显示出错的行号,并且在调试程序的时候无法按照源码来设置断点。
    21.LocalVariableTable属性用于描述栈帧中局部变量表中的变量与Java源码中定义的变量之间的关系,它不是运行时必需的属性,默认也不会生成到Class文件之中,可以在Javac中使用-g:none或-g:vars选项来取消或要求生成这项信息。如果没有生成这项属性,最大的影响就是当其他人引用这个方法时,所有的参数名称都将丢失,IDE可能会使用诸如arg0、arg1之类的占位符代替原有的参数名,而且在调试期间调试器无法根据参数名称从运行上下文中获得参数值。
    22.SourceFile属性用于记录生成这个Class文件的源码文件名称。这个属性也是可选的,可以使用javac的-g:none或-g:source选项来关闭或要求生成这项信息。如果不生成这项属性,当抛出异常时,堆栈中将不会显示出错误代码所属的文件名。这个属性是一个定长的属性。                      
    23.ConstantValue属性的作用是通知虚拟机自动为静态变量赋值。只有被static关键字修饰的变量(类变量)才可以使用这项属性。对于非static类型的变量(也就是实例变量)的赋值是在实例构造器<init>方法中进行的;而对于类变量,则有两种方式可以选择:赋值在类构造器<cinit>方法中进行,或者使用ConstantValue属性来赋值。Sun Javac编译器的选择是:如果同时使用final和staic来修饰一个变量(或者说常量更贴切),并且这个变量的数据类型是基本类型或java.lang.String的话,就生成ConstantValue属性来进行初始化,如果这个变量没有被final修饰,或者并非基本类型及字符串,则选择在<cinit>方法中进行初始化。
    24.InnerClasses属性用于记录内部类与宿主类之间的关联。如果一个类中定义了内部类,那编译器将会为它及它所包含的内部类生成InnerClassess属性。
    25.Deprecated和Synthetic两个属性都属于标志类型的布尔属性,只存在有和没有的区别,没有属性值的概念。
    Deprecated属性用于表示某个类、字段或方法,已经被程序作者定位不再推荐使用,它可以通过在代码中使用@deprecated注释进行设置。
    Synthetic属性代表此字段或方法并不是由Java源码直接产生的,而是由编译器自行添加的,在JDK1.5之后,标识一个类、字段或方法是编译器自动产生的,也可以设置他们的访问标志中的ACC_SYNTHETIC标志位,其中最典型的例子就是Bridge Mehtod                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics