Java中所有字符表示方式

jvm的设计者在设计之初时,是不允许使用各种编码方式的字符并存的。 这是因为各种不同的编码模式存在,开发者甚至打印字符和拼接字符都会显得十分困难。 所以java中,字符只会以Unicode来表示。

char c=的;
System.out.format("%x",(short)c)

打印结果为十六进制的0x7684 如果

char c=0x7684;
System.out.println(c)

打印是 ‘的’

JVM的这种约定使得一个字符分为两部分:jvm内部和os文件系统。 在jvm内部采取统一的Unicode表示,当字符从jvm内部转移到外部,就进行了编码转换。 那么I/O可以分为两类,面向字符的输入/出流和面向字节的输入/出流。 面向字符输入输出流(reader/writer类)不关心字符将以何种方式保存在jvm中,他只希望读出来的时候仍然是原有字符,但也不一定会是,因为reader或writer并不会指定转换时使用的编码,所以也有可能会出现乱码情况。 所以我们常使用inputStreamReader和outputStreamWriter来充当适配器的角色,这个角色介于字节流和字符流之间,他们来承担编码转换的任务。 面向字节流主要适用于视频文件或者音频文件,或者01不交换顺序的文件。

经验分享 程序员 微信小程序 职场和发展