Java中IO流-28-用指定编码表读写文件
前面说过,文件存储的文本内容,在读和写的时候,是和编码表有关的。例如,如果你是在英文的windows7系统上,打开一个记事本,写入一些中文。如果默认保存,再次打开,可能出现乱码,所以,我们很多人知道需要另存为unicode格式,但是具体的原因不知道,本篇就来学习这个过程,对比GBK和utf-8两个编码表读写文件的过程。
1.默认编码表读写文件
项目下创建一个gbk和一个utf-8两个文本文件,内容都写“学习Java编程是一个长期的过程”。然后运行下面代码。
package io; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.FileWriter; import java.io.IOException; public class Demo6_TransIO { public static void main(String[] args) throws IOException { FileReader fr = new FileReader("utf-8.txt"); FileWriter fw = new FileWriter("gbk.txt"); int c; while ( (c = fr.read()) != -1) { fw.write(c); } fr.close(); fw.close(); } }
运行之后,刷新项目,然后打开项目下gbk.txt文件,会发现显示乱码。因为utf-8编码方式是默认采用3个字节存储一个字符,而gbk默认是2个字节存储一个汉字。为了防止这样情况出现,我们就需要给文件读写加上字符编码,确保读写都正常,不会发生乱码情况。
2.指定编码方式去读写文件
上面使用到的FileReader是使用默认编码表来读文件,FileWriter也是使用默认编码表来写文件。为了指定编码表去读写文件,我们需要使用者两个类。InputStreamReader(字符流,编码表) 和 OutStreamWriter(字符流,编码表),下面来看一个例子。
package io; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.FileReader; import java.io.FileWriter; import java.io.IOException; import java.io.InputStreamReader; import java.io.OutputStreamWriter; public class Demo6_TransIO { public static void main(String[] args) throws IOException { InputStreamReader isr = new InputStreamReader(new FileInputStream("utf-8.txt"),"utf-8"); OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("gbk.txt"), "gbk"); int c; while ( (c = isr.read()) != -1) { osw.write(c); } isr.close(); osw.close(); } }
由于写入的gbk.txt文件,指定了编码表,所以如果你系统支持gbk编码,那么就能正常打开。实际上,我们发现,读的字符流是ut-8类型,写的字符流是gbk编码表,底层肯定发生了字符转换。为了增加读写效率,我们把上面代码用缓冲区方式优化下。
3.带缓冲区的指定编码读写文件
package io; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.FileReader; import java.io.FileWriter; import java.io.IOException; import java.io.InputStreamReader; import java.io.OutputStreamWriter; import java.io.UnsupportedEncodingException; public class Demo6_TransIO { public static void main(String[] args) throws IOException { //demo1(); //demo2(); BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream("utf-8.txt"),"utf-8")); BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(new FileOutputStream("gbk.txt"),"gbk")); int c; while ((c = br.read()) != -1) { bw.write(c); } br.close(); bw.close(); } public static void demo2() throws UnsupportedEncodingException, FileNotFoundException, IOException { InputStreamReader isr = new InputStreamReader(new FileInputStream("utf-8.txt"),"utf-8"); OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("gbk.txt"), "gbk"); int c; while ( (c = isr.read()) != -1) { osw.write(c); } isr.close(); osw.close(); } public static void demo1() throws FileNotFoundException, IOException { FileReader fr = new FileReader("utf-8.txt"); FileWriter fw = new FileWriter("gbk.txt"); int c; while ( (c = fr.read()) != -1) { fw.write(c); } fr.close(); fw.close(); } }