编程语言
首页 > 编程语言> > Java 的 IO 很复杂?用思路带领你去battle他!

Java 的 IO 很复杂?用思路带领你去battle他!

作者:互联网

所有编程语言都涉及IO,java也不例外。

初学者入门Java,难理解是正常的,包括我。

简单的说:IO就是和Java以外的文件打交道。

既然要处理文件,那么就需要Java提供的IO接口进行处理:

- Input指从外部读入数据到内存

- Output指把数据从内存输出到外部

要掌握Java的IO,核心就是:选择合适的IO流读写文件。


以下是Java硬核的IO技术文介绍,希望可以帮到学习IO的小伙伴:

1、什么是IO

I/O 是指Input/Output,即输入和输出。

Java程序在执行的时候,是在内存进行的,外部的数据需要读写到内存才能处理;而在内存中的数据是随着程序结束就消失的,有时候我们也需要把数据输出到外部文件。

Java中,是通过 处理IO的,这种处理模式称为 IO流,IO流是一种顺序读写数据的模式。

你可以想象它是一根水管,数据就像水一样, 起点—终点 可互相流动。

1.1、流的特点:

  1. 先进先出:最先写入输出流的数据最先被输入流读取到。
  2. 顺序存取:可以一个接一个地往流中写入一串字节,读出时也将按写入顺序读取一串字节,不能随机访问中间的数据。(RandomAccessFile除外)
  3. 只读或只写:每个流只能是输入流或输出流的一种,不能同时具备两个功能,输入流只能进行读操作,对输出流只能进行写操作。在一个数据传输通道中,如果既要写入数据,又要读取数据,则要分别提供两个流。

1.2、IO流的分类

1.1.1、按方向分

按数据流的方向分为 输入流、输出流,是相对内存来说的。

1.1.2、按处理数据类型分

按处理的数据类型可分为 字节流、字符流

1字符 = 2字节 、 1字节(byte) = 8位(bit)

字节流和字符流的原理是相同的,只不过处理的单位不同而已。后缀是Stream是字节流,而后缀是Reader,Writer是字符流。

为什么要有字符流?

Java中字符是采用Unicode标准,Unicode 编码中,一个英文为一个字节,一个中文为两个字节。但是编码不同,中文字符占的字节数不一样,而在UTF-8编码中,一个中文字符是3个字节。

如果统一使用字节流处理中文,因为读写是一个字节一个字节,这样就会对中文字符有影响,就会出现乱码。

为了更方便地处理中文这些字符,Java就推出了字符流。

字节流和字符流的其他区别:

  1. 字节流一般用来处理图像、视频、音频、PPT、Word等类型的文件。字符流一般用于处理纯文本类型的文件,如TXT文件等,但不能处理图像视频等非文本文件。
用一句话说就是:字节流可以处理一切文件,而字符流只能处理纯文本文件。
  1. 字节流本身没有缓冲区,缓冲字节流相对于字节流,效率提升非常高。而字符流本身就带有缓冲区,缓冲字符流相对于字符流效率提升就不是那么大了。

1.1.3、按功能分

按功能不同分为 节点流、处理流

1.1.4、按有无缓冲分

还有一种流是缓冲流,区别于没有缓冲的流。

因为程序和内存交互很快,而程序和磁盘交互是很慢的,这样会导致程序出现性能问题。

为了减少程序与磁盘的交互,是提升程序效率,引入了缓冲流

普通流每次读写一个字节,而缓冲流在内存中设置一个缓存区,缓冲区先存储足够的待操作数据后,再与内存或磁盘进行交互。这样,在总数据量不变的情况下,通过提高每次交互的数据量,减少了交互次数。

有缓冲的流,类名前缀是带有Buffer的,比如BufferedInputStreamBufferedReader


2、Java IO 流对象详解

以上说了这么多流,看起来很复杂,但其实只需要记住以下四种流即可:

这四个都是抽象类,都位于 java.io 包目录。

我们平时使用流去处理数据,都是通过这四个流的子类展开的

挑一些常用的放在下面一一讲解。

2.1、InputStream ——字节流输入流

InputStream 这个抽象类是表示以上输入字节流的所有类的超类(父类)。

InputStream 中的三个基本的读方法:

read()方法 如果已读到末尾,返回 -1表示不能继续读取了。

InputStream 的子类有:

这么多子类不需要每一个都记住,只需要记住两个:

FileInputStream

FileInputStream是文件字节输入流,就是对文件数据以字节的方式来处理,如音乐、视频、图片等。

BufferedInputStream

使用方式基本和FileInputStream一致。

BufferedInputStream有一个内部缓冲区数组,一次性读取较多的字节缓存起来,默认读取defaultBufferSize = 8192,作用于读文件时可以提高性能。

2.2、OutputStream——字节输出流

OutputStream 是相对 InputStream 的,既然有输入就有输出。OutputStream 这个抽象类是表示以上输出字节流的所有类的超类(父类)。

OutputStream 中的三个基本的写方法:

其它重要方法:

OutputStream 的子类有:

StringBufferInputStream 和 StringBufferInputStream 已经过时了,这里不介绍了

FileOutputStream、BufferedOutputStream 和 FileInputStream、BufferedInputStream 是相对的。

2.3、Reader——字符输入流

Reader 是所有的输入字符流的父类,它是一个抽象类。

常见的子类有:

总结:

  1. BufferedReader 很明显就是一个装饰器,它和其子类负责装饰其它 Reader 对象。
  2. InputStreamReader 是一个连接字节流和字符流的桥梁,它将字节流转变为字符流。

Reader 基本的三个读方法(和字节流对应):

(1) public int read() throws IOException; 读取一个字符,返回值为读取的字符。

(2) public int read(char cbuf[]) throws IOException; 读取一系列字符到数组 cbuf[]中,返回值为实际读取的字符的数量。

(3) public abstract int read(char cbuf[],int off,int len) throws IOException; 读取 len 个字符,从数组 cbuf[] 的下标 off 处开始存放,返回值为实际读取的字符数量,该方法必须由子类实现。

2.4、Writer——字符输出流

Writer 是所有的输出字符流的父类,它是一个抽象类。

常见的子类有:

总结:

  1. OutputStreamWriter 是 OutputStream 到 Writer 转换的桥梁,它的子类 FileWriter 其实就是一个实现此功能的具体类。
  2. BufferedWriter 是一个装饰器为 Writer 提供缓冲功能。

writer 的主要写方法:

  1. public void write(int c) throws IOException; //写单个字符
  2. public void write(char cbuf[]) throws IOException; //将字符数组 cbuf[] 写到输出流 。
  3. public abstract void write(char cbuf[],int off,int len) throws IOException; //将字符数组cbuf[]中的从索引为off的位置处开始的len个字符写入输出流 。
  4. public void write(String str) throws IOException; //将字符串str中的字符写入输出流 。
  5. public void write(String str,int off,int len) throws IOException; //将字符串 str 中从索引 off 开始处的 len 个字符写入输出流 。


3、使用方法

3.1、FileOutputStream写文件、FileInputStream读文件

分别为 单个字节写、字节数字写、单个字节读取、字节数组读取、一次性读取:

public class OutputStreamTest {
    public static void main(String[] args) throws IOException {
        writeFile(); //单个字节写、字节数字写
        readFile1();//单个字节读取
        readFile2();//字节数组读取
        readFile3();//一次性读取
    }
​
    static void writeFile() throws IOException {
        //1、第一种方法写,单个字节写
        //会自动创建文件,目录不存在会报错, true 表示 追加写,默认是false
        FileOutputStream fileOutputStream = new FileOutputStream("F:\\hello.txt", false);
        //往文件里面一个字节一个字节的写入数据
        fileOutputStream.write((int) 'H');
        fileOutputStream.write((int) 'a');
        fileOutputStream.write((int) 'C');
​
        //2、第二种方法写 字节数组写
        String s = " HelloCoder";
        //入文件里面一个字节数组的写入文件,文件为UTF_8格式
        fileOutputStream.write(s.getBytes(StandardCharsets.UTF_8));
        //刷新流
        fileOutputStream.flush();
        //关闭流
        fileOutputStream.close();
    }
​
    static void readFile1() throws IOException {
        //1、第一种读的方法,但字节读
        System.out.println("------一个字节读------");
        //传文件夹的名字来创建对象
        FileInputStream fileInputStream = new FileInputStream("F:\\hello.txt");
        int by = 0;
        //一个字节一个字节的读出数据
        while ((by = fileInputStream.read()) != -1) {
            System.out.print((char) by);
        }
        //关闭流
        fileInputStream.close();
    }
​
    static void readFile2() throws IOException {
        //2、第二种读的方法,字节数组读
        System.out.println();
        System.out.println("------字节数组读------");
        FileInputStream fileInputStream = new FileInputStream("F:\\hello.txt");
        //通过File对象来创建对象
        fileInputStream = new FileInputStream(new File("F:\\hello.txt"));
        int by = 0;
        byte[] bytes = new byte[10];
        //一个字节数组的读出数据,高效
        while ((by = fileInputStream.read(bytes)) != -1) {
            for (int i = 0; i < by; i++) {
                System.out.print((char) bytes[i]);
            }
        }
        //关闭流
        fileInputStream.close();
    }
​
    static void readFile3() throws IOException {
        //3、第三种读方法,一次性读
        System.out.println();
        System.out.println("------一次性读文件------");
        FileInputStream fileInputStream = new FileInputStream("F:\\hello.txt");
        fileInputStream = new FileInputStream(new File("F:\\hello.txt"));
        //一次性读文件
        int iAvail = fileInputStream.available();
        int by = 0;
        byte[] bytesAll = new byte[iAvail];
        while ((by = fileInputStream.read(bytesAll)) != -1) {
            for (int i = 0; i < by; i++) {
                System.out.print((char) bytesAll[i]);
            }
        }
        fileInputStream.close();
    }
}

输出:

------一个字节读------
HaC HelloCoder
------字节数组读------
HaC HelloCoder
------一次性读文件------
HaC HelloCoder

这里介绍了三种方法读一个文件,详细的介绍都写在了注释里。

⚠️ 字符串如果包含中文,就会出现乱码,这是因为FileOutputStream是字节流,将文本按字节写入。

3.2、FileWriter写文件、FileReader读文件

分别为 字符串写、单字符读、字符数组读:

public class ReaderTest {
    public static void main(String[] args) throws IOException {
        write(); //字符串写
        read1();//
        read2();//
    }
​
    static void write() throws IOException {
        FileWriter fileWriter = new FileWriter("F:\\Hello1.txt");
        //为防止乱码,可以这样写,字符流和字节流互转
//        Writer fileWriter = new BufferedWriter(new OutputStreamWriter(
//                new FileOutputStream("F:\\Hello1.txt"), StandardCharsets.UTF_8));
        fileWriter.write("今天打工你不狠,明天地位就不稳\n" +
                "今天打工不勤快,明天社会就淘汰");
        
        // 如果没有刷新,也没有关闭流的话 数据是不会写入文件的
        fileWriter.flush();
        fileWriter.close();
    }
​
    static void read1() throws IOException {
        System.out.println("------一个一个char读-------");
        FileReader fileReader = new FileReader("F:\\Hello1.txt");
        int ch = 0;
        String str = "";
        //一个一个char读
        while ((ch = fileReader.read()) != -1) {
            str += (char) ch;
        }
        System.out.println(str);
    }
​
    static void read2() throws IOException {
        System.out.println("------char数组[]读-------");
        FileReader fileReader = new FileReader(new File("F:\\Hello1.txt"));
        int len = 0;
        char[] chars = new char[10];
        while ((len = fileReader.read(chars)) != -1) {
            //这种读有误
//            System.out.print(new String(chars));
            System.out.print((new String(chars, 0, len)));
        }
        fileReader.close();
    }
}

输出:

------一个一个char读-------
今天打工你不狠,明天地位就不稳
今天打工不勤快,明天社会就淘汰
------char数组[]读-------
今天打工你不狠,明天地位就不稳
今天打工不勤快,明天社会就淘汰

FileWriterFileReader 可以用来读写一个含中文字符的文件。

注意点:

1、流转换

//        Writer fileWriter = new BufferedWriter(new OutputStreamWriter(
​
//                new FileOutputStream("F:\\Hello1.txt"), StandardCharsets.UTF_8));

这里其实是把字节流转换为字符流,用来解决乱码。

2、读的位置

这里的写法需要注意,因为这里读写是一次性读10个char类型的字符,如果换成以下

int len = 0;
char[] chars = new char[10];
while ((len = fileReader.read(chars)) != -1) {
    //不能这样写
    System.out.print(new String(chars));
    //System.out.print((new String(chars, 0, len)));
}

则输出:

------char数组[]读-------
今天打工你不狠,明天地位就不稳
今天打工不勤快,明天社会就淘汰勤快,明天社会就淘

可以看到输出不正确,因为一次性读10个char,

第一次读的是 今天打工你不狠,明天

第二次读的是 地位就不稳\n今天打工

第三次读的是 不勤快,明天社会就淘

第四次输出是 汰勤快,明天社会就淘 ,其实这一次它只读了 一个字符,其中 勤快,明天社会就淘 是上一个数组的内容,因为它是已存在在数组的旧数据。

所以需要new String(chars, 0, len)len 是这次读到的字符长度,只需要截取这次的字符即可。


以上这两个例子中,还需要注意的几个地方:

1、只有在写文件的时候才需要flush()方法,而读是不需要的。

2、读、写 完毕都需要调用close() 方法关闭流。

3、单个字节、字符读写效率较慢,建议使用字节、字符数组读取。

3.3、BufferedInputStream、BufferedOutputStream 缓冲字节流

BufferedInputStream 是带缓冲区的,在复制、移动文件操作会快一点。

建议使用缓冲字节流这不是普通字节流,但构造方法入参还是InputStream和OutputStream。

Java使用IO 读取文件时,会进入核心态,在调用驱动进行IO,本身就会缓存在系统级别的,当你第二次读取时,会由用户态进入核心态,读取系统缓存。BufferedInputStream就一次性读取较多,缓存起来。

这样下次就从缓存中读,而不用在用户态和核心态之间切换,从而提升效率。

eg:

public class InputStrem与BufferenInputStream复制文件 {
    public static void main(String[] args) throws IOException {
        useInputStreamCopyFile(); //缓冲流复制文件
        useBufferenInputStream(); //普通流复制文件
    }
​
    static void useInputStreamCopyFile() throws IOException {
        File file = new File("F:\\杨超越.png");
        InputStream is = new FileInputStream(file);
​
        File file2 = new File("F:\\杨超越_copy.png");
        OutputStream os = new FileOutputStream(file2);
        int len = 0;
        byte[] bytes = new byte[1024];
        while ((len = is.read(bytes)) != -1) {
            os.write(bytes);
        }
        is.close();
        os.close();
    }
​
    static void useBufferenInputStream() throws IOException {
        BufferedInputStream bis = new BufferedInputStream(new FileInputStream("F:\\杨超越.png"));
        BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("F:\\杨超越_copy2.png"));
        int len = 0;
        byte[] bytes = new byte[1024];
        while ((len = bis.read(bytes)) != -1) {
            bos.write(bytes, 0, len);
        }
        bos.close();
        bis.close();
    }
}

结果输出:

3.4、BufferedReader、BufferedWriter 字符缓冲流

BufferedReader 有一个好处,就是它提供了readline()newLine()方法,可以按行读取文件

eg:

public class BufferedReaderTest {
    public static void main(String[] args) throws IOException {
        useInputStreamCopyFile(); //这种方法适用于任何文件
        //下面两种方法copy的文件变大了,因为是使用字符流处理的
        useBufferedReaderCopyFile(); //这种方法只适用于字符文件
        useFileReaderCopyFile(); //这种方法一步到位,只适用于字符文件

    }

    static void useInputStreamCopyFile() throws IOException {
        File file = new File("F:\\Hello1.txt");
        InputStream is = new FileInputStream(file);

        File file2 = new File("F:\\Hello1_copy1.txt");
        OutputStream os = new FileOutputStream(file2);
        int len = 0;
        byte[] bytes = new byte[1024];
        while ((len = is.read(bytes)) != -1) {
            os.write(bytes, 0, len);
        }
        is.close();
        os.close();
    }

    static void useBufferedReaderCopyFile() throws IOException {
        File file = new File("F:\\Hello1.txt");
        InputStream is = new FileInputStream(file);
        Reader reader = new InputStreamReader(is);
        //创建字符流缓冲区,BufferedReader 的构造入参是一个 Reader
        BufferedReader bufferedReader = new BufferedReader(reader);

        File file2 = new File("F:\\Hello1_copy2.txt");
        OutputStream os = new FileOutputStream(file2);
        Writer writer = new OutputStreamWriter(os);
        //创建字符流缓冲区,BufferedWriter 的构造入参是一个 Writer
        BufferedWriter bufferedWriter = new BufferedWriter(writer);

        String line = null;
        //readLine()方法 是根据\n 换行符读取的
        while ((line = bufferedReader.readLine()) != null) {
            bufferedWriter.write(line);
            //这里要加换行
            bufferedWriter.newLine();
        }
        bufferedReader.close();
        bufferedWriter.close();
    }

    static void useFileReaderCopyFile() throws IOException {
        //使用FileReader、FileWriter 一步到位
        Reader reader = new FileReader("F:\\Hello1.txt");
        BufferedReader bufferedReader = new BufferedReader(reader);
        Writer writer = new FileWriter("F:\\Hello1_copy3.txt");
        BufferedWriter bufferedWriter = new BufferedWriter(writer);
        String line = null;
        while ((line = bufferedReader.readLine()) != null) {
            bufferedWriter.write(line);
            bufferedWriter.newLine();
        }
        bufferedReader.close();
        bufferedWriter.close();
    }
}


4、close() 与flush()

先上个例子:

public class FlushTest {
    public static void main(String[] args) throws IOException {
        FileReader fileReader = new FileReader("F:\\Hello1.txt"); //大文件
        FileWriter fileWriter = new FileWriter("F:\\Hello2.txt");
        int readerCount = 0;
        //一次读取1024个字符
        char[] chars = new char[1024];
        while (-1 != (readerCount = fileReader.read(chars))) {
            fileWriter.write(chars, 0, readerCount);
        }
    }
}

这里并没有调用close()方法。

close()方法包含 flush()方法 ,即close会自动flush

结果:

可以看到,复制的文件变小了。

明显,数据有丢失,丢失的就是缓冲区“残余”的数据

在计算机层面,Java对磁盘进行操作,IO是有缓存的,并不是真正意义上的一边读一边写,底层的落盘(数据真正写到磁盘)另有方法。

所以,最后会有一部分数据在内存中,如果不调用flush()方法,数据会随着查询结束而消失,这就是为什么数据丢失使得文件变小了。

BufferedOutputStream、BufferedFileWriter 同理

再举个例子:

class FlushTest2{
    public static void main(String[] args) throws IOException {
        FileWriter fileWriter = new FileWriter("F:\\Hello3.txt");
        fileWriter.write("今天打工你不狠,明天地位就不稳\n" +
                "今天打工不勤快,明天社会就淘汰");
    }
}

不调用flush()方法你会发现,文件是空白的,没有把数据写进来,也是因为数据在内存中而不是落盘到磁盘了。

所以为了实时性和安全性,IO在写操作的时候,需要调用flush()或者close()

close()flush()的区别:

总结一下:

Java的IO有一个 缓冲区 的概念,不是Buffer概念的缓冲区。

如果是文件读写完的同时缓冲区刚好装满 , 那么缓冲区会把里面的数据朝目标文件自动进行读或写(这就是为什么总剩下有一点没写完) , 这种时候你不调用close()方法也0不会出现问题 ;

如果文件在读写完成时 , 缓冲区没有装满,也没有flush(), 这个时候装在缓冲区的数据就不会自动的朝目标文件进行读或写 , 从而造成缓冲区中的这部分数据丢失 , 所以这个是时候就需要在close()之前先调用flush()方法 , 手动使缓冲区数据读写到目标文件。

举个很形象的例子加深理解:

我从黄桶)通过水泵(管道)把水抽到绿桶),水管就相当于缓冲区,当我看到黄桶水没有了,我立马关了水泵,但发现水管里还有水没有流到绿桶,这些残留的水就相当于内存中丢失的数据。

如果此时我再把水泵打开,此时水管里面丢失的水(丢失的数据)又流到了绿桶,这就相当于调用了flush()方法。


5、总结

写了这么多,IO确实是挺复杂的,一般的业务需求是读写文件,其实更多的是生成文件、复制文件、移动文件。所以如何选择IO流,是需要我们掌握的。

1、字节流是原生的操作,字符流是经过处理后的操作。

输入:Reader, InputStream类型的子类

输出:Writer, OutputStream类型的子类

2、字节流一般用来处理图像、视频、音频、PPT、Word等类型的文件。字符流一般用于处理纯文本类型的文件,如TXT文件等,但不能处理图像视频等非文本文件。

用一句话说就是:字节流可以处理一切文件,而字符流只能处理纯文本文件。

含有汉子的文件就使用字符流处理。

3、需要转换?是,使用转换流;是否需要高效,使用缓冲流。

4、使用流之后一定要close()

标签:字符,Java,字节,文件,int,void,IO,battle,new
来源: https://blog.csdn.net/m0_61392261/article/details/120347601