其他分享
首页 > 其他分享> > 如何使用Content-Encoding读取压缩的HTML页面:gzip

如何使用Content-Encoding读取压缩的HTML页面:gzip

作者:互联网

我请求一个发送Content-Encoding:gzip标头的网页,但却被卡住了怎么读它..

我的代码:

    try {
        URLConnection connection = new URL("http://jquery.org").openConnection();                        
        String html = "";
        BufferedReader in = null;
        connection.setReadTimeout(10000);
    in = new BufferedReader(new InputStreamReader(connection.getInputStream()));            
    String inputLine;
    while ((inputLine = in.readLine()) != null){
    html+=inputLine+"\n";
        }
    in.close();
        System.out.println(html);
        System.exit(0);
    } catch (IOException ex) {
        Logger.getLogger(Crawler.class.getName()).log(Level.SEVERE, null, ex);
    }

输出看起来很乱.(我无法在这里粘贴它,一种符号……)

我相信这是一个压缩内容,如何解析呢?

注意:
如果我将jquery.org更改为jquery.com(不发送该标题,我的代码运行良好)

解决方法:

有一个类:GZIPInputStream.它是一个InputStream,因此使用非常透明.

标签:java,gzipinputstream
来源: https://codeday.me/bug/20190712/1444355.html