首页 > 代码库 > HttpClient 乱码

HttpClient 乱码

  1. 使用HttpClient抓取网页,一直乱码,发现字符编码是gb2312。一直怀疑自己的编码设置错误,一直不停的尝试去换编码。却不得结果。

  2. 在跟踪页面返回的头信息的时候如果发现:

        Content-Encoding :gzip

       原来启动了文件压缩。所以要先解压流信息: GzipDecompressingEntity zipRes = new GzipDecompressingEntity(response.getEntity());

 查询资料得知:

GzipDecompressingEntity zipRes = new GzipDecompressingEntity(response.getEntity());

String s = EntityUtils.toString(zipRes, "gb2312");

done!!搞定

   


HttpClient 乱码