首页 > 代码库 > 使用GZipStream压缩和解压文件

使用GZipStream压缩和解压文件

最近做了一个用.NET里的GZipStream压缩解压缩gzip文件的小程序。GZipStream在System.IO.Compression底下,使用起来也很简单。虽然GZipStream是Stream类的一个下级类,但它只相当于一个转换器。在两个Stream之间将数据转换成为压缩或解压缩数据。下面是一个简单的例子:static void Main(string[] args){    string inputFileName = @"TestFile/Test.doc";    string outputFileName = @"TestFile/Test.doc.gz";       // 输入输出数据流    FileStream inputStream =        new FileStream(inputFileName, FileMode.Open, FileAccess.Read);    FileStream outputStream =        new FileStream(outputFileName, FileMode.Create, FileAccess.Write);    // 把数据读到一个字节类型的数组里    byte[] buffer = new byte[inputStream.Length];    inputStream.Read(buffer, 0, buffer.Length);       GZipStream compressionStream =        new GZipStream(outputStream, CompressionMode.Compress);       // 把数组里的数据通过GZipStream写入到输出数据流    compressionStream.Write(buffer, 0, buffer.Length);    compressionStream.Close();       inputStream.Close();    outputFileName.Close();    Console.WriteLine("Finished");    Console.ReadLine();}以上这个例子已经可以满足基本的压缩需求,但他还有一个很大的缺点,那就是必须把全部文件都读到内存里(也就是那个字节型的数组),然后才能进行压缩。当压缩很大的文件的时候系统性能会受到很大的影响,甚至可能使系统崩溃。所以我给他改进了一下,让他一次只读取和压缩文件的一部份:static void Main(string[] args){    string inputFileName = @"TestFile/Test.doc";    string outputFileName = @"TestFile/Test.doc.gz";       FileStream inputStream =        new FileStream(inputFileName, FileMode.Open, FileAccess.Read);    FileStream outputStream =        new FileStream(outputFileName, FileMode.Create, FileAccess.Write);    // 决定一次读取数剧的大小,这里是8KB    int bufferSize = 8192;    int bytesRead = 0;    byte[] buffer = new byte[bufferSize];    GZipStream compressionStream =        new GZipStream(outputStream, CompressionMode.Compress);    // bytesRead返回每次读了多少数据,如果等于0就表示已经没有数据    // 可以读了    while ( (bytesRead = inputStream.Read(buffer, 0, bufferSize)) > 0)    {        // 把读到数组中的数据通过GZipStream写入到输出数据流        compressionStream.Write(buffer, 0, bytesRead);    }    compressionStream.Close();       inputStream.Close();    outputStream.Close();    Console.WriteLine("Finished");    Console.ReadLine();}好子,现在可以解决刚才提到的性能问题了。解压缩文件和压缩文件基本一样,只不过这次GZipStream是要从已经压缩了文件中读取数据并解压缩,然后把解压后的数据写入到另一个文件,所以这次GZipStream是在读,看一面的例子:static void Main(string[] args){    string inputFileName = @"TestFile/Test.doc.gz";    string outputFileName = @"TestFile/Test_unzipped.doc";       FileStream inputStream =        new FileStream(inputFileName, FileMode.Open, FileAccess.Read);    FileStream outputStream =        new FileStream(outputFileName, FileMode.Create, FileAccess.Write);       int bufferSize = 8192;    int bytesRead = 0;    byte[] buffer = new byte[bufferSize];    GZipStream decompressionStream =        new GZipStream(inputStream, CompressionMode.Decompress);    // 把压缩了的数据通过GZipStream解压缩后再读出来    // 读出来的数据就存在数组里    while ( (bytesRead = decompressionStream.Read(buffer, 0, bufferSize)) > 0)    {        // 把解压后的数据写入到输出数据流        outputStream.Write(buffer, 0, bytesRead);    }    decompressionStream.Close();       inputStream.Close();    outputStream.Close();    Console.WriteLine("Finished");    Console.ReadLine();}我把刚才写的程序优化了一下,制作了一个比较容易使用的GZip工具 -- GZipTool,下面是这个工具支持的几个方法:// 压缩指定文件,跟踪压缩进度,设置缓冲大小GZipTool.Compress(string inputFileName, ProgressHandler handler, int bufferSize);示例:static void Main(string[] args){    string inputFileName = @"TestFile/Test.doc";       // 压缩指定文件,显示进度,并设定一次压缩数据的大小    GZipTool.Compress(inputFileName,        new GZipTool.ProgressHandler(_progress), 20480);    Console.WriteLine("Finished");    Console.ReadLine();}// 显示进度数据private static void _progress(long totalBytesProcessed, long totalBytes){    Console.WriteLine(        (        (double)totalBytesProcessed / (double) totalBytes).ToString("P")        );}GZipTool还支持把数据直接压缩成为数据流,可以在网络传输等不需要文件系统的环境下使用。// 把输入数据流压缩,并把压缩后的数据包在一个MemoryStream里返回MemoryStream GZipTool.Compress(Stream inputStream)GZipTool在解压缩文件的时候也支持进度跟踪// 解压指定文件并给以指定名称,跟踪压缩进度,设置缓冲大小GZipTool.Decompress(string gZipFileName,     string outputFileName,            ProgressHandler handler, int bufferSize)GZipTool还支持读取gzip文件的描述信息,包括原始文件大小等// 把指定gzip文件的描述信息读到一个GZipFileInfo结构里GZipFileInfo GZipTool.GetFileInfo(string gZipFileName)示例:static void Main(string[] args){    string inputFileName = @"TestFile/Test.doc.gz";       GZipFileInfo fileInfo = GZipTool.GetFileInfo(inputFileName);    Console.WriteLine("GZip File Name: {0}", inputFileName);    // 输出原始文件大小    Console.WriteLine("Original File Size: {0}", fileInfo.OriginalFileSize);    Console.WriteLine("Finished");    Console.ReadLine();}

 

使用GZipStream压缩和解压文件