Python Gzip壓縮與解壓模組
阿新 • • 發佈:2019-01-06
Python Gzip模組為GNU zip檔案提供了一個類檔案的介面,它使用zlib來壓縮和解壓縮資料檔案,讀寫gzip檔案。
首先,我們來看一下壓縮與解壓的程式碼:
一、使用gzip模組壓縮檔案
>>> import gzip #匯入python gzip模組,提示:注意名字為全小寫
>>> g = gzip.GzipFile(filename="", mode="wb", compresslevel=9, fileobj=open('sitemap.log.gz', 'wb'))
>>> g.write(open('d:\\test\\sitemap.xml').read())
>>> g.close()
其中,filename引數是壓縮檔案內,檔案的名字,為空也可以,不修改。fileobj是生成的壓縮檔案物件,它的路徑名稱等。最後是把檔案寫入gzip檔案中去,再關閉操作連線。
二、使用gzip模組解壓縮檔案
>>> g = gzip.GzipFile(mode="rb", fileobj=open('d:\\test\\sitemap.log.gz', 'rb')) # python gzip 解壓
>>> open(r"d:\\haha.xml", "wb").write(g.read())
使用的時候注意, 函式方法的大小寫一點要看仔細,如果gzip檔案是這種形式的:*.tar.gz,證明先是由tar命令壓縮後,後再由 gzip壓縮的,需要先用解壓縮tar檔案,再用gzip模組解壓縮。其實,現在很多網頁為了提高瀏覽器端使用者的訪問速度,和搜尋引擎爬蟲抓取的速度,都在使用gzip壓縮。