<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
在日常工作中,除了會涉及到使用Python處理文字檔案,有時候還會涉及對壓縮檔案的處理。
通常會涉及到的壓縮檔案格式有:
當然除了使用Python外,你還可以選擇使用壓縮解壓縮軟體或命令手動進行處理。
zipfile是Python裡用來做zip格式編碼的壓縮和解壓縮的module,zipfile裡有兩個非常重要的class:ZipFile和ZipInfo。ZipFile是主要的類,用來建立和讀取zip檔案,而ZipInfo是儲存的zip檔案的每個檔案的資訊。
範例程式碼
import os import zipfile # 壓縮 def make_zip(source_dir, output_filename): zipf = zipfile.ZipFile(output_filename, 'w') pre_len = len(os.path.dirname(source_dir)) for parent, dirnames, filenames in os.walk(source_dir): for filename in filenames: print(filename) pathfile = os.path.join(parent, filename) arcname = pathfile[pre_len:].strip(os.path.sep) # 相對路徑 zipf.write(pathfile, arcname) print() zipf.close() # 解壓縮 def un_zip(file_name): """unzip zip file""" zip_file = zipfile.ZipFile(file_name) if os.path.isdir(file_name + "_files"): pass else: os.mkdir(file_name + "_files") for names in zip_file.namelist(): zip_file.extract(names, file_name + "_files/") zip_file.close() if __name__ == '__main__': make_zip(r"E:python_samplelibstest_tar_fileslibs", "test.zip") un_zip("test.zip")
tarfile 模組可以用來讀寫 tar 歸檔,包括使用 gzip, bz2 和 lzma 壓縮的歸檔。在使用tarfile是必須瞭解模式:
mode 必須是 ‘filemode[:compression]’ 形式的字串,其預設值為 ‘r’。以下是模式組合的完整列表:
模式 | 動作 |
---|---|
‘r’ or ‘r:*’ | 開啟和讀取使用透明壓縮(推薦)。 |
‘r:’ | 開啟和讀取不使用壓縮。 |
‘r:gz’ | 開啟和讀取使用gzip 壓縮。 |
‘r:bz2’ | 開啟和讀取使用bzip2 壓縮。 |
‘r:xz’ | 開啟和讀取使用lzma 壓縮。 |
‘x’ 或 ‘x:’ | 建立tarfile不進行壓縮。如果檔案已經存在,則丟擲 FileExistsError 異常。 |
‘x:gz’ | 使用gzip壓縮建立tarfile。如果檔案已經存在,則丟擲 FileExistsError 異常。 |
‘x:bz2’ | 使用bzip2 壓縮建立tarfile。如果檔案已經存在,則丟擲 FileExistsError 異常。 |
‘x:xz’ | 使用lzma 壓縮建立tarfile。如果檔案已經存在,則丟擲 FileExistsError 異常。 |
‘a’ or ‘a:’ | 開啟以便在沒有壓縮的情況下追加。如果檔案不存在,則建立該檔案。 |
‘w’ or ‘w:’ | 開啟用於未壓縮的寫入。 |
‘w:gz’ | 開啟用於 gzip 壓縮的寫入。 |
‘w:bz2’ | 開啟用於 bzip2 壓縮的寫入。 |
‘w:xz’ | 開啟用於 lzma 壓縮的寫入。 |
針對特殊的目的,還存在第二種 mode 格式: ‘filemode|[compression]’。tarfile.open() 將返回一個將其資料作為資料塊流來處理的 TarFile 物件:
模式 | 動作 |
---|---|
‘r|*’ | 開啟 tar 塊的 流 以進行透明壓縮讀取。 |
‘r|’ | 開啟一個未壓縮的 tar 塊的 stream 用於讀取。 |
‘r|gz’ | 開啟一個 gzip 壓縮的 stream 用於讀取。 |
‘r|bz2’ | 開啟一個 bzip2 壓縮的 stream 用於讀取。 |
‘r|xz’ | 開啟一個 lzma 壓縮 stream 用於讀取。 |
‘w|’ | 開啟一個未壓縮的 stream 用於寫入。 |
‘w|gz’ | 開啟一個 gzip 壓縮的 stream 用於寫入。 |
‘w|bz2’ | 開啟一個 bzip2 壓縮的 stream 用於寫入。 |
‘w|xz’ | 開啟一個 lzma 壓縮的 stream 用於寫入。 |
程式碼範例:
import os import tarfile import gzip # 一次性打包整個根目錄。空子目錄會被打包。 # 如果只打包不壓縮,將"w:gz"引數改為"w:"或"w"即可。 def make_targz(output_filename, source_dir): with tarfile.open(output_filename, "w:gz") as tar: tar.add(source_dir, arcname=os.path.basename(source_dir)) # 逐個新增檔案打包,未打包空子目錄。可過濾檔案。 # 如果只打包不壓縮,將"w:gz"引數改為"w:"或"w"即可。 def make_targz_one_by_one(output_filename, source_dir): tar = tarfile.open(output_filename, "w:gz") for root, dir, files in os.walk(source_dir): for file in files: pathfile = os.path.join(root, file) tar.add(pathfile) tar.close() def un_gz(file_name): """ungz zip file""" f_name = file_name.replace(".gz", "") # 獲取檔案的名稱,去掉 g_file = gzip.GzipFile(file_name) # 建立gzip物件 open(f_name, "wb+").write(g_file.read()) # gzip物件用read()開啟後,寫入open()建立的檔案裡。 g_file.close() # 關閉gzip物件 def un_tar(file_name): # untar zip file tar = tarfile.open(file_name) names = tar.getnames() if os.path.isdir(file_name + "_files"): pass else: os.mkdir(file_name + "_files") # 由於解壓後是許多檔案,預先建立同名資料夾 for name in names: tar.extract(name, file_name + "_files/") tar.close() if __name__ == '__main__': make_targz('test.tar.gz', "E:python_samplelibs") make_targz_one_by_one('test01.tgz', "E:python_samplelibs") un_gz("test.tar.gz") un_tar("test.tar")
我們可以使用rarfile來解壓.rar的檔案,但是不支援用rarfile來壓縮rar檔案。rarfile以下unrar元件,但是使用pip install unrar安裝後發現會報如下錯誤:
Couldn’t find path to unrar library…
這是因為 Python下的 unrar 還依賴了RAR官方的庫。
Windows的安裝
Linux的安裝
# cd /usr/local/src/ # wget https://www.rarlab.com/rar/unrarsrc-6.0.3.tar.gz # tar zxvf unrarsrc-6.0.3.tar.gz # cd unrar # make lib # make install-lib //生成libunrar.so 檔案 # vim /etc/profile export UNRAR_LIB_PATH=/usr/lib/libunrar.so # source /etc/profile
程式碼範例:
import rarfile def unrar(rar_file, dir_name): # rarfile需要unrar支援, linux下pip install unrar, windows下在winrar資料夾找到unrar,加到path裡 rarobj = rarfile.RarFile(rar_file.decode('utf-8')) rarobj.extractall(dir_name.decode('utf-8'))
要壓縮和解壓縮.7z檔案需要用到py7zr元件。程式碼範例:
import py7zr # 壓縮 with py7zr.SevenZipFile("Archive.7z", 'r') as archive: archive.extractall(path="/tmp") # 解壓縮 with py7zr.SevenZipFile("Archive.7z", 'w') as archive: archive.writeall("target/")
以上就是基於Python實現檔案的壓縮與解壓縮的詳細內容,更多關於Python檔案壓縮的資料請關注it145.com其它相關文章!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45