首頁 > 軟體

Python一鍵實現PDF檔案批次轉Word

2022-08-29 14:00:16

無論是在工作還是學習當中,大家都會遇到這樣一個問題,將“PDF當中的內容(文字和圖片)轉換為Word的格式”,也就是說從唯讀轉換成可編輯的格式。網上絕大多數的工具也都是收費的,今天小編就給大家制作了一款批次將PDF檔案轉換為Word的神器,使用起來也是相當的方便。

實現效果

我們首先來看一下出來的效果,如下圖所示

環境準備

用到的模組叫做pdf2docx,我們通過pip命令進行下載,如下

pip install pdf2docx

後續我們還可以為py檔案打包,用到的庫是pyinstaller

pip install pyinstaller

程式碼實現

我們先簡單地實現將單個PDF檔案轉換成Word檔案,程式碼如下

from pdf2docx import Converter
cv = Converter(r"pdf檔案的路徑")
cv.convert("test.docx", start=0,end=None)
cv.close()

那麼上面的是單個PDF檔案,要是涉及到是多個PDF檔案,則需要用到遍歷上傳過來的每一個檔案,用到for迴圈遍歷

def startAction(self):
    output_path_1 = Path.joinpath(Path.home(), "Desktop")
    output_path_2 = str(output_path_1) + "\output"
    if not os.path.exists(output_path_2):
        os.mkdir(output_path_2)

    for path_list in pdfPath_list:
        print("路徑: ", path_list)
        name = path_list.split("/")[-1].split(".")[0]
        cv = Converter(path_list)
        cv.convert(output_path_2 + "\{}.docx".format(name), start=0, end=None)
        cv.close()

    msg_box = QMessageBox(QMessageBox.Information, '完成', '提取完成', QMessageBox.Yes)
    msg_box.exec_()

上述的程式碼,我們首先將指定好輸出的Word檔案的位置,這裡小編設定的是在桌面,然後通過for迴圈去遍歷處理每一個PDF檔案,當所有的步驟都完成的時候,提示我們已經完成了。

當然整個視覺化介面當中還有一個上傳檔案的功能,程式碼如下

# 選擇本地檔案上傳
def uploadFiles(self):
    global pdfPath_list  # 這裡為了方便別的地方參照檔案路徑,將其設定為全域性變數
    pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上傳檔案", r"路徑", "*.pdf;;All Files(*)")
    # 顯示所選檔案的路徑
    self.ui.lineEdit.setText(",".join(pdfPath_list))

整體的程式碼如下所示

from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog
from PySide2.QtUiTools import QUiLoader
from pdf2docx import Converter
from pathlib import Path
import os

class OCRQt:
    def __init__(self):
        self.ui = QUiLoader().load('pdf2word.ui')
        self.ui.pushButton.clicked.connect(self.uploadFiles)
        self.ui.pushButton_2.clicked.connect(self.startAction)

    def uploadFiles(self):
        ........
        ........

    def startAction(self):
        .......
        .......

if __name__ == '__main__':
    app = QApplication([])
    # 顯示建立的介面
    MainWindow = OCRQt()  # 建立表單物件
    MainWindow.ui.show()  # 顯示錶單
    app.exit(app.exec_())  # 程式關閉時退出程序

到此這篇關於Python一鍵實現PDF檔案批次轉Word的文章就介紹到這了,更多相關Python PDF轉Word內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com