首頁 > 軟體

Java實現PDF轉為Word檔案的範例程式碼

2023-01-22 14:00:28

眾所周知,PDF檔案除了具有較強穩定性和相容性外, 還具有較強的安全性,在工作中可以有效避免別人無意中對檔案內容進行修改。但與此同時,也妨礙了對檔案的正常的修改。這時我們可以將PDF轉為Word檔案進行修改或再編輯。使用軟體將 PDF 檔案轉換為 Word 檔案十分簡單,然而要在轉換時保持佈局甚至字型格式卻並不容易。本文將分為以下兩部分介紹如何在保持佈局的情況下將PDF轉為Word檔案。

  • 將 PDF 轉換為固定佈局的 Doc/Docx 檔案
  • 將 PDF 轉換為流動形態的 Doc/Docx 檔案

固定佈局模式轉換速度快,有利於最大程度保持 PDF 檔案的原貌。但是,生成的檔案的可編輯性將受到限制,因為 PDF 中的每一行文字將在生成的 Word 檔案中顯示在單獨的框架中。

流動形態是一種完整的識別模式。轉換後的內容不會以框架形式呈現,並且生成的檔案的結構是可流動的。生成的 Word 檔案很容易重新編輯,但看起來可能與原始 PDF 檔案不同。

程式碼編譯環境

IntelliJ IDEA 2018(jdk 1.8.0)

PDF Jar包:Free Spire.PDF for Java 5.1.0

1.引入jar

匯入方法1:

手動引入。將Free Spire.PDF for Java下載到本地,解壓,找到lib資料夾下的Spire.PDF.jar檔案。在IDEA中開啟如下介面,將本地路徑中的jar檔案引入Java程式:

匯入方法2:如果您想通過 Maven安裝,則可以在 pom.xml 檔案中新增以下程式碼匯入 JAR 檔案

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
        </repository>
    </repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.pdf.free</artifactId>
        <version>5.1.0</version>
    </dependency>
</dependencies>

將 PDF 轉換為固定佈局的 Doc/Docx 檔案

  • 以下是將 PDF 轉為固定佈局的Doc/Docx 檔案的具體步驟。
  • 建立一個 PdfDocument 物件。
  • 使用 PdfDocument.loadFromFile() 方法載入 PDF 檔案。
  • 使用 PdfDocument.saveToFile(String fileName, FileFormat fileFormat) 方法將 PDF 檔案轉換為 Doc 或 Docx 格式檔案。

完整程式碼

import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;

public class ConvertPdfToWordWithFixedLayout {

    public static void main(String[] args) {

        //建立一個 PdfDocument 物件
        PdfDocument doc = new PdfDocument();

        //載入 PDF 檔案
        doc.loadFromFile("C:\Users\Administrator\Desktop\sample.pdf");

        //將PDF轉換為Doc格式檔案並儲存
        doc.saveToFile("output/ToDoc.doc", FileFormat.DOC);

        //將PDF轉換為Docx格式檔案並儲存
        doc.saveToFile("output/ToDocx.docx", FileFormat.DOCX);
        doc.close();
    }
}

將 PDF 轉換為流動形態的 Doc/Docx 檔案

以下是將 PDF 轉換為流動形態的 Doc/Docx 檔案的具體步驟:

  • 建立一個 PdfDocument 物件。
  • 使用 PdfDocument.loadFromFile() 方法載入 PDF 檔案。
  • 使用 PdfDocument. getConvertOptions().setConvertToWordUsingFlow() 方法將轉換模式設定為流。
  • 使用 PdfDocument.saveToFile(String fileName, FileFormat fileFormat) 方法將 PDF 檔案轉換為 Doc 或 Docx 格式檔案。

完整程式碼

import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;

public class ConvertPdfToWordWithFlowableStructure {

    public static void main(String[] args) {

        //建立一個 PdfDocument 物件
        PdfDocument doc = new PdfDocument();

        //載入 PDF 檔案
        doc.loadFromFile("C:\Users\Administrator\Desktop\sample.pdf");

        //將 PDF 轉換為流動形態的Word
        doc.getConvertOptions().setConvertToWordUsingFlow(true);

        //將PDF轉換為Doc格式檔案並儲存
        doc.saveToFile("output/ToDoc.doc", FileFormat.DOC);

        //將PDF轉換為Docx格式檔案並儲存
        doc.saveToFile("output/ToDocx.docx", FileFormat.DOCX);
        doc.close();
    }
}

效果圖

到此這篇關於Java實現PDF轉為Word檔案的範例程式碼的文章就介紹到這了,更多相關Java PDF轉Word內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com