<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
本來想寫word轉pdf和pdf轉word的程式碼呢,沒想到word轉pdf就寫了很多很多行程式碼才實現,為了方便大家消化理解,先寫了word轉pdf方法實現作為一篇文章。
程式碼實現主要依賴兩個第三方jar包,一個是pdfbox,一個是aspose-words。pdfbox包完全開源免費,aspose-words免費版生成有水印,且生成數量有限制。單純用pdfbox 實現word轉pdf的話,實現非常複雜,且樣式和原來樣式,保持一致的的比例很低。所以,我先用aspose-words生成了帶水印的pdf,再用pdfbox去除aspose-words生成的水印的,最終得到了一個無水印的pdf。
aspose-words 這個需要設定單獨的倉庫地址才能下載,不會設定的可以去官網直接下載jar引入專案程式碼中。
<repositories> <repository> <id>AsposeJavaAPI</id> <name>Aspose Java API</name> <url>https://repository.aspose.com/repo/</url> </repository>
<!-- https://mvnrepository.com/artifact/org.apache.pdfbox/pdfbox --> <dependency> <groupId>org.apache.pdfbox</groupId> <artifactId>pdfbox</artifactId> <version>3.0.0-RC1</version> </dependency> <dependency> <groupId>com.github.jai-imageio</groupId> <artifactId>jai-imageio-jpeg2000</artifactId> <version>1.3.0</version> </dependency> <dependency> <groupId>com.aspose</groupId> <artifactId>aspose-words</artifactId> <version>21.9</version> <type>pom</type> </dependency>
import com.aspose.words.Document; import com.aspose.words.SaveFormat; import org.apache.pdfbox.Loader; import org.apache.pdfbox.contentstream.operator.Operator; import org.apache.pdfbox.cos.COSArray; import org.apache.pdfbox.cos.COSDictionary; import org.apache.pdfbox.cos.COSName; import org.apache.pdfbox.cos.COSString; import org.apache.pdfbox.pdfparser.PDFStreamParser; import org.apache.pdfbox.pdfwriter.ContentStreamWriter; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.pdmodel.PDPage; import org.apache.pdfbox.pdmodel.PDPageTree; import org.apache.pdfbox.pdmodel.PDResources; import org.apache.pdfbox.pdmodel.common.PDStream; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.OutputStream; import java.util.ArrayList; import java.util.Iterator; import java.util.List; public class PDFHelper3 { public static void main(String[] args) throws IOException { doc2pdf("C:\Users\liuya\Desktop\word\帆軟報表幫助檔案.docx"); } //替換pdf文字內容 public static void replaceText(PDPage page, String searchString, String replacement) throws IOException { PDFStreamParser parser = new PDFStreamParser(page); List<?> tokens = parser.parse(); for (int j = 0; j < tokens.size(); j++) { Object next = tokens.get(j); if (next instanceof Operator) { Operator op = (Operator) next; String pstring = ""; int prej = 0; if (op.getName().equals("Tj")) { COSString previous = (COSString) tokens.get(j - 1); String string = previous.getString(); string = string.replaceFirst(searchString, replacement); previous.setValue(string.getBytes()); } else if (op.getName().equals("TJ")) { COSArray previous = (COSArray) tokens.get(j - 1); for (int k = 0; k < previous.size(); k++) { Object arrElement = previous.getObject(k); if (arrElement instanceof COSString) { COSString cosString = (COSString) arrElement; String string = cosString.getString(); if (j == prej) { pstring += string; } else { prej = j; pstring = string; } } } if (searchString.equals(pstring.trim())) { COSString cosString2 = (COSString) previous.getObject(0); cosString2.setValue(replacement.getBytes()); int total = previous.size() - 1; for (int k = total; k > 0; k--) { previous.remove(k); } } } } } List<PDStream> contents = new ArrayList<>(); Iterator<PDStream> streams = page.getContentStreams(); while (streams.hasNext()) { PDStream updatedStream = streams.next(); OutputStream out = updatedStream.createOutputStream(COSName.FLATE_DECODE); ContentStreamWriter tokenWriter = new ContentStreamWriter(out); tokenWriter.writeTokens(tokens); contents.add(updatedStream); out.close(); } page.setContents(contents); } //移除圖片水印 public static void removeImage(PDPage page, String cosName) { PDResources resources = page.getResources(); COSDictionary dict1 = resources.getCOSObject(); resources.getXObjectNames().forEach(e -> { if (resources.isImageXObject(e)) { COSDictionary dict2 = dict1.getCOSDictionary(COSName.XOBJECT); if (e.getName().equals(cosName)) { dict2.removeItem(e); } } page.setResources(new PDResources(dict1)); }); } //移除文字水印 public static boolean removeWatermark(File file) { try { //通過檔名載入檔案 PDDocument document = Loader.loadPDF(file); PDPageTree pages = document.getPages(); Iterator<PDPage> iter = pages.iterator(); while (iter.hasNext()) { PDPage page = iter.next(); //去除文字水印 replaceText(page, "Evaluation Only. Created with Aspose.Words. Copyright 2003-2021 Aspose", ""); replaceText(page, "Pty Ltd.", ""); replaceText(page, "Created with an evaluation copy of Aspose.Words. To discover the full", ""); replaceText(page, "versions of our APIs please visit: https://products.aspose.com/words/", ""); replaceText(page, "This document was truncated here because it was created in the Evaluation", ""); //去除圖片水印 removeImage(page, "X1"); } document.removePage(document.getNumberOfPages() - 1); file.delete(); document.save(file); document.close(); return true; } catch (IOException ex) { ex.printStackTrace(); return false; } } //doc檔案轉pdf(目前最大支援21頁) public static void doc2pdf(String wordPath) { long old = System.currentTimeMillis(); try { //新建一個pdf檔案 String pdfPath=wordPath.substring(0,wordPath.lastIndexOf("."))+".pdf"; File file = new File(pdfPath); FileOutputStream os = new FileOutputStream(file); //Address是將要被轉化的word檔案 Document doc = new Document(wordPath); //全面支援DOC, DOCX, OOXML, RTF HTML, OpenDocument, PDF, EPUB, XPS, SWF 相互轉換 doc.save(os, SaveFormat.PDF); os.close(); //去除水印 removeWatermark(new File(pdfPath)); //轉化用時 long now = System.currentTimeMillis(); System.out.println("Word 轉 Pdf 共耗時:" + ((now - old) / 1000.0) + "秒"); } catch (Exception e) { System.out.println("Word 轉 Pdf 失敗..."); e.printStackTrace(); } } }
以一個帶文字和圖片,工21頁的doc檔案為例,word轉pdf花費時長4.398秒
原word樣式
轉化後pdf效果圖
通過對比,word原來的樣式和轉換pdf檔案後的樣式基本沒有變化。
到此這篇關於Java實現無失真Word轉PDF的範例程式碼的文章就介紹到這了,更多相關Java無失真Word轉PDF內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45