首頁 > 軟體

C#實現提取Word中插入的多媒體檔案(視訊,音訊)

2022-02-28 16:06:40

在Word中可將檔案通過OLE物件嵌入的方式插入到檔案,包括Word、excel、PDF、PPT、圖片、宏檔案、檔案包等在內的多種檔案型別。對檔案中已插入的檔案物件,也可通過本文中的方法提取出來另存到指定路徑。本文將通過C#程式程式碼範例做詳細介紹。

dll檔案安裝(3種方法)

1.通過NuGet安裝dll(2種方法)

1.1可以在Visual Studio中開啟“解決方案資源管理器”,滑鼠右鍵點選“參照”,“管理NuGet包”,然後搜尋“Free Spire.Doc”,點選“安裝”。等待程式安裝完成。

1.2將以下內容複製到PM控制檯安裝。

Install-Package FreeSpire.Doc -Version 9.9.7

2.手動新增dll參照

可通過手動下載包到本地,然後解壓,找到BIN資料夾下的Spire.Doc.dll。然後在Visual Studio中開啟“解決方案資源管理器”,滑鼠右鍵點選“參照”,“新增參照”,將本地路徑BIN資料夾下的dll檔案新增參照至程式。

提取檔案

提取檔案時,主要通過以下步驟完成:

  • 建立Document類的物件,並通過Document.LoadFromFile()方法載入Word檔案。
  • 遍歷Word檔案中的所有Section中的子物件,判斷物件是否為Paragraph型別。
  • 遍歷段落中的子物件,判斷物件是否為DocumentObjectType型別的OLE物件。
  • 將符合條件的OLE物件通過as操作符轉換為DocOleObject型別。
  • 通過File.WriteAllBytes()方法提取物件,儲存到本地路徑。

:以下程式碼中所使用到的Word測試檔案和提取到的多媒體檔案路徑為VS程式的Debug路徑,如:F:VS2017Project ExtractMediaFilebinDebug 。

完整程式碼

下面是完整程式碼範例:

C#

using Spire.Doc;
using Spire.Doc.Documents;
using Spire.Doc.Fields;
using System.IO;

namespace ExtractMediaFile
{
    class Program
    {
        static void Main(string[] args)
        {
            //載入Word檔案
            Document doc = new Document();
            doc.LoadFromFile(@"OLE.docx");

            //遍歷所有子物件
            foreach (Section section in doc.Sections)
            {
                foreach (DocumentObject obj in section.Body.ChildObjects)
                {
                    if (obj is Paragraph)
                    {
                        Paragraph paragraph = obj as Paragraph;
                        foreach (DocumentObject obj2 in paragraph.ChildObjects)
                        {
                            if (obj2.DocumentObjectType == DocumentObjectType.OleObject)
                            {
                                DocOleObject ole = obj2 as DocOleObject;

                                //提取檔案
                                File.WriteAllBytes(ole.PackageFileName, ole.NativeData);
                            }
                        }
                    }
                }
            }

        }
    }
}

VB.NET

Imports Spire.Doc
Imports Spire.Doc.Documents
Imports Spire.Doc.Fields
Imports System.IO

Namespace ExtractMediaFile
    Class Program
        Private Shared Sub Main(args As String())
            '載入Word檔案
            Dim doc As New Document()
            doc.LoadFromFile("test.docx")

            '遍歷所有子物件
            For Each section As Section In doc.Sections
                For Each obj As DocumentObject In section.Body.ChildObjects
                    If TypeOf obj Is Paragraph Then
                        Dim paragraph As Paragraph = TryCast(obj, Paragraph)
                        For Each obj2 As DocumentObject In paragraph.ChildObjects
                            If obj2.DocumentObjectType = DocumentObjectType.OleObject Then
                                Dim ole As DocOleObject = TryCast(obj2, DocOleObject)

                                '提取檔案
                                File.WriteAllBytes(ole.PackageFileName, ole.NativeData)
                            End If
                        Next
                    End If
                Next
            Next

        End Sub
    End Class
End Namespace

檔案讀取結果如圖:

到此這篇關於C#實現提取Word中插入的多媒體檔案(視訊,音訊)的文章就介紹到這了,更多相關C#提取Word中多媒體檔案內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com