首頁 > 硬體

高清晰視訊通訊應用技術及相關標準介紹【詳解】

2020-10-22 04:57:16

  高清晰視訊通訊應用技術及相關標準有哪些?

  隨著視訊通訊應用技術的不斷髮展和完善,越來越多的行業使用者接受和使用視訊通訊產品。但在傳統視訊通訊技術標準下,由於受到視訊通訊應用技術和音視訊編解碼技術發展的制約,視訊通訊技術到現在還沒有從根本上解決通訊過程中的影象和聲音問題。 低等級的視訊質量無法滿足使用者對高清晰影象質量的特殊需求。

  傳統視訊通訊的主要問題是:經過編解碼後的影象在解析度、色彩還原度等方面和真實場景有較大的差距。造成這一現象的原因方面是由於編解碼裝置的編解碼效率低、鏈路動態適應能力差等諸多因素導致對真場景還原失真。另外在音訊方面,傳統的50Hz-7KHz只能感受到較窄的音訊寬度並不能對現場環境和聲音特徵進行有效還原,需要音訊編解碼提供更高的音訊取樣率,以實現更寬的音訊效果。在現實運用中,人們對於視訊的影象和聲音的要求越來越高,例如:遠端醫療、遠端手術;遠端維修等需要通過視訊通訊這一過程實現對現場情況的精確視訊傳輸(高清晰視訊應用)。所以就需要我們提供更高視訊通訊質量的高清晰視訊通訊產品。因此數碼視訊公司推出了基於標準的H.320;H.323的高清晰視訊通訊產品NEWVISION 7000、NEWVISION 8000系列。

  高清晰視訊通訊技術的選擇:

  視訊要求:

  視訊通訊應用作為一種媒體應用方式同樣需要遵循各標準組織所倡導的高清晰多媒體標準。當前高清晰數位電視(HDTV)所倡導的視訊解析度主要有三種格式,分別為720P、1080I、1080P (其中“P」為逐行掃描方式;“I」為隔行掃描方式)。而高清晰視訊通訊主要應用格式為:720P——即逐行720線。

  視訊通訊採用逐行掃描的原因在於,視訊會議場景通常對動態影象要求不大(特殊領域除外),影象動態變化也較小,但對影象的細節要求卻很高,同時還要保證影象的穩定性。而這些都是採用隔行掃描1080i(PAL制每秒鐘掃描50場,分別對水平方向的奇數行和偶數行進行掃描,每場的實際解析度僅有540線)所無法滿足的,因此在掃描方式上採用逐行掃描,能夠更穩定的顯示畫面的細節,使得畫面更加清晰。

  在媒體流處理方面,需要將大量的原始視訊音訊資料流進行編碼壓縮後在傳輸鏈路上進行壓縮傳輸。高清晰音視訊流(720P)所處理的視訊流是傳統CIF格式流的10倍。如果採用更大解析度格式的視訊影象,如1080P,會造成原始媒體資料流更為巨大,從而影響視訊編碼效率,降低通訊過程的實時性,增加延遲,同時也是對影象實時壓縮技術的考驗。因此,視訊會議系統的建設,無論是建設標清還是高清晰視訊通訊系統都要綜合考慮使用者對系統建設的投資,讓使用者付出相對較低的成本,得到最大的收益。採用過高的視訊影象格式(1080P)進行媒體流的處理,這樣對DSP的成本會增加,同時也會相應造成使用者整體成本的增加,例如視訊會議系統的周邊配套裝置——高清晰顯示裝置、回放裝置、儲存裝置和主要的攝像採集裝置,都要符合高清晰通訊的規程(高清晰視訊通訊是一個完整的端到端的系統),而這些裝置的價格都遠超其他裝置,會使得整體成本大幅提升,從而給使用者所能帶來的實際效果提升卻並不明顯。因此,採用720P視訊格式作為影象解析度的格式能夠使整體系統達到最佳的價效比,能夠有效的降低使用者的採購成本,避免投資浪費。

  在影象的幅面顯示方面,目前高清晰顯示裝置均可以同時支援4:3和16:9兩種顯示方式。傳統視訊通訊系統多數採用4:3顯示方式,而高清晰視訊通訊在視訊格式幅型比上應採用更為符合人眼觀賞習慣的16:9的顯示方式來替代傳統視訊會議系統採用的4:3的顯示方式,這是因為螢幕顯示區域在垂直解像度(線數)相同的情況下,採用16:9顯示方式可視面積比4:3顯示方式的可視面積要增加20%左右,單幀畫面可容納更多的視訊資訊,這樣視訊通訊中使用者就可以獲得更大角度的視訊影象。

  所以綜述得出結論是:在對高清晰視訊通訊視訊影象的最佳選擇應該是:選擇720P視訊格式、16:9幅面的高清晰視訊標準。

  音訊要求:

  視訊通訊過程是視訊和音訊的實時雙向完整通訊過程。在這個過程中我們為了獲得高清晰視訊影象,有時卻忽略了另外一個重要的過程——音訊通訊過程。如果我們在觀看高清晰視訊影象的時候,不能得到一個更清晰、連續的音訊效果。那麼這個過程實際上就沒有任何意義,所以其重要性甚至超過視訊。在傳統的視訊會議系統中音訊技術發展極其緩慢,原因在於目前應用於視訊通訊的音訊編解碼壓縮標準都是為了保持傳輸時的低頻寬佔用和較高的編解碼效率,從而將音訊訊號的取樣頻率、取樣精度和取樣範圍指標做了極大的降低,使得所能提供的音訊清晰度和還原性都有很大程度上的衰減。與用於儲存和回放非實時壓縮協定的標準(如OGG、MP3等)相比,音訊的保真度非常低。這樣就在某種程度上對現場聲音的還原達不到要求。目前傳統視訊通訊過程中主要採用的是G.711、G.722、G.722.1、G.728等音訊標準,音訊寬度僅有50Hz-7KHz單聲道,而人耳所能感知的自然界的頻響能力可以達到20Hz-20KHz,因此,在對現場環境音的還原過程中過多的音訊資訊的丟失造成了無法真實表現現場情況。所以在高清晰視訊通訊過程中我們勢必要有一種相輔助的音訊處理方式解決此問題。使真個高清晰通訊過程更去近於完美。

  目前國際上對音訊處理技術上標準較多,在對下一代實時互動音訊處理上可以採用MPEG-1 Layer 2或AAC系列音訊,對選用標準的原則是,音訊頻響範圍要達到22KHz,這樣就幾乎可以覆蓋了人耳聽覺的全部範圍,甚至在高頻方面還有所超越,能夠使現場音訊得到真實自然的還原,並且在還原時可以採用雙聲道立體聲回放,使整個視訊通訊的聲音有更強的臨近感,達到CD級音質。同時在對鏈路頻寬的適應和編解碼效率上達到最佳。下表列出AAC的9種規格。

  標準        規 格

  MPEG-2 AAC   MAIN 主標準,對音訊處理上,缺少增益控制

  MPEG-2 AAC   LC 使用了TNS,缺少增益和預測,提高編碼效率

  MPEG-2AAC    SSR 可變取樣方式

  MPEG-4 AAC   LC 低複雜度編碼方式

  MPEG-4 AAC   MAIN 主標準

  MPEG-4 AAC   SSR 可變取樣方式

  MPEG-4 AAC   LD 低延遲編碼方式

  MPEG-4 AAC   HE 高效率編碼方式

  MPEG-4 AAC   LTP 長時預測規格

  綜上所述,我們在對寬頻音訊的支援上可以選擇MPEG-1 Layer 2或AAC系列標準,在上述列表中可以看出有9種AAC格式可供選擇,每種格式均有各自特點。在下一代高清晰視訊通訊應用領域中為使用者提供CD級的寬頻音訊是我們追求的方向。

  北京數碼視訊高清晰視訊通訊技術

  高清晰視訊通訊概念提出的時間很短,目前只有國外的一些廠家宣佈其擁有該項技術和產品,國內真正涉及到高清晰視訊通訊技術和產品的廠家很少。因此,對於中國的視訊通訊廠家來說將面臨著新的挑戰和機遇。

  北京數碼視訊在廣電系統具有多年行業經驗,擁有自主知識產品的編解碼技術。利用其在編解碼器上的技術優勢,公司視訊研發團隊致力於高清晰影象編解碼優化,完全滿足高清晰視訊通訊的技術要求,在視訊上採用H.264的標準、720P的格式,在音訊上採用MPEG-1 Layer 2和AAC音訊標準。成功推出商用級高清晰H.264編解碼技術和New Vision7000、8000系列高清視訊產品,為使用者帶來高清晰影象和高保真語音享受。


IT145.com E-mail:sddin#qq.com