首頁 > 軟體

Golang 實現 RTP音視訊傳輸範例詳解

2022-07-12 18:02:24

引言

在 Coding 之前我們先來簡單介紹一下 RTP(Real-time Transport Protocol), 正如它的名字所說,用於網際網路的實時傳輸協定,通過 IP 網路傳輸音訊和視訊的網路協定。

由音視訊傳輸工作小組開發,1996 年首次釋出,並提出了以下使用設想。

  • 簡單的多播音訊會議

使用 IP 的多播服務進行語音通訊。通過某種分配機制,獲取多播組地址和埠對。一個埠用於音訊資料的,另一個用於控制(RTCP)包,地址和埠資訊被分發給預期的參與者。如果需要加密,可通過特定格式進行加密。

  • 音視訊會議

如果在會議中同時使用音視訊媒體,那麼它們是作為單獨的 RTP 對談傳輸。音訊,視訊兩個媒體分別使用不同的 UDP 埠對傳輸單獨的 RTP 和 RTCP 陣列包,多播地址可能相同,可能不同。進行這種分離的動機是如果參與者只想接受一種媒體,可以進行選擇。

  • Mixer 和 Translator

我們需要考慮這樣一種情況,在某個會議中,大多數人處於高速網路鏈路中,而某個地方的一小部分人只能低速率連線。為了防止所有人使用低頻寬,可以在低頻寬區域放置一個 RTP 級的中繼器 Mixer。Mixer 將接收的音訊報文重新同步為傳送方 20 ms 恆定間隔,重建音訊為單一流,音訊編碼為低速頻寬的音訊,然後轉發給低速鏈路上的頻寬封包流。

  • 分層編碼

多媒體應用程式應該能調節傳輸速率以匹配接收者容量或適應網路擁塞。可以將調節速率的任務通過將分層編碼和分層傳輸系統相結合來實現接收器。在基於 IP 多播的 RTP 上下文中,每個 RTP 對談均承載在自己的多播組上。然後,接收者可以只通過加入組播組合適的子集來調整接收頻寬。

RTP 封包頭部欄位

只有當 Mixer 存在時,才會存在 CSRC 識別符號列表。這些欄位具有以下含義。前 12 個 8 位組在每一個包中都有。

  • version (V): 2 bits

RTP 版本。

  • 填充 (P): 1 bit

如果設定了填充位,包中包含至少一個填充 8 位組,其他填充位不屬於 Payload。

  • 擴充套件 (X): 1 bit

如果設定了擴充套件位則存在。

  • CSRC 數量(CC): 4 bits

CSRC 數量包含在固定頭中,CSRC 識別符號數量。

  • 標記 (M): 1 bit

標記由組態檔定義。用於標記封包流中例如幀邊界之類的重要事件。

  • payload 型別(PT): 7 bits

該欄位指出 RTP 有效載荷格式,由應用程式進行解釋。接收者必須忽略無法理解的有效載荷型別的封包。

  • 序列號: 16 bits

每次 RTP 封包傳送時增加,可能用於接收者檢測包丟失並且恢復包序列。

  • 時間戳: 32 bits

該欄位反映了 RTP 封包中第一個 8 位組的取樣時刻。

  • SSRC: 32 bits

標識同步源,這個識別符號應該選擇隨機,在同一個 RTP 對話的兩個同步源應該有不同的同步標識。

  • CSRC 列表:0 到 15 項, 其中每項 32 bits

該欄位表示對該 payload 資料做出貢獻所有 SSRC。

Golang 的相關實現

RTP 的實現有一些,不過通過 Go 實現有一些好處。

  • 易於測試

這裡的易於測試不僅僅是體現在容易書寫,能夠快速通過原始碼,函數直接生成相應測試函數。而且更重要的是能夠提供相應的基準測試,提供計時,並行執行,記憶體統計等引數供開發者進行相應調整。

  • 語言層面強大的 Web 開發能力

能夠基於語言層面快速的對例 JSON 解析,欄位封裝 。無需引入三方庫。

  • 效能較為優異

相比於 Python,Ruby 等直譯語言快,比 node, erlang 等語言更易書寫。如果服務中需要用並行,內建關鍵字 go 就可以快速起多個 goroutine。

Go 社群的RTP有 RTP 相關實現,對應的測試也比較全面,簡單介紹一下。

package_test.go (基礎測試)

func TestBasic(t *testing.T) {
  p := &Packet{}
  if err := p.Unmarshal([]byte{}); err == nil {
    t.Fatal("Unmarshal did not error on zero length packet")
  }
  rawPkt := []byte{
    0x90, 0xe0, 0x69, 0x8f, 0xd9, 0xc2, 0x93, 0xda, 0x1c, 0x64,
    0x27, 0x82, 0x00, 0x01, 0x00, 0x01, 0xFF, 0xFF, 0xFF, 0xFF, 0x98, 0x36, 0xbe, 0x88, 0x9e,
  }
  parsedPacket := &Packet{
        // 固定頭部
    Header: Header{
      Marker:           true,
      Extension:        true,
      ExtensionProfile: 1,
      Extensions: []Extension{
        {0, []byte{
          0xFF, 0xFF, 0xFF, 0xFF,
        }},
      },
      Version:        2,
      PayloadOffset:  20,
      PayloadType:    96,
      SequenceNumber: 27023,
      Timestamp:      3653407706,
      SSRC:           476325762,
      CSRC:           []uint32{},
    },
        // 有效負載
    Payload: rawPkt[20:],
    Raw:     rawPkt,
  }
  // Unmarshal to the used Packet should work as well.
  for i := 0; i < 2; i++ {
    t.Run(fmt.Sprintf("Run%d", i+1), func(t *testing.T) {
      if err := p.Unmarshal(rawPkt); err != nil {
        t.Error(err)
      } else if !reflect.DeepEqual(p, parsedPacket) {
        t.Errorf("TestBasic unmarshal: got %#v, want %#v", p, parsedPacket)
      }
      if parsedPacket.Header.MarshalSize() != 20 {
        t.Errorf("wrong computed header marshal size")
      } else if parsedPacket.MarshalSize() != len(rawPkt) {
        t.Errorf("wrong computed marshal size")
      }
      if p.PayloadOffset != 20 {
        t.Errorf("wrong payload offset: %d != %d", p.PayloadOffset, 20)
      }
      raw, err := p.Marshal()
      if err != nil {
        t.Error(err)
      } else if !reflect.DeepEqual(raw, rawPkt) {
        t.Errorf("TestBasic marshal: got %#v, want %#v", raw, rawPkt)
      }
      if p.PayloadOffset != 20 {
        t.Errorf("wrong payload offset: %d != %d", p.PayloadOffset, 20)
      }
    })
  }
}

基本測試中,利用 Golang 自帶的 Unmarshal 快速將 byte 切片轉換為相應結構體。減少了相關封包,解包等程式碼的工作量。在網路傳輸中,也能夠在語言層面直接完成大端,小端編碼的轉換,減少編碼的煩惱。

h.SequenceNumber = binary.BigEndian.Uint16(rawPacket[seqNumOffset : seqNumOffset+seqNumLength])
h.Timestamp = binary.BigEndian.Uint32(rawPacket[timestampOffset : timestampOffset+timestampLength])
h.SSRC = binary.BigEndian.Uint32(rawPacket[ssrcOffset : ssrcOffset+ssrcLength])

其中關於切片的相關操作十分便捷,可以獲取陣列中的某一段資料,操作比較靈活,在協定資料的傳輸過程中,通過切片,獲取某段資料進行相應處理。

m := copy(buf[n:], p.Payload)
p.Raw = buf[:n+m]

在實現完成後,Golang 的子測試能夠進行巢狀測試。對執行特定測試用例特別有用,只有子測試完成後,父測試才會返回。

func TestVP8PartitionHeadChecker_IsPartitionHead(t *testing.T) {
    checker := &amp;VP8PartitionHeadChecker{}
    t.Run("SmallPacket", func(t *testing.T) {
        if checker.IsPartitionHead([]byte{0x00}) {
            t.Fatal("Small packet should not be the head of a new partition")
        }
    })
    t.Run("SFlagON", func(t *testing.T) {
        if !checker.IsPartitionHead([]byte{0x10, 0x00, 0x00, 0x00}) {
            t.Fatal("Packet with S flag should be the head of a new partition")
        }
    })
    t.Run("SFlagOFF", func(t *testing.T) {
        if checker.IsPartitionHead([]byte{0x00, 0x00, 0x00, 0x00}) {
            t.Fatal("Packet without S flag should not be the head of a new partition")
        }
    })
}

更多的相關實現可以去 GitHub(https://github.com/pion/rtp) 上看一下實現原始碼。

結尾

如果人為去關注相關的傳輸細節,可能在底層耗費大量時間,目前市面上有很多相關的實現方案,有開源的,和一些公司提供的一些方案。目前經過業界實踐,陌陌,小米眾多公司都採用了聲網的 SDK 去進行相關的業務時間,部分公司甚至已經將核心業務交由處理,可見其穩定性。個人去測試了一下他們的雲課堂相關服務,回放,線上演示等功能十分便捷,可以節約大量開發時間。

以上就是Golang 實現 RTP音視訊傳輸範例詳解的詳細內容,更多關於Golang RTP音視訊傳輸的資料請關注it145.com其它相關文章!


IT145.com E-mail:sddin#qq.com