首頁 > 科技

3090Ti會出現嗎?RTX 30系顯示卡核心對比

2021-06-15 20:58:04

截止目前,GeForce RTX 30系顯示卡的釋出基本已經告一段落,雖然此次共有60、70、80、90的四個常規型號,以及Ti系列的三個型號,共7款顯示卡。但核心卻只有三種,分別為GA102、GA104和GA106,所以這幾個晶片到底有什麼區別,所謂的閹割核心又有什麼區別,下面筆者給大家逐一講解一下。

在每個顯示卡的GPU核心中,包含無數的大大小小的處理單元,首先我們從最小的流處理器(SM)來看。

SM詳解

在新的NVIDIA Ampere架構中,每個SM單元包含四個大的處理分區共128個CUDA核心,4個第三代Tensor Core,1個第二代RT Core,1個256 KB的快取檔案,1個128 KB的L1快取,這個L1快取可以根據不同的工作需求來調配快取,工作效率發揮至最大。

本次NVIDIA Ampere的SM在Turing基礎上增加了一倍的FP32運算單元,這使得每個SM的FP32運算單元數量提高了一倍,同時吞吐量也就變為了一倍。

而通常我們計算顯示卡的CUDA數量,並不是把SM中的所有單元加起來計數,而是隻統計FP32單元的數量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變為 2:1。

如剛剛釋出的GeForce RTX 3070 Ti共有6144個CUDA,其實它有3072個INT32單元,但由於內部的FP32數量翻了一倍,所以最終實現了6144的CUDA數量。

GA102核心

完整的GA102核心

完整的GA102 GPU包含7個GPC(圖形處理叢集)42個TPC(紋理處理叢集)以及84個SM(流處理器)組成。在整個架構圖中,GPC是佔據主導地位的高階模組,擁有所有的關鍵圖形處理單元,每個GPC包含一個專用光柵引擎。在新的NVIDIA Ampere架構中,每個GPC還包含了兩個ROP分區,每個分區包含8個ROP單元。

根據圖中可以計算出,完整GA102核心的CUDA數量應該是10752個,目前還沒有一款顯示卡達到,即便是RTX 3090的CUDA數量也只是10496個,所以可以推斷RTX 3090遮蔽了一組TPC,意味著只有82個SM單元。

所以從理論上來講,GA102還有餘力,而且RTX 3080 Ti和RTX 3090也只差了2個SM單元,GeForce RTX 3090 Ti的出現也不是沒有可能。

RTX 3080閹割後的GA102核心

上圖為RTX 3080所使用的GA102核心,即便我們不知道架構原理,但也能明顯看出該核心被大幅削減過,RTX 3080共有8704個CUDA,所以可以推算出相比完整的GA102,其遮蔽了8組TPC,也就是少了16個SM單元,2048個CUDA。

GA104核心

GA104核心示意

RTX 3060 Ti、RTX 3070以及RTX 3070 Ti均採用了GA104核心,不過NVIDIA官方並沒有放出架構圖,我們只能以完整的GA102來做參考。

RTX 3070共有5888個CUDA,所以根據我們之前的計算,可以推算出,RTX 3070共有46個SM單元,23個TPC,也就是上圖中圈出來的範圍。但我們僅以數量來進行參考,真正的核心設計不可能只是簡單粗暴的裁剪。

RTX 3060 Ti共有4864個CUDA,RTX 3070 Ti共有6144個CUDA,大家也可以動手計算一下這兩個卡都各有多少TPC,多少個SM單元。

GA106核心

完整的GA106核心

目前採用GA106核心的只有RTX 3060,完整的GA106 GPU包含3個GPC(圖形處理叢集)15個TPC(紋理處理叢集)30個SM(流處理器)3840個CUDA。而RTX 3060共有3584個CUDA,28個SM單元,所以使用的也並不是完整的GA106核心。

從目前發售的顯示卡來看,使用GA106核心的只有RTX 3060;使用GA104核心的則有RTX 3060 Ti、RTX 3070、RTX 3070 Ti;而使用GA102核心的則有RTX 3080、RTX 3080 Ti、RTX 3090,包含整個RTX 30系家族共有7款顯示卡。


IT145.com E-mail:sddin#qq.com