首頁 > 科技

GeForce RTX 3070 Ti天梯榜首發評測:GA104核心火力全開

2021-06-09 21:44:53

本月初的臺北國際電腦展(Computex 2021)上,NVIDIA宣佈了兩款GeForce RTX 系列的全新GPU,除了上週已經開賣的GeForce RTX 3080 Ti之外,還有一款建議零售價僅為GeForce RTX 3080 Ti半價的GeForce RTX 3070 Ti。GeForce RTX 3070 Ti採用了完整的GA104核心,並且還給GA104核心首次用上了GDDR6X視訊記憶體,讓其效能釋放暢通無阻,可以說,要想知道GA104核心的極限效能可以達到何種地步,就看這張GeForce RTX 3070 Ti就行了。

完整的GA104核心現身

這代Ampere架構的GA104核心第一次現身是在GeForce RTX 3070這款GPU身上,相比於RTX 3090/3080 Ti/3080的GA102大核心不同,GA104核心不管是核心面積、電晶體數量還是GPC單元的構成上都有很大的變化。

GeForce RTX 3070 Ti的完整GA104核心

不過,GeForce RTX 3070上的GA104-300核心並不是完整的GA104核心,而是遮蔽了一組TPC,也就是隻啟用了GA104上的46組SM單元。而如今釋出的GeForce RTX 3070 Ti上,GA104-300核心遮蔽的這組TPC得以解除桎梏,完全體的GA104得以現身,其核心代號也變更為GA104-400。

前面說過,GA104核心不管是核心面積、電晶體數量還是GPC的構成上都有很大的變化,具體來說就是核心面積從628mm2縮小到392.5mm2,電晶體數量也從283億變成了174億,芯片面積和電晶體數量都縮小了40%左右。

GPC單元方面,GA102核心的GPC單元較大,每組GPC單元包含6組TPC單元,而GA104核心的每組GPC單元包含4組TPC單元,稍小一點。完整的GA104核心具有6組GPC單元,也就是一共具有24組TPC單元,而每組TPC包含2組SM單元,所以總共擁有48個SM單元,每組SM有128個CUDA,一共有6144個CUDA,8組32位的視訊記憶體控制器組成256bit的視訊記憶體位寬,這也就是GeForce RTX 3070 Ti的完整規格。

GDDR6X視訊記憶體下放,助力完整的GA104核心火力全開

GDDR6X視訊記憶體的加持是GeForce RTX 3070 Ti另一大亮點,此前GDDR6X視訊記憶體都僅與GA102大核心搭配出現,畢竟作為最新的視訊記憶體規格其成本肯定是相比於GDDR6視訊記憶體要高不少的。GeForce RTX 3070 Ti有了GDDR6X視訊記憶體的加持,在視訊記憶體位寬與GeForce RTX 3070一樣的情況下,可以具有更高的視訊記憶體頻寬,助力GeForce RTX 3070 Ti上這顆完整的GA104核心火力全開。

與GDDR6視訊記憶體相比,GDDR6X上出現重大變化的地方是它的訊號傳輸機制。原本的GDDR系視訊記憶體使用的是非常原始的二進位制訊號,它用高電平代表1,低電平代表0。如果要提高它的資料頻寬,那麼提高視訊記憶體的時鐘頻率即可。但現在由於受到製程工藝等各方面因素的影響,視訊記憶體的時鐘頻率在現階段已經很難再攀高,於是,廠商想到了用新的訊號調製機制來提高訊號傳輸的效率,他們選擇了已經有較為廣泛的PAM4。

PAM是一種用模擬訊號脈衝編碼資訊的訊號調製方式,PAM4是其中較為簡單的一種。與NRZ這種僅有高和低兩種狀態的二進位制訊號不同的是,PAM4有4種不同的電平值,也就是它有4種不同的狀態,而每種狀態對應著一種0和1的組合,也就是說,它的每個狀態對應了2個bit的資料量,較NRZ是翻倍的。另外NVIDIA還配套引入了MTA編碼,在訊號傳輸層面上減少損耗,保證穩定性。

在GDDR6X視訊記憶體的加持下,RTX 3070 Ti儘管與RTX 3070一樣是256bit的視訊記憶體位寬,但是視訊記憶體頻寬卻從448GB/s躍升到608.3GB/s,增幅多達35.78%。

最後,RTX 3070 Ti與RTX 3070相比,在核心頻率、TGP功耗方面也有一些區別,基礎頻率從RTX 3070的1500MHz升高到1575MHz,Boost頻率RTX 3070的1725MHz升高到1770MHz,TGP功耗由於GDDR6X視訊記憶體的原因,也有不小的提升,達到了290W。售價方便,則是相比於RTX 3070小貴了600元。

完全體的GA104核心加上GDDR6X視訊記憶體的加持,再加上頻率方面進一步提高,這一套組合拳下來,可以說,這次推出的GeForce RTX 3070 Ti是將GA104核心的效能完全榨乾了。

RTX 3070 Ti與RTX 3080和RTX 3070的規格對比如下:

NVIDIA Ampere架構簡介

RTX 30系GPU上的SM單元相比RTX 20系的,最大變化是加倍了針對傳統計算的FP32單元、引入第二代RT Core以及第三代Tensor Core。

大家都知道在Turing架構中,NVIDIA整數型(INT32)和單精度浮點型(FP32)兩種不同的資料類型交給兩種不同的ALU進行計算。不過現代遊戲應用中最為常見的還是FP32,因此為了提高計算效率NVIDIA在NVIDIA Ampere 架構上引入了可同時支援INT32或FP32兩種資料類型的新ALU。也就是說,現在有兩條不同的資料路徑,一條能夠同時處理整數或者單精度浮點,另一條則單純處理處理單精度浮點計算。

負責進行實時光線追蹤運算的專用硬體單元RT Core在NVIDIA Ampere 架構上也更新到了第二代,最主要是增加了動態模糊的加速運算支援。NVIDIA在其中新加入的插值演算法可以在保證動態模糊精確性的同時提高了實時光線追蹤效率,官方表示最高可達8倍於上代的速度。另外在基礎的BVH計算上,第二代RT Core也可以比第一代快2倍。

Tensor Core這個負責運行AI計算的硬體單元在NVIDIA Ampere 架構上也升級到了第三代。其實之前釋出的A100計算卡上已經用上了新的第三代Tensor Core,它能夠提供比第二代Tensor Core高出4倍的效能,不過遊戲卡上面的Tensor Core進行了一定的精簡,其FP16 FMA計算的吞吐量只有GA100核心中的Tensor Core的一半。

而第三代Tensor Core帶來的更強勁AI運算有些什麼用呢? 答案就是DLSS。隨著RTX 30系GPU一同釋出的,還有DLSS的更新版 - DLSS2.1,在很多遊戲設定裡面就是DLSS選項中的「超級效能」模式,它可以通過渲染1440P的畫面輸出4320P的8K遊戲畫面,並且與原始8K解析度的畫面幾乎肉眼難以區分,這利用的就是Tensor Core帶來的更強勁AI運算功能。

再之後就是HDMI 2.1這個備受期待的新輸出埠了。在HDMI 2.1之下,顯示卡可以用單線材做到8K60Hz或者4K120Hz的輸出。對於想用大尺寸電視打遊戲的玩家來說是一個不錯的福音。

最後還有就是NVIDIA新推出的RTX IO了。這項技術是NVIDIA藉助微軟此前推出的DirectStorage API來實現的,將會作為插件的形式與後者整合,可以讓GPU繞開CPU直接讀取SSD資料,從而降低CPU的佔用率。不過由於RTX IO需要依靠Windows的DirectStorage API,並且還需要遊戲開發商做針對性的優化,這需要一定的過程,我們只能期待儘快可以看到這項技術的具體應用。

RTX 3070 Ti公版顯示卡產品解析

RTX 3070 Ti公版顯示卡外觀

RTX 3070 Ti公版顯示卡與之前的RTX 3070公版顯示卡在外觀上的區別非常的大,最引人注目的當屬其散熱風扇的設計結構。與RTX 3070公版顯示卡採用的當下最常見的正面雙軸流風扇散熱結構不同,RTX 3070 Ti公版顯示卡沿用了與目前RTX 3090/3080 Ti/3080這三張公版卡一樣的雙軸流推輓式風扇散熱設計。

同時,與RTX 3070公版顯示卡相比,RTX 3070 Ti公版顯示卡的體型也是明顯的增大了。當然,RTX 3070 Ti公版顯示卡也保持了非越肩的設計,並且厚度也是雙槽,但是與與RTX 3070公版顯示卡相比在長度上增加了不少,這也意味著其具有更多的散熱鰭片面積。

採用雙軸流推輓式風扇散熱設計和增加散熱鰭片面積,很明顯是因為RTX 3070 Ti對散熱的要求提高了,畢竟與RTX 3070相比,RTX 3070 Ti具有更多的計算單元,核心頻率也更高,最重要的是,它有效能更強但發熱也更大的GDDR6X視訊記憶體。

至於供電介面,則仍然是全新的12 Pin供電介面,這個介面比標準的PCIe供電介面小,但能夠承載更大的電流,也就是能夠獲取更大瓦數的外部供電。但是由於PC電源方面還未及時跟上新方案,所以公版卡也附送有一條轉接線,用於將標準PCIe供電介面轉換成新的12 Pin供電介面。

顯示輸入介面方面也是有3個DP介面和1個HDMI介面,這個HDMI介面是2.1標準的,可以支援8K 60FPS乃至10K 30FPS的視訊輸出,與採用HDMI 2.1介面的顯示器或者電視連線使用的話,只需要一根線材就可以實現8K 60FPS的視訊輸出,而不像之前需要兩根DP線或者4根HDMI線。

RTX 3070 Ti的PCIE介面支援PCIE 4.0,並且與同時公佈的RTX 3080 Ti一樣,出廠就支援Resizable BAR,並不需要像之前的RTX 3070一樣需要更新GPU BIOS來獲得支援。

RTX 3070 Ti公版顯示卡拆解:4根6mm熱管,12相供電

RTX 3070 Ti公版顯示卡的散熱器看起來與更高一級的RTX 3080的散熱器差不多,同樣是4個熱管,並且均覆蓋有黑色鍍層,但是規格上其實縮了不少,因為RTX 3080公版卡的4根熱管都是8mm直徑的,而RTX 3070 Ti公版卡的4根熱管都是6mm直徑的。

此外,RTX 3070 Ti公版卡散熱器與GPU核心接觸的部分看起來並不是真空腔均熱板設計,而是純銅底座,並且底座並沒有進行鍍鎳處理,相對來說用工粗糙一些。

RTX 3070 Ti公版顯示卡的PCB算是一大亮點,因為它與目前所有的公版顯示卡都不同,它的PCB末端進行了圓弧狀的切割,讓它在能與雙軸流推輓式風扇散熱設計相相容的情況下最大化PCB的面積。

PCB的中間可以看到RTX 3070 Ti的GA104-400核心,周圍一共有8顆視訊記憶體,均是美光的GDDR6X視訊記憶體,型號為IBT77-D8BWW,單顆1GB容量,位寬32bit,8顆一共組成8GB的容量、256bit位寬。

供電方面一共採用了12相供電,MosFET均是來自萬國半導體(Alpha & Omega Semiconductor)的,不過上面只刻了生產批次編號BLNO-1E3A,PWM控制器可以在背面找到,有一顆uP9512R和一顆uS5650Q。

效能測試

測試平臺

測試平臺如上,記憶體是2條8GB的Tt ToughRAM DDR4-3600記憶體組成的16GB雙通道配置,並且在BIOS中開啟XMP讓記憶體運行在3600MHz的頻率,同時在BIOS中開啟Resizable BAR的支援,其他均採用預設設定。

對比的顯示卡方面,自家的N卡選用了RTX 3070 Ti上一檔的RTX 3080與下一檔的RTX 3070,還有就是RTX 3070 Ti對位的上一代顯示卡RTX 2070 SUPER,A卡方面選用了售價與RTX 3070 Ti接近的RX 6800以及對位上接近的同為「7系」的RX 6700 XT。

基準效能測試

我們以3DMark作為顯示卡基準效能測試,測試項目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六個項目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三個項目分別測試的是GPU在DX11遊戲中的1080p解析度、2K解析度和4K解析度下的效能指數,Time Spy、Time Spy Extreme兩個項目則是顯示卡在DX12遊戲中的2K解析度和4K解析度下的效能指數,Port Royal是測試的GPU實時光線追蹤的效能指數,具體成績見下表,表中所列成績均為3DmarkGPU單項的得分。

3DMark基準測試方面,RTX 3070 Ti綜合約相當於RTX 3080的83.4%的效能,不過在光追效能方面,差距要大於這個平均值,RTX 3070 Ti的光追效能僅相當於RTX 3080的76.7%。與RTX 3070對比的話,RTX 3070 Ti在各種模擬環境下的提升幅度都差不多,整體約提升了9%的效能。與上一代對位的RTX 2070 SUPER相比,RTX 3070 Ti的提升幅度非常的大,綜合提升了47.3%,與官方宣傳的50%的效能提升差不多。

跟A卡陣容對比的話,還是老樣子得分三部分看,首先是DX 11 API介面下,RTX 3070 Ti約有RX 6800的83%的效能,與RX 6700 XT相比的話略微高出4%。而在DX 12 API介面下,RTX 3070 Ti就與RX 6800不相伯仲了,與RX 6700 XT相比的話高出多達27%。最後光追下的效能,A卡這邊是完全不能打,RX 6800僅有RTX 3070 Ti的88.5%的效能,RX 6700 XT更是隻有RTX 3070 Ti的66.6%的效能,即光追效能方面RTX 3070 Ti領先RX 6700 XT多達50%。

多款遊戲實測

傳統光柵化遊戲測試

傳統光柵化遊戲畫面測試這部分均將遊戲畫質設定為預設裡面的最高畫質設定(《地鐵:離去》選擇Ultra畫質,《戰爭機器5》統一開啟非同步計算、關閉可變速率陰影),預設不是全屏的手動改為全屏,預設開啟了垂直同步的手動關閉垂直同步,除此之外其他選項均為預設設定,均採用遊戲自帶的Benchmark輸出結果,基於RTX 3070 Ti的定位,測試4K和2K兩個解析度。

綜合10款遊戲的實際測試來看,4K解析度傳統光柵化渲染下,RTX 3070 Ti綜合約相當於RTX 3080的83.5%的效能,與RX 6800相比互有勝負,綜合約為RX 6800的97.3%的效能。相對於RTX 3070綜合領先9.6%,相對於RX 6700 XT綜合領先25.5%,相對於RTX 2070 SUPER綜合領先48.7%。

2K解析度傳統光柵化渲染下,RTX 3070 Ti綜合約相當於RTX 3080的85.7%的效能,與RX 6800相比也是互有勝負,不過總體還是略輸一點點,綜合約為RX 6800的95.2%的效能。相對於RTX 3070綜合領先10%,相對於RX 6700 XT綜合領先14.3%,相對於RTX 2070 SUPER綜合領先42.4%。

具體的RTX 3070 Ti的遊戲效能的話,可以理解為在傳統光柵化渲染下,RTX 3070 Ti可以滿足當下所有最新的單機大作在2K解析度下以最高畫質流暢運行,比如《看門狗:軍團》可以達到74幀,《刺客信條:英靈殿》也可以達到71幀。而面對稍微更早一點的遊戲,或者對配置要求不那麼嚴苛的最新大作,有的也能在4K解析度下以最高畫質流暢運行,比如《塵埃5》可以達到4K 69幀,《古墓麗影:暗影》可以達到4K 72幀。

實時光追遊戲測試

光追方面,也是測試4K和2K兩個解析度,由於A卡不支援DLSS,為了控制畫面效果完全一樣所以N卡也跑了不開啟DLSS的成績,但是對於RTX顯示卡使用者來說DLSS這項福利技術多數是會開啟的,所以為了表現GPU的實際遊戲體驗,也測試了N卡開啟DLSS的成績(《塵埃5》不支援DLSS)。這些遊戲中,光線追蹤效果均設為「高」,DLSS方面,考慮到畫質與幀數的綜合體驗,在2K解析度下,支援DLSS 2.0的均選擇為「平衡」模式,在4K解析度下,支援DLSS 2.0的均選擇為「效能」模式。

綜合6款光追遊戲的實際測試來看,4K解析度光線追蹤渲染下,RTX 3070 Ti綜合約相當於RTX 3080的79%的效能,相對於RTX 3070綜合領先9%,相對於RTX 2070 SUPER綜合領先57.8%。A卡由於光追效能較弱,在開啟光追之後成績普遍較為糟糕,在4K解析度光線追蹤渲染下,RTX 3070 Ti綜合領先RX 6800約26.3%,領先RX 6700 XT約67.5%,比領先上一代的RTX 2070 SUPER的幅度還大。

2K解析度光線追蹤渲染下,RTX 3070 Ti綜合約相當於RTX 3080的83.7%的效能,相對於RTX 3070綜合領先12.1%,相對於RTX 2070 SUPER綜合領先62%。綜合領先RX 6800約29%,領先RX 6700 XT約61.1%。

開啟DLSS之後的情況就不多說了,這項技術讓N卡的遊戲幀數可以完全拋離A卡,所以還是期待AMD類似的FidelityFX Super Resolution(FSR)早點能讓玩家應用上,儘管目前還不知道FSR對畫質的影響可否像DLSS 2.0這樣表現那麼好。

具體的RTX 3070 Ti在光追設定下的遊戲效能的話,跟傳統光柵化渲染下的情況差不多,2K解析度下藉助DLSS技術即使最新的光線追蹤大作也可以流暢運行,比如《看門狗:軍團》可以達到62幀。並且這個解析度下,面對更早一批的光追遊戲來說,不開DLSS也可以超過60幀流暢運行,比如《地鐵:離去(增強版)》可以達到67.51幀,《古墓麗影:暗影》可以達到80幀。

到了4K解析度下,面對著較為極致的遊戲設定,RTX 3070 Ti確實有些吃力,《看門狗:軍團》藉助DLSS勉強可以接近60幀,不過對面壓力稍低的遊戲,比如《地鐵:離去(增強版)》和《古墓麗影:暗影》,在藉助DLSS的支援下達到至少60幀還是沒問題的。

溫度測試:GDDR6X視訊記憶體「雖快但熱」

我們的GPU散熱測試均在裸機狀態(如果安裝在機箱內,GPU溫度會高出5℃左右)下進行測試,測試環境溫度約為25.7℃。待機溫度是開機以後記錄10分鐘,滿載溫度則是完成3DMark Time Spy壓力測試後記錄下,資料通過GPU-Z的Log to File功能記錄,以下為溫度測試曲線。

溫度測試發現RTX 3070 Ti是目前Ampere家族中最熱的一張卡了,滿載溫度將近82攝氏度。原因其實也很清晰,一方面是GDDR6X視訊記憶體的原因,另一方面就是散熱規模的原因,與其他搭載GDDR6X視訊記憶體的顯示卡相比,RTX 3070 Ti公版卡的散熱器規格縮水了太多,只能勉強夠用。

不過我對溫度這方面並不擔心,這情況正是各家非公版RTX 3070 Ti需要表現的時候了,相信非公方面是會在散熱規模上相比公版大幅升級來保證散熱的。

功耗測試:滿載功耗平均283W

通過我們專用的顯示卡功耗測試儀器,可以分別精確地測量顯示卡PCI-E、外接電源介面瓦特數,顯示卡最大功耗在3DMark Time Spy壓力測試中獲得,待機功耗則是在進入系統後記錄1分鐘取平均值。

經過測試,這張RTX 3070 Ti公版顯示卡待機功耗平均13W,滿載功耗平均283W,峰值到過302W,說起來這個功耗裡有相當大一部分是被GDDR6X視訊記憶體吃掉了,而這也是它非常熱的原因。搭配電源的話,公版卡的包裝上寫的是建議750W,但是我們還是建議850W起步會更好。

超頻效能測試

將功耗上限和溫度上限解鎖到最高之後,經過多番手動超頻嘗試,RTX 3070 Ti公版顯示卡最終在核心頻率+90MHz,GDDR6X視訊記憶體資料速率+2Gbps下完成超頻。這個狀態下,該卡能順利通過3DMark的FireStrike項目測試並且分數最高, 此時該卡的Boost頻率為1860MHz,視訊記憶體等效頻率為21Gbps。這張RTX 3070 Ti公版顯示卡在超頻狀態下運行3DMark FireStrike項目的GPU得分與默頻狀態下GPU得分的對比如下表所示。

同為GA104核心,RTX 3070 Ti的頻率比RTX 3070要高,可以認為已經被NVIDIA設定了較高的頻率,加上這張RTX 3070 Ti公版顯示卡的散熱也是幾乎到頂了,所以超頻的幅度更是有限,3DMark FireStrike項目36887分這個程度看起來差不多是RTX 3070 Ti的灰燼效能了,真的是把GA104核心榨的一滴不剩了。

總結:GDDR6X視訊記憶體加持,GA104核心火力全開

總的來說,雖然RTX 3070 Ti與RTX 3080的核心都具有6組GPC,但是由於GA104核心每個GPC單元包含的TPC單元相比GA102核心的少了40%,儘管RTX 3080的GA102-200核心的6組GPC有兩組還做了少量閹割,但是相比RTX 3070 Ti的GA104-400還是有巨大的規格差異,導致RTX 3070 Ti與RTX 3080的效能差距還是相當大的。

而RTX 3070 Ti與RTX 3070相比的話,雖然SM單元數量僅僅增加了2組,增幅不到5%,但是由於採用GDDR6X視訊記憶體之後視訊記憶體頻寬有巨大的提升,整體也有將近10%的效能提升,確實足夠劃分為新的一檔顯示卡。與上一代對位的RTX 2070 SUPER相比,將近50%的效能提升,在光追下提升還更大,對於換代的同級別產品,也算是相當不錯的表現。

顯示卡迷你天梯榜 (完整顯示卡天梯榜)

與A卡對比的話,兩家的風格差異非常明顯,這一代N卡全面採用RTX字首就表明了整體佈局是面向新世代的光追遊戲環境的,RTX 3070 Ti與幾乎同價位的RX 6800相比在光追遊戲環境下優勢明顯,領先高達27%,不過在傳統光柵化遊戲環境下則總體略輸RX 6800少許,不過這個幅度非常小,而且具體的遊戲互有勝負,結合價格來看的話,可以認為兩者這部分的表現差不多。而與對位相近的RX 6700 XT相比,RTX 3070 Ti則是全面領先,不過價格也高出有一定幅度。


IT145.com E-mail:sddin#qq.com