首頁 > 科技

來自未來的武器大師 影馳 GeForce RTX 3070 Ti黑將 OC評測

2021-06-24 16:34:01

等等黨終於不用再等了!就在最近幾日們終於迎來了GeForce RTX 3070 Ti的釋出。至此,GeForce RTX 30系遊戲卡「Ti家族」的成員全部補齊,也讓還在苦等顯示卡的玩家有了更多的選擇,今天給大家帶來的就是影馳 GeForce RTX 3070 Ti黑將 OC的顯示卡評測。

一說到「將」系列,大家肯定不會陌生,多年以來影馳「將」系列憑藉出色的價效比以及硬朗的外觀,一直是影馳銷量最好的系列。在評測開始之前,相比大家對這款顯示卡也是有許多期待。按照國際慣例,讓我們先來總結一下這款顯示卡的幾個核心亮點:

1.造型採用槍械元素,側面有彈孔裝飾,尾部有槍托結構,頂部RGB logo燈,外觀拉風。

2.11片三折靜霜扇葉,背板幾何鏤空加魚尾型散熱孔設計,提供貫穿式風流,強效散熱。

3.8+8pin供電介面,強力穩定供電。

影馳 GeForce RTX 3070 Ti黑將 OC

新推出的GeForce RTX 3070 Ti與GeForce RTX 3080 Ti分別為4499元起和8999元起,儘管消費者可能無法以這樣的價格購買到公版顯示卡,但是非公顯示卡的大量鋪貨也填補了市場上如今一卡難求的空白,當然這其中也包括了我手上的這塊影馳 GeForce RTX 3070 Ti黑將 OC。從本質上講顯示卡降價也只是時間問題。

影馳 GeForce RTX 3070 Ti黑將 OC

市場價格過高還是要從讓玩家苦惱的「挖礦潮」說起,不過根據NVIDIA此前的官方部落格說明,這批顯示卡已經限制了以太坊的算力。另外GeForce RTX 3070 Ti這一批的非公版顯示卡,在包裝上不會有任何限制算力的標註,「Lite Hash Rate」或者「LHR」的說明只針對已經發售的顯示卡,後續為了方便區分才會在包裝上進行標註。

也就是說算力的限制能讓礦工不再那麼急於入手,玩家們也有機會買到自己心儀已久的顯示卡,值得說明的一點是,顯示卡在進行雜湊演算法的時候顯示卡就會自動降低視訊記憶體頻率來鎖住算力。對於遊戲玩家來說,玩遊戲是不會受到影響的,所以不需要有擔心。

01 GeForce RTX 3070 Ti GA104核心的第二張顯示卡

在核心架構上,GeForce RTX 3070 Ti是採用GA104核心的第二張卡,官方白皮書上對比的物件為GeForce RTX 2070 SUPER,相較於上一代的NVIDIA Turing架構,NVIDIA Ampere架構下的GeForce RTX 3070 Ti每個時鐘執行2次著色器運算,而Turing為1次,RTX 3070 Ti的著色器效能達到22 TFLOPS單精度效能,而Turing為9 TFLOPS。

RTX 3070 Ti 新老兩代顯示卡算力對比

NVIDIA Ampere架構翻倍了光線與三角形的相交吞吐量,RT Core達到42 RT TFLOPS,而Turing為24 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是效能提升,還增加了對遊戲中運動模糊部分場景的光線追蹤計算加速。

第三代Tensor Core可自動識別並消除不太重要的DNN權重,處理稀疏網路的速率是Turing的兩倍,算力高達174 Tensor TFLOPS,而Turing為72 Tensor TFLOPS。

GeForce RTX 3070 Ti採用了GA104核心,與GeForce RTX 3070相同,不過NVIDIA官方並沒有給出GA104核心架構圖,我們仍以GA102來做講解。

完整的GA102核心

完整的GA102 GPU包含7個GPC(圖形處理叢集)42個TPC(紋理處理叢集)以及84個SM(流處理器)組成,而GeForce RTX 3070 Ti的CUDA數量是6144個,共有48個SM單元,也就是3個GPC 24個TPC,而剛剛釋出的GeForce RTX 3080 Ti共有40個TPC 80個SM單元,這也是兩款晶片的差距所在。

公版顯示卡參數表

為了查詢方便,筆者將這幾款顯示卡的核心參數列出,可以看到GeForce RTX 3070與GeForce RTX 3070 Ti的差距不大,相差的兩個SM單元,和剛剛釋出的GeForce RTX 3080 Ti情況基本相同,也就是1組TPC,256個CUDA。只不過GeForce RTX 3080 Ti更接近GeForce RTX 3090,而根據參數來看GeForce RTX 3070 Ti與GeForce RTX 3080還有一定差距。

GDDR6X

另外GeForce RTX 3070 Ti的視訊記憶體雖然依舊是8GB,但已經由GDDR6更換為GDDR6X,兩者的區別主要在於頻率和頻寬上,同頻下實現更高的視訊記憶體頻寬可以降低成本和功耗,另外在相同時間內GDDR6X可以比GDDR6傳輸多2倍的資料。這對於需要大量資料負載的工作尤為重要,如光線追蹤的遊戲、AI學習和8K視訊渲染。

02 NVIDIA Ampere架構GA104解析

影馳 GeForce RTX 3070 Ti黑將 OC採用了GA104核心,擁有174億(17400 million)個電晶體,392平方毫米的面積,基於三星的8nm NVIDIA定製工藝,來自Micron的GDDR6X視訊記憶體,這裡與GeForce RTX 3070的GDDR6有所區別。

本次NVIDIA Ampere的SM在Turing基礎上增加了一倍的FP32運算單元,這使得每個SM的FP32運算單元數量提高了一倍,同時吞吐量也就變為了一倍。

而通常我們計算顯示卡的CUDA數量,並不是把SM中的所有單元加起來計數,而是隻統計FP32單元的數量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變為 2:1。

GeForce RTX 3070 Ti共有6144個CUDA,其實它有3072個INT32單元,但由於內部的FP32數量翻了一倍,所以最終實現了6144的CUDA數量。

而這樣粗暴的提升CUDA數量對於遊戲其實有著非常大的幫助,通常在遊戲中浮點運算相比整數計算要常用的多,圖形、演算法以及各種計算操作中著色器工作負載通常需要混合使用FP32算數指令,而FP32的加速也有助於光線追蹤降噪著色器。

在去年與GeForce RTX 30系顯示卡一同釋出的還有一項新技術——RTX IO。目前很多遊戲動輒幾十G甚至百G的安裝空間,對於儲存空間的負擔暫且不提,但存放在硬碟中的資料,如果顯示卡想要讀取到,需要先由CPU從硬碟中讀取壓縮過的資料,經過解壓縮再發送到視訊記憶體中。

雖然隨著NVMe SSD的推出,讀取速度相較機械硬碟能夠快20倍,但受制於傳統I/O限制,NVMe高達7GB/秒的高速讀寫對於CPU是極大的負擔。

傳統的資料交換

在這個過程中,會佔用多個CPU核心,壓力急劇增大,佔用較多的記憶體,而此時其實GPU是處於閒置狀態的。RTX IO的作用就是越過CPU解壓再傳輸資料這一步,直接從PCIE匯流排讀取硬碟上經過壓縮的資料,並且完成無損GPU解壓,降低CPU佔用,變向提升了效能。

RTX IO可以極大解放CPU負擔

當然這項技術作為系統底層的運行方式改變,還需要藉助微軟釋出的DirectStorage來實現,對於目前容量的遊戲來說,RTX IO的改善效果有限,但假以時日等遊戲容量上百G成為常態的時候,這項技術將會發揮巨大的功效。

同時搭配新增的HDMI 2.1介面,可以支援單線8K的視訊輸出,而上一代HDMI 2.0僅支援4K 98Hz的視訊輸出,如果想要連線8K電視,則需要更多的線纜支援。

03 影馳 GeForce RTX 3070 Ti黑將 OC外觀

影馳上一代的將系列卡身以黑色為主,工業風格更明顯,而這次的影馳 GeForce RTX 3070 Ti黑將 OC顯示卡在外觀方面做了全面改版,顯示卡導流罩採用香檳色和黑色搭配,表面採用金屬拉絲工藝。並且表面點綴了槍支元素,更符合黑將的身份。

影馳 GeForce RTX 3070 Ti黑將 OC

影馳 GeForce RTX 3070 Ti黑將 OC顯示卡在尺寸上也有明顯的增大,將會佔用3槽空間。不過考慮到機箱相容性的問題,影馳 GeForce RTX 3070 Ti黑將 OC在包裝內還附贈了一個2槽介面的擋板可供替換,玩家可按需更換。

影馳 GeForce RTX 3070 Ti黑將 OC散熱

影馳 GeForce RTX 3070 Ti黑將 OC在風扇方面的改版也尤其明顯,新的顯示卡採用3個90mm的特殊風扇,每個風扇有11片三摺扇葉,加大空氣流通量,增強散熱。

影馳 GeForce RTX 3070 Ti黑將 OC

影馳 GeForce RTX 3070 Ti黑將 OC的顯示卡尾部有可發光的LOGO設計,也算是為整個金屬質感增添了些許的活力。

影馳 GeForce RTX 3070 Ti黑將 OC背板

影馳 GeForce RTX 3070 Ti黑將 OC顯示卡的背板十分有科技感,我們能在其中發現很多科技元素的線條。四個圓孔型的散熱孔可以有效的為顯示卡晶片燃熱。

鏤空散熱處理

影馳 GeForce RTX 3070 Ti黑將 OC這次將前端設計了大面積的鏤空處理,正面的風扇直接吸入冷氣吹過散熱鰭片,將熱氣流排出,更加又利於使用過程中的顯示卡效能穩定。

彈孔槍頭

值得一提的是,影馳 GeForce RTX 3070 Ti黑將 OC顯示卡頂部有4個槍口設計,有一種像是未來武器的科技感,讓顯示卡整體更加具有個性。

影馳 GeForce RTX 3070 Ti黑將 OC介面

在供電介面方面,影馳 GeForce RTX 3070 Ti黑將 OC採用8+8pin的供電,沒有采用公版的單12pin,對於使用者來說不用做任何前期準備就能用上最新的顯示卡了(不過要注意電源功率,建議600W及以上)。

04 3DMARK 理論效能測試

首先介紹一下測試平臺,為了保證此次評測能夠發揮影馳 GeForce RTX 3070 Ti黑將 OC顯示卡的最佳效能,主機板和CPU採用了目前桌面旗艦級配置,具體如下。

在測試成績上,基準測試採用3DMARK,遊戲效能測試使用遊戲自帶Benchmark,同時為了減小誤差,每項測試成績均測試3遍取平均值。

GPU-Z參數

首先看一下GPU-Z的參數,影馳 GeForce RTX 3070 Ti黑將 OC採用GA104核心,三星8nm工藝,芯片面積392平方毫米,擁有6144個CUDA,Boost頻率為1800MHz,而公版為1770MHz頻率。採用8GB GDDR6X視訊記憶體,位寬為256bit,視訊記憶體頻寬達到了608.3 GB/s,光柵單元和紋理單元為96和192。

下面先進行的是用來衡量顯示卡DX11理論效能的3DMARK FS套裝:FS,FSE,FSU三者分別對應顯示卡在1080P、2K、4K的理論效能,取顯示卡分數實際測試結果如下:

3D MARK FS套裝測試

在針對顯示卡DX11效能的3DMARK FS套裝測試中,我們選擇了上代和本代的5張顯示卡進行分值對比,以便能更好的反映影馳 GeForce RTX 3070 Ti黑將 OC的效能水平。

可以看到影馳 GeForce RTX 3070 Ti黑將 OC的效能顯然更接近GeForce RTX 3070,整體提升11%左右;對比GeForce RTX 3080的差距為17%左右,看來即使強如GeForce RTX 3070 Ti,可仍然和GeForce RTX 3080有一定差距。

3D MARK TS套裝測試

而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,影馳 GeForce RTX 3070 Ti黑將 OC的分數提升稍弱,相比GeForce RTX 3070提升8%左右,對比公版提升則不是很大,基本在百分之1以內,可見GeForce RTX 3070Ti公版的做工和散熱都相當不錯。而這次對比GeForce RTX 3080的分數差距為21%左右;對比上一代GeForce RTX 2070 SUPER的分數要高出43%左右。

3D MARK 光追測試

PortRoyal是3DMARK中專門針對光追效能的測試項,在這組測試中影馳 GeForce RTX 3070 Ti黑將 OC的分數表現更貼近GeForce RTX 3070,分數提升為8%左右,相比公版基本也是在百分之一以內;對比GeForce RTX 3080的分數差距為29%左右;對比上一代GeForce RTX 2070 SUPER的分數提升則非常大,約為52%。GeForce RTX 3070比上代產品已經有了相當大的效能提升。

05 遊戲效能測試

在遊戲效能測試中,我們選擇了《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:英靈殿》、《無主之地》,國產遊戲《邊境》、《光明記憶:無限》的benchmark跑分軟體。

另外在遊戲測試中,由於顯示卡驅動的版本更新和遊戲更新非常影響遊戲幀數,所有benchmark跑分成績均以本次成績為準。

《刺客信條:英靈殿》遊戲測試

在遊戲實測中可以看到影馳 GeForce RTX 3070 Ti黑將 OC和GeForce RTX 3070的幀數差距平均下來為3%左右。而對比GeForce RTX 3080的分數差距整體在10%左右。

《德軍總部新血脈》遊戲測試

《德軍總部新血脈》並且由於自帶兩個benchmark,所以我們的資料取跑分均值,另外這款遊戲幾乎每更新一次驅動或者遊戲版本升級都會導致分數的巨大差異,在本次重新測試中,影馳 GeForce RTX 3070 Ti黑將 OC與GeForce RTX 3070的差距約為4%。

而相比GeForce RTX 3080的幀數差距綜合為13%左右,但可以發現其實在1080P解析度下,CPU已經限制了顯示卡的發揮,而在4K解析度下GeForce RTX 3080能領先影馳 GeForce RTX 3070 Ti黑將 OC約22%的幀數。

《孤島驚魂5》遊戲測試

《孤島驚魂5》同樣算是優化比較到位的3A大作,在這款遊戲中CPU的瓶頸更加明顯,1080P解析度下三款顯示卡的成績幾乎相同,在2K和4K解析度下比較能反應真實水平,影馳 GeForce RTX 3070 Ti黑將 OC相比GeForce RTX 3070提升約為8%。

《無主之地3》遊戲測試

《無主之地3》是一款採用了卡通渲染風格的遊戲,它對於效能要求的下限很低而上限又很高,並且這款遊戲的跑分也很符合三款顯示卡的效能規律,其中影馳 GeForce RTX 3070 Ti黑將 OC相比GeForce RTX 3070提升為7%;相比GeForce RTX 3080的分數差距為24%。

《光明記憶:無限》遊戲測試

《光明記憶:無限》是由飛燕群島工作室開發的《光明記憶》新系列,目前還沒有遊戲提供試玩,不過benchmark的跑分軟體官方已經提供,玩家可以在steam上自行下載。另外我們在測試的時候由於無法關閉光追選項,故所有測試成績均為「RTX 最高/DLSS 質量」模式下進行。整體的分數分佈情況與《無主之地3》非常相似。

《邊境》遊戲測試

在另外一款國產遊戲《邊境》的跑分軟體中,情況基本與《光明記憶:無限》相同,測試條件均在「RTX最高/DLSS質量」下進行。

06 功耗及溫度測試

功耗測試中,我們選擇FurMark軟體進行拷機測試,並採用GPU-Z檢測溫度,功耗僅計算顯示卡自身。

功耗測試

影馳 GeForce RTX 3070 Ti黑將 OC經過我們的實測在滿載狀態下單卡功耗為300W左右,建議搭配650W及以上電源。

溫度對比

溫度方面,本次的影馳 GeForce RTX 3070 Ti黑將 OC經過15分鐘左右的拷機,溫度穩定為72℃左右,相比公版低了6℃左右,看來三風扇加魚尾型散熱孔還是發揮了一定的作用。

07 部分遊戲光追及DLSS效果展示

上面我們測試了部分遊戲的光追和DLSS效能表現,這些效果具體在遊戲中是什麼表現,下邊筆者選擇了幾款遊戲給大家展示一下。

RTX ON(點選圖片檢視大圖)

RTX OFF(點選圖片檢視大圖)

在《賽博朋克2077》中,光追效果隨處可見,而在遊戲中也運用到了不同的光追效果,包括最常見的光追反射、陰影,還有環境光遮蔽、漫反射照明以及全局光照等比較高階的效果。在上圖中同樣有複雜的光線追蹤效果,近處的霓虹燈管有明顯的漫反射效果,通過牆壁的反射,整體光線更強。可以看到地面和右側的牆壁在開啟光線追蹤時能反射出門框和燈管的倒影,而關閉時就只有燈光了。

RTX ON

RTX OFF

在網遊《逆水寒》中,由於光追效果正處於試驗階段,並沒有如宣傳片一樣的水面反射。但畫面整體的陰影更加真實,如頭頂樹木的陰影,以及水面上荷葉的效果。而且由於光追效果較少,在開啟該功能後幀數並沒有明顯下降。

《堡壘之夜》RTX ON

《堡壘之夜》RTX OFF

堡壘之夜的光追效果還是比較明顯的,其中加入了反射、全局照明和路徑追蹤等效果。卡車車身上的反射較為明顯,角色身上的環境光在開啟光追後更為寫實,另外仔細看的話遠處建築物的玻璃同樣有光線的反射,整體畫質改善非常明顯。

《魔獸世界9.0》RTX ON(點選檢視大圖)

《魔獸世界9.0》RTX OFF(點選檢視大圖)

《魔獸世界9.0》同樣作為一款卡通渲染的網遊來說,魔獸的年代更加久遠,此次加入光追效果在整體視覺上沒有堡壘之夜明顯。不過如遠處的樹木陰影,以及近處石臺下方的陰影都比較明顯。

《控制》RTX ON

《控制》RTX OFF

《控制》這款遊戲所採用的引擎物理效果非常出色,同時光追開關的對比也是肉眼可見的明顯。包括玻璃上的人物反光,遠處地面的植物反光都比較清晰,同時開啟光追後屋頂處的明暗對比也更加明顯。

DLSS模式對比

DLSS的對比測試我們選擇《賽博朋克2077》這款遊戲,2K/RTX ON/DLSS關閉 原生畫質下作為標準,在開啟DLSS質量模式後可以看到整體畫面幾乎沒有任何變化,廣告牌的字樣邊緣依然很清晰。在DLSS平衡和DLSS效能模式中依然有著不錯的狀態,整體相較原生畫質並無二致。

《逆水寒》DLSS模式對比

畫質說明

在《逆水寒》的DLSS測試中,我們將畫面設定為4K解析度,畫質為預設最高。通過關閉、快速、超級效能,3種不同模式來進行幀數以及畫面的對比。

首先在關閉DLSS中,遊戲幀數為26幀原生畫質,開啟DLSS快速模式後為41幀,而開啟DLSS超級效能模式後為57幀。通過放大圖片不難發現原生畫質和DLSS快速模式的區別很小,而DLSS超級效能模式中角色背後的裝飾會變模糊,以及木條箱的紋理邊界會有較明顯變化。但幀數提升卻非常明顯。

08 軟硬兼施 鑄就Ampere

好的硬體沒有軟體的加持,相當於空有長柄沒有槍頭,想要發揮十成威力則必須軟硬搭配,反之亦然。此次隨著釋出會共同推出的還有以下幾項非常值得大家關注。

NVIDIA Reflex

以往我們關注延遲大多從顯示器上了解到幾毫秒極速響應,但那只是作為最終端的顯示輸出效果,你是否想過從系統內部到實際看到的畫面有多大延遲?

NVIDIA Reflex

在20系顯示卡中NVIDIA反覆提及的「幀能贏」,在30系顯示卡中也做了更進一步的突破,除了NVIDIA將推出自己的電競顯示器NVIDIA 360Hz G-SYNC ESPORTS,還有NVIDIA Reflex技術。

以往如果想測量系統延遲需要高速相機以及定製的LED滑鼠電路。而使用帶有NVIDIA Reflex技術的顯示器將內建精確的延遲分析工具,可在CPU和GPU中優化渲染管道,極大減少延遲時間,將系統延遲整體降低至30ms以下。不過就像圖中所示,為此你需要一個支援反射延遲分析的滑鼠。

NVIDIA Broadcast

NVIDIA Broadcast是一款易用且專業的直播軟體,它的強大之處就在於主播不再需要任何的背景佈置,只需要一個普通的攝像頭和一張GeForce RTX系列的顯示卡即可。

寵物派對直播

這款軟體可以讓你雜亂無章的房間立即變成直播間,其內建了音訊降噪、背景虛化、虛擬背景、頭部追蹤等功能。NVIDIA Broadcast的工作原理是利用AI演算法通過DGX超級計算機深度學習而來。

NVENC編碼

同時RTX 30系顯示卡擁有目前最好的硬體解碼器,大部分使用者的電腦在直播時開啟OBS推流後CPU佔用會直接飆升到50%左右,而基於GPU的NVENC解碼可以極大地減輕CPU負擔。

NVIDIA Studio

對於內容創作者來說,提到軟體可能大部分只會想到內容創作的相關軟體,但NVIDIA專為內容創作者推出的NVIDIA Studio驅動則是承擔著連線創作軟體和顯示卡功能的關鍵。

NVIDIA Studio

NVIDIA Studio驅動經過更新與優化,對於最新版本的Adobe系列軟體支援更為穩定,同時附帶更出彩的創作功能。利用NVIDIA CUDA技術,GPU加速特效可實現更快的實時視訊編輯並加速渲染輸出,並讓原本只能進行軟體編碼輸出的視訊輕鬆得到硬體的支援。另外在AI計算方面的優勢,包括自動標記片段、特效追蹤和人臉識別等功能,都有顯著的速度提升。

以GPU渲染為14.98秒 而CPU渲染為11分鐘

當然NVIDIA Studio的加速創作絕不止Adobe一家,DaVinci、Keyshot、Blender、D5等專業軟體中都有非常亮眼的表現。不僅能提供強大且穩定的運行環境,更能以GPU加速,有效提升創作效率。

09 金屬撞色 漆黑槍王

「金屬撞色 漆黑槍王」,影馳 GeForce RTX 3070 Ti黑將 OC在外觀添加了槍支元素,並且導流罩點綴彈孔、槍托等元素,戰爭氣息十足。正面金屬的拼色設計,也讓整張顯示卡更加有質感,配合獨到的外觀設計,宛如一把來自未來的科技武器。

影馳 GeForce RTX 3070 Ti黑將 OC

背面金屬背板不僅增加整體的質感,配合尾部的魚尾型散熱孔,能夠輸送貫穿式風流,為顯示卡充分散熱。另外很多人擔心金屬外觀背板會增加顯示卡的重量,實際上影馳 GeForce RTX 3070 Ti黑將 OC採用一體式金屬壓鑄加固中框設計,可讓散熱器直接鎖固在機箱上並由機箱承重,可以預防PCB因過重彎曲變形,所以沒有必要一直使用顯示卡豎裝模組。

影馳 GeForce RTX 3070 Ti黑將 OC

外觀出眾,個性十足。配合GeForce RTX 3070 Ti的優秀效能,影馳 GeForce RTX 3070 Ti黑將 OC的確能給玩家帶來不少的驚喜。至於玩家們一直擔心的售價問題,隨著晶片產能的增長和對算力的限制,相信不久以後大家都能以親民的價格入手30系顯示卡,改善遊戲體驗指日可待。


IT145.com E-mail:sddin#qq.com