首頁 > 科技

映眾RTX 3080 Ti冰龍超級版評測 青春版RTX 3090

2021-06-07 12:32:02

GeForce RTX 3080 Ti已經於6月3日發售,不知道大家有沒有搶到,反正我是沒有……至於原因,首先看過公版評測的使用者大都瞭解其效能,幾乎和GeForce RTX 3090無異,同時首發價格也確實比較便宜。另外雖然新的GeForce RTX 3080 Ti限制了挖礦,但玩家的「空窗期」太久了,對於新卡的熱情一直很高漲。既然還是無卡可買,我們不妨貨比三家,看看各家的卡表現如何,今天我們評測的這款顯示卡是來自映眾的GeForce RTX 3080 Ti冰龍超級版。

在此我們順便來說說使用者比較關心的挖礦問題,在6月2日黃仁勳的遠端媒體見面會上提到,上個季度NVIDIA的CMP礦卡實現1.5億美元的收入,而本季度恐怕能達到4億美元左右。他認為CMP礦卡的出現是讓GeForce遊戲卡更多被遊戲使用者買到的好政策。

映眾GeForce RTX 3080 Ti 冰龍超級版

目前新的GeForce RTX 3080 Ti算力約為60MH/s,基本相當於未鎖算力的GeForce RTX 3070,但新卡的功耗更高價格更貴,如果以價效比來看,GeForceRTX 3080 Ti對於挖礦完全沒有競爭優勢,反而投資CMP礦卡更為合適。

另外除了下游的限制,政府也開始重點監管,在5月25日「挖礦重災區」內蒙古已經頒佈了八項措施嚴厲打擊挖礦,相關文章可以翻看我們之前的訊息,這裡不過多講解了:內蒙古八大措施禁止挖礦 警惕礦卡迴流。另外我們也有相關文章來教大家如何簡單鑑別礦卡:礦難來臨時礦卡能買麼? 警惕妹子自用顯示卡

雖然目前來看,GeForce RTX 3080 Ti本次供貨量依舊十分可憐,不過樂觀預計,半年左右顯示卡價格將會逐步回落。我們還是先來看本次評測的映眾GeForce RTX 3080 Ti冰龍超級版顯示卡,在測試開始前,筆者先將這款顯示卡的特點列出方便大家閱讀:

Boost頻率達到1710MHz,高於公版RGB燈箱效果意外的好三大一小的4風扇散熱總的來說,映眾GeForce RTX 3080 Ti 冰龍超級版在外觀上延續了該系列一貫風格,除了濃重的金屬氣息,兩種材質互相拼接,加上「鉚釘」點綴,整體極具質感。效能方面,GeForce RTX 3080 Ti除了與GeForce RTX 3090相差12GB視訊記憶體,在各方面幾乎都與之追評,而限制以太坊算力這一舉措,也讓真玩家有機會用上游戲卡,但目前來看全球的出貨量仍然堪憂,我們不妨繼續做等等黨。

01 旗艦核心GA102-225-A1

下面我們先來看看在架構上有哪些改動,官方白皮書上對比的物件為GeForce RTX 2080 Ti,相較於上一代的NVIDIA Turing架構,NVIDIA Ampere架構下的GeForce RTX 3080 Ti每個時鐘執行2次著色器運算,而Turing為1次,GeForce RTX 3080 Ti的著色器效能達到34 TFLOPS單精度效能,而Turing為14 TFLOPS。

第一代NVIDIA RTX架構 Turing下的RTX 2080 Ti

第二代NVIDIA RTX架構 Ampere下的RTX 3080 Ti

NVIDIA Ampere架構翻倍了光線與三角形的相交吞吐量,RT Core達到67 RT TFLOPS,而Turing為43 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是效能提升,還增加了對遊戲中運動模糊部分場景的光線追蹤計算加速。

第三代Tensor Core可自動識別並消除不太重要的DNN權重,處理稀疏網路的速率是Turing的兩倍,算力高達273 Tensor TFLOPS,而Turing為114 Tensor TFLOPS。

GeForce RTX 3080 Ti仍然採用了GA102核心,與GeForce RTX 3080/3090相同,下面我們來看一看GeForce RTX 3080 Ti在GA102中做了哪些改動。

完整的GA102核心

完整的GA102 GPU包含7個GPC(圖形處理叢集)42個TPC(紋理處理叢集)以及84個SM(流處理器)組成,而GeForce RTX 3080 Ti的CUDA數量是10240個,所以可以推斷GeForce RTX 3080 Ti遮蔽了兩組TPC,所以只有80個SM單元,而完整GA102核心的CUDA數量應該是10752個。

為了查詢方便,筆者將這幾款顯示卡的核心參數列出,可以看到GeForce RTX 3080 Ti與GeForce RTX 3090的核心參數非常接近。相差的兩個SM單元,也就是1組TPC,256個CUDA,其實在實際應用中來講差距並不是很大,最大差別是GeForce RTX 3090相比GeForce RTX 3080 Ti多了12GB的視訊記憶體;而相比RTX 3080來說提升就非常大了。

關於這張卡的定位,更多的還是旗艦遊戲,它從參數來看相比GeForce RTX 3080提升很多,非常接近GeForce RTX 3090,僅是視訊記憶體相差12GB,而大視訊記憶體對於軟體渲染來說又是至關重要的,正如GeForce RTX 3090在釋出之初的定位,就是專注於內容創作者。

渲染8K素材佔用了17GB視訊記憶體(點選檢視大圖)

如圖我們使用Keyshot9做測試,渲染8K或4K素材的視訊記憶體佔用率非常高,能達到17GB甚至更高,這對於只有12GB視訊記憶體的RTX 3080 Ti就完全不夠了,爆視訊記憶體的危害想必大家也知道,可以導致遊戲或軟體崩潰,從而程序丟失。

02 NVIDIA Ampere架構GA102解析

GeForce RTX 3080 Ti採用了GA102核心,擁有280億(28000 million)個電晶體,628平方毫米的面積,基於三星的8nm NVIDIA定製工藝,來自Micron的GDDR6X視訊記憶體。

本次NVIDIA Ampere架構的SM在Turing架構基礎上增加了一倍的FP32運算單元,這使得每個SM的FP32運算單元數量提高了一倍,同時吞吐量也就變為了一倍。

而通常我們計算顯示卡的CUDA數量,並不是把SM中的所有單元加起來計數,而是隻統計FP32單元的數量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變為 2:1。

GeForce RTX 3080 Ti共有10240個CUDA,其實它有5120個INT32單元,但由於內部的FP32數量翻了一倍,所以最終實現了10240的CUDA數量。

而這樣粗暴的提升CUDA數量對於遊戲其實有著非常大的幫助,通常在遊戲中浮點運算相比整數計算要常用的多,圖形、演算法以及各種計算操作中著色器工作負載通常需要混合使用FP32算數指令,而FP32的加速也有助於光線追蹤降噪著色器。

在去年與GeForce RTX 30系顯示卡一同釋出的還有一項新技術——RTX IO。目前很多遊戲動輒幾十G甚至百G的安裝空間,對於儲存空間的負擔暫且不提,但存放在硬碟中的資料,如果顯示卡想要讀取到,需要先由CPU從硬碟中讀取壓縮過的資料,經過解壓縮再發送到視訊記憶體中。

雖然隨著NVMe SSD的推出,讀取速度相較機械硬碟能夠快20倍,但受制於傳統I/O限制,NVMe高達7GB/秒的高速讀寫對於CPU是極大的負擔。

傳統的資料交換

在這個過程中,會佔用多個CPU核心,壓力急劇增大,佔用較多的記憶體,而此時其實GPU是處於閒置狀態的。RTX IO的作用就是越過CPU解壓再傳輸資料這一步,直接從PCIE匯流排讀取硬碟上經過壓縮的資料,並且完成無損GPU解壓,降低CPU佔用,變向提升了效能。

RTX IO可以極大解放CPU負擔

當然這項技術作為系統底層的運行方式改變,還需要藉助微軟釋出的DirectStorage來實現,對於目前容量的遊戲來說,RTX IO的改善效果有限,但假以時日等遊戲容量上百G成為常態的時候,這項技術將會發揮巨大的功效。

同時搭配新增的HDMI 2.1介面,可以支援單線8K的視訊輸出,而上一代HDMI 2.0僅支援4K 98Hz的視訊輸出,如果想要連線8K電視,則需要更多的線纜支援。

03 映眾GeForce RTX 3080 Ti 冰龍超級版外觀

GeForce RTX 3080 Ti 冰龍超級版延續了映眾一直以來的設計風格,不過其不同系列在細節上會有些許區別。

映眾GeForce RTX 3080 Ti 冰龍超級版表面採用了非常濃重的金屬風格,兩種材質互相拼接,加上「鉚釘」點綴,整體極具質感。

正面導流罩的主動散熱部分,映眾GeForce RTX 3080 Ti 冰龍超級版採用了三個11葉92mm風扇,內部ICHILLX4散熱器的主散熱模組使用的是7熱管超密擠壓直觸工藝,7根熱管與GPU核心完全貼合,可以快速帶走熱量;而為了同樣發熱量大的視訊記憶體及供電模組散熱,散熱器還加裝了一根熱管,用於連線視訊記憶體/供電的散熱模組與鰭片。

映眾GeForce RTX 3080 Ti 冰龍超級版上機效果

由於映眾GeForce RTX 3080 Ti 冰龍超級版顯示卡側面帶有大面積的RGB燈箱,上機點亮後的效果著實不錯。另外燈效還可以通過INNO3D TUNEIT軟體設定,同時還支援炫光同步功能。

映眾GeForce RTX 3080 Ti 冰龍超級版供電介面

側面的小風扇也是區別「冰龍超級版」和「冰龍版」的配置之一,它可以快速排出散熱鰭片中的熱空氣,為顯示卡起到立體散熱的效果。另外由於映眾GeForce RTX 3080 Ti 冰龍超級版的整體效能配置與GeForce RTX 3090相差無幾,所以功耗同樣在350W左右,供電介面為8+8pin的方案,建議搭配750W及以上電源。

映眾GeForce RTX 3080 Ti 冰龍超級版側面的金屬臂

由於這一代顯示卡的重量都較大,可以看到映眾GeForce RTX 3080 Ti 冰龍超級版自擋板側面延伸出「金屬臂」可以很好地為顯示卡起到支撐作用,即便沒有單獨的顯示卡支架也不至於壓彎PCB板,是非常簡單討巧的力學設計。

映眾GeForce RTX 3080 Ti 冰龍超級版背板展示

映眾GeForce RTX 3080 Ti 冰龍超級版的背板同樣做了非常全面的設計方案,可以看到晶片處的鏤空處理,同時大面積的凹凸設計,變向增加了背板晶片和視訊記憶體部位的表面積,方便發熱量高的元器件散熱。尾部的鏤空設計可讓散熱鰭片中的熱空氣快速排出。

映眾GeForce RTX 3080 Ti 冰龍超級版視訊輸出介面

視訊輸出介面依舊採用了DP1.4a*3+HDMI 2.1的四介面設計,另外由於新的HDMI 2.1協議,最高已可支援單線8K的視訊輸出。另外值得注意的是,映眾GeForce RTX 3080 Ti 冰龍超級版的視訊介面內採用了鍍金工藝處理,可以有效起到抗氧化穩定訊號傳輸的作用。

04 3DMARK 理論效能測試

首先介紹一下測試平臺,為了保證此次評測能夠發揮映眾GeForce RTX 3080 Ti冰龍超級版顯示卡的最佳效能,主機板和CPU採用了目前桌面旗艦級配置,具體如下。

在測試成績上,基準測試採用3DMARK,遊戲效能測試使用遊戲自帶Benchmark,同時為了減小誤差,每項測試成績均測試3遍取平均值。

GPU-Z參數

首先看一下GPU-Z的參數,映眾GeForce RTX 3080 Ti冰龍超級版採用GA102核心,三星8nm工藝,芯片面積628平方毫米,擁有10240個CUDA,Boost頻率達到1710MHz,而公版為1665MHz。採用12GB GDDR6X視訊記憶體,位寬為384bit,視訊記憶體頻寬達到了912.4 GB/s,光柵單元和紋理單元為112和320。

下面先進行的是用來衡量顯示卡DX11理論效能的3DMARK FS套裝:FS,FSE,FSU三者分別對應顯示卡在1080P、2K、4K的理論效能,取顯示卡分數實際測試結果如下(所有測試項均為一鍵超頻後1710MHz測試結果):

3D MARK FS套裝測試

在針對顯示卡DX11效能的3DMARK FS套裝測試中,我們選擇了上代和本代的4張顯示卡進行分值對比,以便能更好的反應映眾GeForce RTX 3080 Ti冰龍超級版的效能水平。

在該測試中可以發現三款顯示卡的分數基本難分伯仲,其中在2K/4K解析度下映眾GeForce RTX 3080 Ti冰龍超級版的分數甚至超越了GeForce RTX 3090公版的成績。

3D MARK TS套裝測試

而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,映眾GeForce RTX 3080 Ti冰龍超級版的分數略遜於GeForce RTX 3080 Ti的公版成績。對比GeForce RTX 3080的分數要高出6%左右;對比上一代GeForce RTX 2080 Ti的分數要高出41%左右。

3D MARK 光追測試

PortRoyal是3DMARK中專門針對光追效能的測試項,在這組測試中映眾GeForce RTX 3080 Ti冰龍超級版的分數基本與公版持平;對比GeForce RTX 3080的分數提升約為11%;對比上一代GeForce RTX 2080 Ti的分數提升則非常大,約為60%。

05 遊戲效能測試

在遊戲效能測試中,我們選擇了《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:英靈殿》、《無主之地》,國產遊戲《邊境》、《光明記憶:無限》的benchmark跑分軟體。

另外在遊戲測試中,由於顯示卡驅動的版本更新和遊戲更新非常影響遊戲幀數,所有benchmark跑分成績均以本次成績為準。

《刺客信條:英靈殿》遊戲測試

在《刺客信條:英靈殿》中映眾GeForce RTX 3080 Ti冰龍超級版的成績與理論測試中基本相符,會出現上下1幀的差距,但在遊戲中基本感受不到。同時GeForce RTX 3080的分數差距在1080P和2K解析度下也並不大,主要是4K解析度會有9%左右的差距。

《德軍總部新血脈》遊戲測試

《德軍總部新血脈》並且由於自帶兩個benchmark,所以我們的資料取跑分均值,另外這款遊戲幾乎每更新一次驅動或者遊戲版本升級都會導致分數的巨大差異,在本次重新測試中,映眾GeForce RTX 3080 Ti冰龍超級版基本與另外兩款同水平卡幀數相當,而相比GeForce RTX 3080的提升約為4%左右。

《孤島驚魂5》遊戲測試

《孤島驚魂5》同樣算是優化比較到位的3A大作,但在benchmark的幀數測試中經常會不穩定,在本次測試中映眾GeForce RTX 3080 Ti冰龍超級版與另外兩款同級別卡基本只有1幀的差距,另外在4K解析度下的成績領先GeForce RTX 3080較多,達到16%左右。

《無主之地3》遊戲測試

《無主之地3》是一款採用了卡通渲染風格的遊戲,它對於效能要求的下限很低而上限又很高,另外我們注意到,在本次測試中大部分遊戲1080P解析度的成績基本沒有差距,這也是因為如此高效能的GPU在1080P解析度下已經綽綽有餘,開始受制於CPU的效能。

《光明記憶:無限》遊戲測試

《光明記憶:無限》是由飛燕群島工作室開發的《光明記憶》新系列,目前還沒有遊戲提供試玩,不過benchmark的跑分軟體官方已經提供,玩家可以在steam上自行下載。另外我們在測試的時候由於無法關閉光追選項,故所有測試成績均為「RTX 最高/DLSS 質量」模式下進行。可以看到三款顯示卡的成績完全相同,在整體效能趨同的情況下,分數差距並不大。

《邊境》遊戲測試

在另外一款國產遊戲《邊境》的跑分軟體中,情況基本與《光明記憶:無限》相同,測試條件均在「RTX最高/DLSS質量」下進行。

06 功耗及溫度測試

功耗測試中,我們選擇FurMark軟體進行拷機測試,並採用GPU-Z檢測溫度,功耗僅計算顯示卡自身。

功耗測試(點選檢視大圖)

映眾GeForce RTX 3080 Ti 冰龍超級版經過我們的實測在滿載狀態下單卡功耗為350W左右,滿載頻率為1860MHz左右,在整體效能與GeForce RTX 3090相仿的情況下,建議搭配750W及以上電源。

溫度方面,本次映眾GeForce RTX 3080 Ti 冰龍超級版經過15分鐘左右的拷機,溫度穩定為70℃左右,視訊記憶體溫度略高為88℃左右。在更高頻率的情況下比GeForce RTX 3080 Ti低了5℃左右。

07 部分遊戲光追及DLSS效果展示

上面我們測試了部分遊戲的光追和DLSS效能表現,這些效果具體在遊戲中是什麼表現,下邊筆者選擇了兩款遊戲給大家展示一下。

《賽博朋克2077》RTX ON(點選檢視大圖)

《賽博朋克2077》RTX OFF(點選檢視大圖)

在《賽博朋克2077》中,光追效果隨處可見,而在遊戲中也運用到了不同的光追效果,包括最常見的光追反射、陰影,還有環境光遮蔽、漫反射照明以及全局光照等比較高階的效果。

RTX ON(點選圖片檢視大圖)

RTX OFF(點選圖片檢視大圖)

在網遊《逆水寒》中,由於光追效果正處於試驗階段,並沒有如宣傳片一樣的水面反射。但畫面整體的陰影更加真實,如頭頂樹木的陰影,以及水面上荷葉的效果。而且由於光追效果較少,在開啟該功能後幀數並沒有明顯下降。

《堡壘之夜》RTX ON(點選檢視大圖)

《堡壘之夜》RTX OFF(點選檢視大圖)

堡壘之夜的光追效果還是比較明顯的,其中加入了反射、全局照明和路徑追蹤等效果。卡車車身上的反射較為明顯,角色身上的環境光在開啟光追後更為寫實,另外仔細看的話遠處建築物的玻璃同樣有光線的反射,整體畫質改善非常明顯。

《魔獸世界9.0》RTX ON(點選檢視大圖)

《魔獸世界9.0》RTX OFF(點選檢視大圖)

《魔獸世界9.0》同樣作為一款卡通渲染的網遊來說,魔獸的年代更加久遠,此次加入光追效果在整體視覺上沒有堡壘之夜明顯。不過如遠處的樹木陰影,以及近處石臺下方的陰影都比較明顯。

《控制》RTX ON(點選檢視大圖)

《控制》RTX OFF(點選檢視大圖)

《控制》這款遊戲所採用的引擎物理效果非常出色,同時光追開關的對比也是肉眼可見的明顯。包括玻璃上的人物反光,遠處地面的植物反光都比較清晰,同時開啟光追後屋頂處的明暗對比也更加明顯。

《賽博朋克2077》DLSS模式對比

DLSS的對比測試我們選擇《賽博朋克2077》這款遊戲,2K/RTX ON/DLSS關閉 原生畫質下作為標準,在開啟DLSS質量模式後可以看到整體畫面幾乎沒有任何變化,廣告牌的字樣邊緣依然很清晰。在DLSS平衡和DLSS效能模式中依然有著不錯的狀態,整體相較原生畫質並無二致。

《逆水寒》DLSS模式對比

畫質說明

在《逆水寒》的DLSS測試中,我們將畫面設定為4K解析度,畫質為預設最高。通過關閉、快速、超級效能,3種不同模式來進行幀數以及畫面的對比。

首先在關閉DLSS中,遊戲幀數為26幀原生畫質,開啟DLSS快速模式後為41幀,而開啟DLSS超級效能模式後為57幀。通過放大圖片不難發現原生畫質和DLSS快速模式的區別很小,而DLSS超級效能模式中角色背後的裝飾會變模糊,以及木條箱的紋理邊界會有較明顯變化。但幀數提升卻非常明顯。

08 軟硬兼施 鑄就Ampere

好的硬體沒有軟體的加持,相當於空有長柄沒有槍頭,想要發揮十成威力則必須軟硬搭配,反之亦然。此次隨著釋出會共同推出的還有以下幾項非常值得大家關注。

NVIDIA Reflex

以往我們關注延遲大多從顯示器上了解到幾毫秒極速響應,但那只是作為最終端的顯示輸出效果,你是否想過從系統內部到實際看到的畫面有多大延遲?

NVIDIA Reflex

在20系顯示卡中NVIDIA反覆提及的「幀能贏」,在30系顯示卡中也做了更進一步的突破,除了NVIDIA將推出自己的電競顯示器NVIDIA 360Hz G-SYNC ESPORTS,還有NVIDIA Reflex技術。

以往如果想測量系統延遲需要高速相機以及定製的LED滑鼠電路。而使用帶有NVIDIA Reflex技術的顯示器將內建精確的延遲分析工具,可在CPU和GPU中優化渲染管道,極大減少延遲時間,將系統延遲整體降低至30ms以下。不過就像圖中所示,為此你需要一個支援反射延遲分析的滑鼠。

NVIDIA Broadcast

NVIDIA Broadcast是一款易用且專業的直播軟體,它的強大之處就在於主播不再需要任何的背景佈置,只需要一個普通的攝像頭和一張GeForce RTX系列的顯示卡即可。

寵物派對直播

這款軟體可以讓你雜亂無章的房間立即變成直播間,其內建了音訊降噪、背景虛化、虛擬背景、頭部追蹤等功能。NVIDIA Broadcast的工作原理是利用AI演算法通過DGX超級計算機深度學習而來。

NVENC編碼

同時RTX 30系顯示卡擁有目前最好的硬體解碼器,大部分使用者的電腦在直播時開啟OBS推流後CPU佔用會直接飆升到50%左右,而基於GPU的NVENC解碼可以極大地減輕CPU負擔。

NVIDIA Studio

對於內容創作者來說,提到軟體可能大部分只會想到內容創作的相關軟體,但NVIDIA專為內容創作者推出的NVIDIA Studio驅動則是承擔著連線創作軟體和顯示卡功能的關鍵。

NVIDIA Studio

NVIDIA Studio驅動經過更新與優化,對於最新版本的Adobe系列軟體支援更為穩定,同時附帶更出彩的創作功能。利用NVIDIA CUDA技術,GPU加速特效可實現更快的實時視訊編輯並加速渲染輸出,並讓原本只能進行軟體編碼輸出的視訊輕鬆得到硬體的支援。另外在AI計算方面的優勢,包括自動標記片段、特效追蹤和人臉識別等功能,都有顯著的速度提升。

以GPU渲染為14.98秒 而CPU渲染為11分鐘

當然NVIDIA Studio的加速創作絕不止Adobe一家,DaVinci、Keyshot、Blender、D5等專業軟體中都有非常亮眼的表現。不僅能提供強大且穩定的運行環境,更能以GPU加速,有效提升創作效率。

09 青春版RTX 3090

GeForce RTX 30系最強遊戲卡誕生了,雖然本代產品有90型號,但其實GeForce RTX 3090從規格上來看完全就是前一代的TITAN,只是不知道NVIDIA為何會將這個型號歸結為常規型號顯示卡中,也一直讓大家誤認為3090是遊戲卡。

映眾GeForce RTX 3080 Ti冰龍超級版

我們先來說外觀,映眾GeForce RTX 3080 Ti 冰龍超級版延續了映眾一直以來的設計風格,從側面擋板部位延伸出的的「金屬臂」可以很好地為顯示卡起到支撐作用,即便沒有單獨的顯示卡支架也不至於壓彎PCB板,是個非常簡單討巧的力學設計。而側面小風扇也可以輔助散熱鰭片內的熱風快速排出,便於散熱。

在效能上,映眾GeForce RTX 3080 Ti 冰龍超級版基本介於公版GeForce RTX 3080 Ti和GeForce RTX 3090之間,偶爾會有成績浮動,整體效能來說基本可以在4K解析度下,完美駕馭目前市面上絕大部分3A遊戲大作。

而GeForce RTX 3080 Ti這款顯示卡個人覺得,雖然定位於旗艦遊戲,不過綜合實力和GeForce RTX 3090相差無幾,基本只是現存之間的差距。如果你不是要求極致地渲染4K或8K素材,日常的專業軟體使用也是完全沒有問題的。

最後價格方面,由於本次GeForce RTX 3080 Ti的供貨量依然非常有限,映眾官方也還沒有放出購買連結,興許在618會攢夠一波卡放出,我們也會持續關注。


IT145.com E-mail:sddin#qq.com