首頁 > 硬體

RTX 3080跨時空PK十年旗艦:完虐2080 Ti 效能是GTX 480的16倍!

2020-10-16 14:00:39

看過我們之前十年旗艦N卡橫評(點選這裡可以跳轉)的朋友,可能都會感慨半導體行業的神速發展,從GTX 480到RTX 2080 Ti,效能提升到了1298%!

也有朋友吐槽RTX 20對比GTX 10提升不大,但是,在老黃髮布RTX 30後,那價格,那效能,真香!


NVIDIA GeForce RTX 3080

同時這也引發了圈內一大波的連鎖效應,RTX 2080 Ti二手價格一夜腰斬,相關的段子和弔圖也鋪得滿天都是,不過關於RTX 3080的評測相信大家已經看過不少,今天我們就帶來更為直觀的RTX 3080評測視訊。

視訊不僅有3080的全面測試,還有對比十年前GTX480等特別的專案,大家耐心看就知道啦。

當然了假如你不喜歡看視訊,或者流量捉雞,我們也有文字版本~

NVIDIA Ampere架構解析- CUDA流處理器翻倍提升的祕密

有的朋友可能想到了,那麼電晶體翻倍是不是就是流處理器翻倍的原因呢?你答對了一點點,電晶體暴增讓GA102核心擁有84組SM計算單元,比上一代的TU102多了12組,但我們這次評測的3080和2080 Ti SM單元一樣僅有72組,但CUDA核心數目還是翻倍了

根本原因是這次老黃改變了N卡流處理器的運算模式。

想搞清楚這點我們首先要知道顯示卡運算一般分為整數運算(Integer)和浮點運算(floating point)兩種,而浮點運算可以分為半精度(FP16)、單精度(FP32)、雙精度(FP64),整數運算也可以這樣劃分。

與遊戲最密切相關的就是FP32運算,其次是INT32,從費米架構以來NV就把顯示卡專門做FP32的運算單元叫做CUDA核心,因此以往我們可以根據CUDA核心的數量來比較N卡效能,但是做其他運算的流處理器數量NV並沒有統計

那麼總流處理器數怎麼算的呢? 

以2080 Ti TU102核心圖為例,完整的TU102有6組GPC圖形簇,每組GPC有12組SM單元。

再放大一點這裡我們能看到每組SM又能劃分為四個小組,每個小方格代表一個運算單元,因此一個模組有16個進行FP32運算的cuda單元,和16個進行INT32運算的單元,還有個Tensor Croes,一個SM總共64個CUDA運算單元和64個INT32運算單元,4個tensor Cores和1個RT Cores,這是圖靈架構的細節,所以TU102總共有64*12*6共4608個cuda核心和4608個INT32運算單元。

到了NVIDIA Ampere架構,大家能發現這裡原本的16個INT32單元也能進行FP32運算,右邊的FP32單元保持不變,所以這樣一個小分割區裡一個運算週期內顯示卡可以選擇做16個FP32運算+16個INT32運算或者做16FP32+16FP32共32個FP32運算。

因此按照N卡能做FP32運算的單元就是CUDA核心的演演算法,這裡一個SM單元的CUDA流處理器數目就翻倍到128個了。

這樣做能讓顯示卡在單純跑FP32浮點運算時效能翻倍,但是顯示卡在遊戲中是不可能只做浮點運算的,這也是為什麼3080對比2080 Ti CUDA數目翻倍,但遊戲效能並不會翻倍的原因。

除了CUDA核心數目提升,視訊記憶體頻寬提升也是RTX 30效能暴漲的一大原因,3080和3090採用了鎂光新一代的GDDR6X視訊記憶體,新視訊記憶體加入PAM4信令機制,讓每週期傳輸的資料量翻倍,大家可以理解為SLC到MLC那樣的升級。

新的視訊記憶體其速率達到了19Gbps和19.5Gbps,根據視訊記憶體頻寬等於視訊記憶體速率 x 位寬除以8,3080的視訊記憶體頻寬達到了760GB/s,3090更是達到了驚人的936GB/s,對比2080 Ti提升了24%和52%。

其他方面呢,比如PCIE4.0與RTXIO、HDMI 2.1這些就不詳細介紹了。

但是這次公版設計,還是獲得我們的一致好評, 不得不佩服NVIDIA的工業設計能力,看到官方渲染圖的時候,我們都嘖嘖稱奇,有人說沒必要,也有人說這是藝術品。

直到我們看到它滿載78℃與裸機48分貝噪音的測試結果的時候,整個猛男團隊都跪服了,這個異形PCB實在是太有必要了。也只有這樣的設計,才能用上這種雙軸流通式散熱器。

第二部分,為什麼這次它叫RTX 3090,而不是RTX 3080 Ti?

這部分單純是我們的猜測,如有雷同實屬巧合,以後發現猜錯了再回來打我們臉吧

猜測1:雖然AMD遲遲沒有出招,皮衣刀客老黃的實力可不是蓋的,這次算了算差不多是AMD再怎麼蓄力都觸碰不了的高度,出了張新卡,直接給它命名90吧,既能給AMD一個震懾作用,又能把價格定得更高,畢竟是90嘛,怎麼也得比80Ti賣貴一些呀,好了,大家乖乖掏錢。

猜測2:在頂級位置安排一個高定價的RTX 3090,能顯得RTX 3080價效比很高,畢竟看規格有80%的效能,可價格還不到一半,是不是很香?預計第一批貨會秒沒。

猜測3:在RTX 3090和3080之間還有很多刀的空間,比如RTX 3080可以加點流處理器,加點視訊記憶體,做成RTX 3080 Ti或者3080S作為後手招呼AMD 10月28日要發的大Navi,畢竟這5499和11999之間還有6000多塊錢的差價。

而且從老黃在釋出會上的說法來看,RTX 3090很可能就是用來取代在此之前TITAN定位的產品的,這對於需要巨大算力的專業機構來說,簡直是天賜的福利。

對了,就算是RTX3090也不是完整版,參照我們前面的演演算法,完整版GA102是有10752個流處理器的,老黃只開了10496個。

反正無論如何,老黃還留了個超級後手,…真不愧是皮衣刀客,刀法如此精妙,猛男團佩服佩服。

第三部分,十年顯示卡效能增長多少?

3090還沒解禁,目前3080也算是這十年來NVIDIA遊戲顯示卡市場中最強的單芯卡了,立馬實測一波

測試平臺和專案與上期一致,大家看錶格就好。

評測平臺作業系統Windows 10 1909 Pro Workstations 18363.720CPUi7-10700K主機板華碩ROG M12E記憶體影馳HOF EXTREME 設定在3600MHz 8GB X 2SSD三星 970 Evo Plus 1TB電源崑崙KL-1080W電源水冷散熱器超頻三凌鏡GI-CX360水冷散熱器

理論效能測試方面RTX 3080平均四項對比2080 Ti提升了28%,對比2080提升了65%。

在遊戲方面,麻煩又來了,因為3080效能實在太強,即使我們開了全高畫質,很多遊戲比如吃雞在1080P下CPU還是出現瓶頸了,3080對比2080 Ti的提升只有幾幀。

很多小機靈鬼在上期視訊曾經質疑我們,怎麼不用10900K呢?其實看過我們十代酷睿評測這期的網友就知道和10700K差不多效能的9900K遊戲對比10900K也就弱了7%,不能根本性解決問題 該瓶頸還是瓶頸。

這也側面說明了,目前CPU的遊戲效能增長已經趕不上GPU遊戲效能的增長了,大家手動艾特牙膏廠進來捱打!

最後剔除掉有問題的資料,最終3080對比2080 Ti提升22%,對比480提升到了1584%,整機平臺功耗上漲了133W。

但是顯然用這種測試方法來給RTX 3080對比RTX 2080 Ti的提升下結論,是不夠全面的,主要有三個槽點。

RTX 30系顯示卡是支援PCIe 4.0的顯示卡,你這裡用PCIe 3.0的平臺會不會限制顯示卡效能發揮?

剛剛也說了1080P下很多遊戲中CPU已經成為瓶頸,而且買這個效能顯示卡的玩家大部分也不會在1080P下玩遊戲了,對比2K遊戲和4K遊戲效能會更為靠譜。

第三,我們這裡為了讓10年前的顯示卡都能和3080在同一條賽道上比賽,用的都是老遊戲,但是DX12新遊戲,特別是包含光線追蹤和DLSS支援的新遊戲才是兩者差距所在,才能體現30系第二代RT Cores和Tensor Cores的威力。所以我們再來個加時賽,專門讓3080、2080 Ti、2080SUPER和2080和進行PK。  

第四部分:PCIe 4.0顯示卡用在3.0平臺有沒瓶頸?

其實在老黃開發佈會官方演示的PPT中,他們就是使用酷睿i9進行測試的,光是這點,你們就不用擔心PCIe 3.0夠不夠用的問題了。但猛男抱著實事求是的態度,還是拿支援PCIe 4.0的AMD Ryzen 9 3900XT與X570作為平臺再測一遍對比一下。

雖然兩者跑3DMark的頻寬測試有差距,但是多個理論效能測試專案中,兩者都沒有明顯的差異,因此我們可以得到結論PCIe 3.0×16的頻寬是完全能滿足RTX 3080對頻寬的需求的。

但是,我這個結論只針對單卡用途啊,因為RTX 3080是不支援雙路SLI的,而RTX 3090則是支援SLI的,如果在Z490這種消費平臺PCIe 3.0主機板上進行雙路SLI的話,那每路就只能拿到PCIe 3.0×8的通道了,在那個時候就可能出現瓶頸了。

第五部分,加入DX12遊戲,更全面的效能測試

針對第二點 我們先追加了三項理論效能測試,分別是更嚴苛的DX12測試場景Time Spy Extreme、光追效能測試Port Royal和DLSS測試,這裡3080對比2080Ti也是保持30%左右的效能優勢。

除此以外我們還準備了6個新遊戲進行測試其中有5個支援光線追蹤和DLSS,這裡只看它們在2K和4K解析度下的表現,各項測試中3080對比2080 Ti都有明顯的優勢。

在毀滅戰士 4k解析度測試時優勢最明顯,達到43%,平均下來也有30%左右的提升,而對比2080提升最大則在德軍總部4k解析度測試中,這裡顯然2080和2080 SUPER就爆視訊記憶體了,幀數只有3080 1/3。

結合此前6箇舊遊戲中這四張顯示卡在2K、4K解析度的成績,最後我們就能得到這張全面的效能百分比圖表。

12個遊戲,兩個解析度,9項理論效能測試,這33項測試得出的這張效能百分比圖表應該算非常全面和具有參考價值的了,RTX 3080對比RTX 2080 Ti提升為28%,對比2080 SUPER提升56%,對比2080提升足足有71%。  

第六部分,對比目前最強A卡,簡直是屠殺..

雖然現在市面上的A卡比較弱雞,但作為NV目前唯一的對手,這裡我還是要象徵性拿出幾張A卡出來鞭屍,這裡我們選用了Radeon VII和5700 XT兩張顯示卡,因為我們發現雖然理論效能Radeon VII是目前最強的A卡,但是GCN架構實在太老了,在很多新遊戲中Radeon VII的表現反而不如5700 XT,因此我們索性兩張顯示卡都加入測試。

測試專案是12項遊戲中不涉及光追和DLSS的7個遊戲,最終3080比Radeon VII強了82%,對比RX 5700 XT強了93%,接近翻倍

測試結果看完,相信每一個A粉都壓力山大,不過蘇媽給了大家點信心,根據洩露的訊息,BIG NAVI採用RDNA2架構,命名6800或者6900XT,10月28日釋出,屆時我們再來看看紅綠兩家的PK。 

第7部分,功耗溫度測試、噪音測試、延遲測試

RTX 30系使用的是三星特製8nm工藝,顯示卡的功耗表現如何呢?這裡我們使用了一套很牛逼的裝置,由NVIDIA提供能通過PCIe插槽供電和外接供電直接讀出顯示卡單獨的功耗,3080的功耗比2080 Ti要高了30~60W,能耗比對比2080 Ti高了7%。

這樣看新顯示卡的工藝還是有點拉跨,其實三星8nm工藝確實在密度上是比不上臺積電的7nm工藝的,老黃用它也是勝在便宜,最後3080的價格也確實讓人驚喜。

顯示卡的噪音也非常不錯,50分貝以下根本沒有感覺。

在RTX 30系釋出會上老黃還提到了一個降低顯示卡延遲的技術Reflex這裡我們也檢測了一下新顯示卡在堡壘之夜遊戲中的延遲情況,開啟Reflex後在畫面延遲確實有所降低,而且解析度越高療效越明顯,對職業電競玩家的確實是個好東西,只是對於曉邊我來說可能就感知不強了。  

總結

3080的效能提升足夠讓人驚喜,當然最令我驚訝的是價格,畢竟此前的訊息一直都說RTX 30系要繼續漲價,唯一的槽點就是功耗也增長了不少,但前面也說了,假如不是用三星8nm工藝,新顯示卡的價格也不會那麼出人意料,算是一把雙刃劍吧,大家記得選購靠譜的電源就好。

再從十年提升的曲線也能看出,在RTX20劃了兩年水之後,在心疼買了20系的小夥伴之餘,也能欣慰地看到這代RTX 30系的提升開始回到了正軌,而對於RTX 3090顯示卡,效能從它的規格來看也大致推算出會比3080強20%左右,八九不離十了。

如果說英偉達圖靈架構的RTX20是試水光追的一代,那麼英偉達安培架構的RTX30就是揚帆起航的一代了。本次實測可以看到,在同時開啟DLSS和光線追蹤功能之後,RTX 3080已經足以支援4K60幀的遊戲體驗了。

我們曾經猜測過光追可能是未來,但沒想到這個未來來得這麼快!如果說光追導致幀數低是你曾經拒絕它的原因,那麼這一代,這個理由已經不成立了。

當然,這也還得老黃去大力把這技術普及到更多的遊戲製作公司、遊戲引擎上,才能有足夠豐富的遊戲來讓玩家買單。不然我猜到你還能說:才那麼幾款遊戲支援光追,有什麼用呢?

拋開光追不說,RTX 30的絕對效能、以及定價,也已經足夠排除掉你其他的選項了。


IT145.com E-mail:sddin#qq.com