首頁 > 科技

GeForce RTX 3080 Ti天梯榜首發評測:「Ti」給力遊戲顯示卡新旗艦

2021-06-02 22:49:35

英偉達基於安培架構的新一代GPU已經佈局了許多款產品,在桌面端從頂級的RTX 3090已經佈局到主流級別的RTX 3060,在移動端更是已經佈局到RTX 3050這樣的入門級型號。於是類似上一代圖靈架構產品的釋出節奏一樣,英偉達現在帶來了第二輪的「加強版」GPU,不過並不是SUPER系列,而是Ti系列,其中首先上市的就是被稱為「GeForce RTX系列的最新旗艦遊戲GPU」的GeForce RTX 3080 Ti。

RTX 3090砍去一組TPC

這一代的英偉達安培架構仍然採用將特定組數的CUDA單元、RT核心、Tensor核心封裝為一個SM單元,然後將一定組數的SM單元封裝為一個GPC這樣的層級結構,最後將幾組GPC單元和內部快取等其他硬體部分組成我們看到的GPU核心。

這次的RTX 3080 Ti核心圖等於是在之前RTX 3090的基礎上再砍掉一組TPC,它跟RTX 3090一樣有7組GPC,不過兩組GPC的SM單元僅啟用了10組,所以RTX 3080 Ti一共具有80組SM單元。

由於安培架構每SM單元的Tensor核心數量為4個、CUDA核心64個,每個SM單元中配有一個RT核心,所以RTX 3080 Ti一共有320個Tensor核心和80個RT核心和10240個CUDA核心,相比RTX 3090只是非常小的削弱。

頻率方面,RTX 3080 Ti相比於RTX 3090也有小小的削弱,這張公版RTX 3080 Ti的Boost頻率為1665MHz,相比公版RTX 3090的1695MHz的Boost頻率低了30MHz。

與RTX 3090的決定性不同在於視訊記憶體設計

當然,這些都只是非常微小的削弱,從這些看起來RTX 3080 Ti與RTX 3090可以說非常接近,而RTX 3080 Ti與RTX 3090決定性的不同則是在於視訊記憶體方面。

與RTX 3090配備有24GB大容量的GDDR6X視訊記憶體不同,RTX 3080 Ti在視訊記憶體方面直接砍半,這也註定RTX 3080 Ti是一張更偏向遊戲設計的遊戲顯示卡,而不是像RTX 3090這樣能兼具極致遊戲和嚴苛生產力創作的全能選手。至於為什麼視訊記憶體大砍,當然是為了降低成本,繼而帶來售價的降低,讓RTX 3080 Ti也能成為像RTX 3080這樣具有很高性價比的高階顯示卡。

視訊記憶體方面的另一個小的變化是RTX 3090的視訊記憶體資料速率是19.5Gbps,而RTX 3080 Ti是19Gbps,與RTX 3080一樣,不過他們都是GDDR6X,理論上供電足夠的話,將視訊記憶體小超到19.5Gbps也是能穩定運行的。

RTX 3080 Ti與RTX 3080和RTX 3090的規格對比如下:

NVIDIA Ampere架構簡介

RTX 30系顯示卡上的SM單元相比RTX 20系的,最大變化是加倍了針對傳統計算的FP32單元、引入第二代RT Core以及第三代Tensor Core。

大家都知道在Turing架構中,NVIDIA整數型(INT32)和單精度浮點型(FP32)兩種不同的資料類型交給兩種不同的ALU進行計算。不過現代遊戲應用中最為常見的還是FP32,因此為了提高計算效率NVIDIA在NVIDIA Ampere 架構上引入了可同時支援INT32或FP32兩種資料類型的新ALU。也就是說,現在有兩條不同的資料路徑,一條能夠同時處理整數或者單精度浮點,另一條則單純處理處理單精度浮點計算。

負責進行實時光線追蹤運算的專用硬體單元RT Core在NVIDIA Ampere 架構上也更新到了第二代,最主要是增加了動態模糊的加速運算支援。NVIDIA在其中新加入的插值演算法可以在保證動態模糊精確性的同時提高了實時光線追蹤效率,官方表示最高可達8倍於上代的速度。另外在基礎的BVH計算上,第二代RT Core也可以比第一代快2倍。

Tensor Core這個負責運行AI計算的硬體單元在NVIDIA Ampere 架構上也升級到了第三代。其實之前釋出的A100計算卡上已經用上了新的第三代Tensor Core,它能夠提供比第二代Tensor Core高出4倍的效能,不過遊戲卡上面的Tensor Core進行了一定的精簡,其FP16 FMA計算的吞吐量只有GA100核心中的Tensor Core的一半。

而第三代Tensor Core帶來的更強勁AI運算有些什麼用呢? 答案就是DLSS。隨著RTX 30系顯示卡一同釋出的,還有DLSS的更新版 - DLSS 8K,在很多遊戲設定裡面就是DLSS選項中的「超級效能」模式,它可以通過渲染1440P的畫面輸出4320P的8K遊戲畫面,並且與原始8K解析度的畫面幾乎肉眼難以區分,這利用的就是Tensor Core帶來的更強勁AI運算功能。

另外RTX 30系顯示卡也用上了NVIDIA與美光聯合研發的GDDR6X視訊記憶體。與GDDR6相比,GDDR6X最大的變化是訊號傳輸機制以及增加頻寬,從GDDR6的NRZ調製換用PAM4。

再之後就是HDMI 2.1這個備受期待的新輸出埠了。在HDMI 2.1之下,顯示卡可以用單線材做到8K60Hz或者4K120Hz的輸出。對於想用大尺寸電視打遊戲的玩家來說是一個不錯的福音。

最後還有就是NVIDIA新推出的RTX IO了。這項技術是NVIDIA藉助微軟此前推出的DirectStorage API來實現的,將會作為插件的形式與後者整合,可以讓顯示卡繞開CPU直接讀取SSD資料,從而降低CPU的佔用率。不過由於RTX IO需要依靠Windows的DirectStorage API,並且還需要遊戲開發商做針對性的優化,所以最快我們也要等到明年才能看到這項技術的具體應用。

RTX 3080 Ti公版顯示卡產品解析

RTX 3080 Ti公版顯示卡外觀

RTX 3080 Ti公版卡的外觀與之前的RTX 3080公版卡幾乎是一模一樣,除了型號標識之外,僅僅是CNC工藝切割的外邊框似乎被拋光過,更具有光澤一些。正面只可以看到一個導風風扇,然後其他部分幾乎都是裸露的散熱鰭片,不過由於做的相當精緻,看著毫無違和感,背面有依然質感上乘的金屬背板,背面也還有一個風扇,正面風扇吹風,背面風扇抽風,構成了獨特散熱設計。

英偉達為這個創新性的散熱設計取了個名字叫雙軸流推輓式風扇散熱設計。通過這種方式能更好的將廢熱定向的引導到機箱風扇的風道,避免了機箱風道的凌亂,也讓機箱內部整個系統的散熱效率相比排風式的軸流式風扇散熱要好一些。

供電介面仍然是全新的12 Pin供電介面,這個介面比標準的PCIe供電介面小,但能夠承載更大的電流,也就是能夠獲取更大瓦數的外部供電。但是由於PC電源方面還未及時跟上新方案,所以公版卡也附送有一條轉接線,用於將標準PCIe供電介面轉換成新的12 Pin供電介面。

介面方面有3個DP介面和1個HDMI介面,這個HDMI介面是2.1標準的,可以支援8K 60FPS乃至10K 30FPS的視訊輸出,與採用HDMI 2.1介面的顯示器或者電視連線使用的話,只需要一根線材就可以實現8K 60FPS的視訊輸出,而不像之前需要兩根DP線或者4根HDMI線。

顯示卡的PCIE介面支援PCIE 4.0,可以提供更高的頻寬。這個對於之後的RTX IO的應用和普及比較重要,可以儘量減少系統的頻寬瓶頸,當然就目前來說,最大的優點就是支援Resizable BAR,RTX 3080 Ti是出廠就支援Resizable BAR的,並不需要更新顯示卡BIOS。

RTX 3080 Ti公版顯示卡拆解

RTX 3080 Ti公版卡仍然採用了真空腔均熱板設計,可以非常高效的將GPU核心的熱量傳導到熱管然後分散到散熱鰭片上,具有4根8mm直徑的熱管,這些熱管上面均覆蓋有鍍層,可以防止日久使用之後表面發生氧化,鍍層是黑色的也與整體的色調設計搭配,讓顯示卡更好看。

PCB仍然是採用了上圖這樣異型的PCB板,電子元器件的排布非常密集,可見這種設計已經是充分微型化下的結果,儘管核心規模相比於RTX 3080來說其實更接近RTX 3090,但是並沒有採用RTX 3090那樣的越肩式PCB,當然,這個其實拆解之前看體型就能看出來。

RTX 3080 Ti公版卡的PCB等於是在RTX 3080公版卡PCB的基礎上補全了2顆視訊記憶體顆粒的空焊位,這些視訊記憶體顆粒仍然是美光的GDDR6X視訊記憶體,型號為D8BWW,單顆1GB容量,位寬32bit,12顆一共組成12GB的容量、384bit位寬。

另外就是供電佈局方面有所調整,但是仍然是一共18相供電。MosFET均是來自美國芯源系統的MP86957,一共採用了3顆美國芯源系統的PWM控制器,分別是一顆MP2884B和兩顆MP2888B。

效能測試

測試平臺

測試平臺如上,記憶體是2條8GB的Tt ToughRAM DDR4-3600記憶體組成的16GB雙通道配置,並且在BIOS中開啟XMP讓記憶體運行在3600MHz的頻率,同時在BIOS中開啟Resizable BAR的支援,其他均採用預設設定。

基準效能測試

我們以3DMark作為顯示卡基準效能測試,測試項目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六個項目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三個項目分別測試的是顯示卡在DX11遊戲中的1080p解析度、2K解析度和4K解析度下的效能指數,Time Spy、Time Spy Extreme兩個項目則是顯示卡在DX12遊戲中的2K解析度和4K解析度下的效能指數,Port Royal是測試的顯示卡實時光線追蹤的效能指數,具體成績見下表,表中所列成績均為3DMark顯示卡單項的得分

就基準效能測試來看,RTX 3080 Ti約有RTX 3090的97%的效能,與RTX 3080相比,提升有11%,而與上一代的旗艦RTX 2080 Ti相比,提升足足有40%以上,特別是以它們更為實際的4K解析度下的遊戲模擬比如Fire Strike Ultra和Time Spy Extreme項目來說,RTX 3080 Ti相比RTX 2080 Ti提升更是達到45%,可以認為足有RTX 2080 Ti這張上代旗艦1.5倍的效能。

與A卡陣營相比的話,由於核心的差異,它們的區別比較複雜,在DX 12 API和光線追蹤方面安培架構的N卡是完全吊打A卡的,即使是RX 6900 XT在這兩個方面也都不如RTX 3080 Ti。不過對於DX 11 API來說,A卡在理論測試下的表現還不錯,RTX 3080 Ti在這方面介於RX 6800 XT和RX 6800之間。

4K解析度遊戲實測:僅比RTX 3090低3%的遊戲表現

傳統光柵化遊戲測試

傳統光柵化遊戲畫面測試這部分均將遊戲畫質設定為預設裡面的最高畫質設定(《地鐵:離去》選擇Ultra畫質,《戰爭機器5》統一開啟非同步計算、關閉可變速率陰影),預設不是全屏的手動改為全屏,預設開啟了垂直同步的手動關閉垂直同步,除此之外其他選項均為預設設定,均採用遊戲自帶的Benchmark輸出結果。

通過10款遊戲的實測來看,RTX 3080 Ti平均表現就是RTX 3090的97%的效能,平均領先RTX 3080則達到12%,領先上一代的旗艦RTX 2080 Ti達到38%。

與A卡相比,則主要是在《刺客信條:英靈殿》這款遊戲上A卡較為佔優,其次《戰爭機器5》和《孤島驚魂5》A卡表現也較為不錯,如果除開這幾個遊戲之外,RTX 3080 Ti甚至能全面領先A卡旗艦RX 6900 XT,不過儘管這幾個遊戲RTX 3080 Ti略輸RX 6900 XT,總體平均下來RTX 3080 Ti仍然以微弱的1%幅度領先RX 6900 XT,領先RX 6900的幅度為8%,而領先RX 6800的幅度就很大了,達到30%。

而就絕對的遊戲幀數表現來說,可以看到所測試的這些單機大作中,除了《全面戰爭:三國》之外,其他遊戲均可以在4K預設最高畫質下以至少60幀穩定運行。比如硬體殺手級的最新單機大作《看門狗:軍團》可以達到60幀、《刺客信條:英靈殿》可以達到62幀,這樣的表現也足以感受到RTX 3080 Ti的強大效能。

實時光追遊戲測試:

光追方面,由於A卡不支援DLSS,為了控制畫面效果完全一樣所以N卡也跑了不開啟DLSS的成績,而對於玩家來說DLSS這項福利技術多數是會開啟的,所以為了表現顯示卡的實際遊戲體驗,也測試了N卡開啟DLSS的成績(《塵埃5》不支援DLSS)。這些遊戲中,光線追蹤效果均設為「高」,支援DLSS 2.0的均選擇為「效能」模式。

如果遊戲開光追的話, 沒有任何意外的,成了N卡的全面勝利,即使在N卡不開啟DLSS技術的情況下,RTX 3080 Ti仍然以37%的巨大幅度領先RX 6900 XT,領先RX 6900更是達到44%,而領先RX 6800則是達到誇張的79%。

至於開啟DLSS之後的情況,就根本不用詳細對比,N卡在開啟DLSS之後的成績都是遠遠拋離A卡的。當然,AMD在昨天的臺北電腦展上也正式推出了FidelityFX Super Resolution(FSR),是和DLSS類似的解析度提升技術,從宣傳來看效果也非常不錯,筆者非常期待儘快在遊戲中看到它的應用。

而RTX 3080 Ti與自家的安培架構顯示卡相比,由於基於同一架構,在開啟光追的情形下也與光柵化的遊戲情況差不多,RTX 3080 Ti約有RTX 3090的96%的效能,平均領先RTX 3080則達到11%。但是由於RTX 2080 Ti是上一代的圖靈架構,這裡區別就相比於光柵化的遊戲下拉大了,由於RT核心進化到第二代,RTX 3080 Ti的光追遊戲效能相比RTX 2080 Ti進步巨大,達到了50%,遠高於傳統光柵化下的遊戲效能提升。

溫度測試:滿載最高僅有69.6攝氏度

我們的顯示卡散熱測試均在裸機狀態(如果安裝在機箱內,GPU溫度會高出5℃左右)下進行測試,測試環境溫度約為26.4℃。待機溫度是開機以後記錄10分鐘,滿載溫度則是完成3DMark Time Spy壓力測試後記錄下,資料通過GPU-Z的Log to File功能記錄,以下為溫度測試曲線。

溫度測試說實話有點出乎我的意料,前面也看到了RTX 3080 Ti的GPU核心可以說是與RTX 3090相差無幾的,而搭配的散熱器卻並不是RTX 3090那樣的大塊頭,而是保持了和RTX 3080 Ti一樣的鰭片規模,但是RTX 3080 Ti的溫度測試結果卻非常優秀,滿載最高僅有69.6攝氏度,這個溫度比RTX 3080都還要低,原因應該是RTX 3080 Ti的頻率更低所至。

功耗測試:滿載功耗平均354W

通過我們專用的顯示卡功耗測試儀器,可以分別精確地測量顯示卡PCI-E、外接電源介面瓦特數,顯示卡最大功耗在3DMark Fire Strike壓力測試中獲得,待機功耗則是在進入系統後記錄1分鐘取平均值。

功耗測試的結果是RTX 3080 Ti的待機功耗平均為21W ,滿載功耗平均為354W,滿載功耗峰值則到過372W,所以考慮到裝機平臺的其他硬體的功耗的話,建議850W的電源起步,特別是如果搭配Intel Core i7-11900K這樣的處理器,有條件的話推薦1000W以上的電源是最好的。

超頻效能測試

將功耗上限和溫度上限解鎖到最高之後,經過多番手動超頻嘗試,RTX 3080 Ti最終在核心頻率+150MHz,GDDR6X視訊記憶體資料速率+2Gbps下完成超頻。這個狀態下,這張RTX 3080 Ti公版卡能順利通過3DMark的FireStrike項目測試並且分數最高, 此時這張RTX 3080 Ti公版卡的Boost頻率為1815MHz,視訊記憶體等效頻率為21Gbps。這張RTX 3080 Ti公版卡在超頻狀態下運行3DMark FireStrike項目的顯示卡得分與默頻狀態下顯示卡得分的對比如下表所示。

還是那句話,時至今日現在的顯示卡超頻空間並不會很多,從我們較為極限的手動超頻來看,RTX 3080 Ti經過調校後還可以壓榨出6.5%的效能,不過這也是在提高了功耗上限的情況下得到的,而且就能耗比來看的話超頻狀態是不如預設狀態的,所以再考慮到穩定性等方面,建議玩家還是默頻運行。

總結:「Ti」給力的遊戲顯示卡新旗艦

儘管RTX 3080 Ti之上還有RTX 3090,但是筆者還是認為RTX 3080 Ti才是接替RTX 2080 Ti的新一代旗艦遊戲顯示卡,畢竟從設計來看,它是更純粹的面向遊戲而設計。而具有24GB海量視訊記憶體容量的RTX 3090還是更像是上一代TITAN RTX的繼任者,儘管其遊戲能力也是巔峰級別,但是創作應用場景下才能更加完全發揮這類大視訊記憶體顯示卡的全部實力,如果你只是遊戲玩家的話,與RTX 3090效能差不多的RTX 3080 Ti明顯價效比高了太多太多,是更適合遊戲的旗艦顯示卡。這也是為什麼官方稱其為「GeForce RTX系列的最新旗艦遊戲GPU」的原因。

其實從RTX 3080 Ti的命名來看,它也名副其實的是上一代RTX 2080 Ti的繼任者,並且從測試來看,在這類頂級顯示卡的主戰場——4K光追遊戲場景中——RTX 3080 Ti相比上一代RTX 2080 Ti足足提升了50%,而價格卻相比於RTX 2080 Ti從9999元還下降到8999元,不由得讓人感嘆代際的提升實在是太大。

顯示卡迷你天梯榜 (完整顯示卡天梯榜)

而現在再看與A卡陣容的比較的話,之前AMD這邊的旗艦RX 6900 XT雖然整體效能不如RTX 3090,但是RX 6900 XT在定價上做文章,也算是相較於RTX 3090有一定的競爭力。但是現在RTX 3080 Ti以8999元的價格釋出,並且整體遊戲效能領先RX 6900 XT,在開啟光線追蹤的情況下更是碾壓RX 6900 XT,這就讓AMD這邊很被動了,如果AMD沒有能迴應的新產品釋出的話,或許接下來只能進行降價銷售的選擇了。


IT145.com E-mail:sddin#qq.com