2021-05-12 11:00:58
次世代大作標配 光線追蹤DLSS深度剖析
隨著RTX 30系顯示卡的釋出,人們在關心效能的同時,一些軟性技術的應用和更新更受到玩家的青睞,如遊戲中的光追表現和DLSS效果。
這兩種技術可以說有著劃時代意義,光線追蹤可以讓我們在遊戲中獲得更為真實的光線效果,讓遊戲畫面不斷趨近於真實。
同時還可以節省大量遊戲開發者的時間,而DLSS效果則可以在不降低畫質的情況下讓幀數暴漲。
在新的GeForce RTX 30系顯示卡中,NVIDIA更新了RT Core和Tensor Core,並且新增了大量支援這兩項技術的遊戲,今天筆者簡單為大家簡單說明並進行幾款遊戲的實測展示。
首先介紹一下測試平臺,為了能完全發揮技嘉AORUS RTX 3080 XTREME 10G顯示卡的效能,我們選擇了目前桌面旗艦級CPU和主機板i9-10900k和Z490主機板。
RT Core及光線追蹤詳解
其實,光線追蹤的概念在很早就已經被人所提出了。光線追蹤技術其實就是將光源產生的光線所產生的折射,反射等光線變化和對陰影產生的反應通過計算準確的反映到畫面之中,為人們帶來百分之百的光影效果。
在此次的NVIDIA Ampere架構中,NVIDIA官方宣佈為第二代RT Core,它和第一代有什麼不同呢。
首先要知道RT Core的工作原理是,著色器發出光線追蹤的請求,交給RT Core來處理,它將進行兩種測試,分別為邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersection testing)。
基於BVH演演算法來判斷,如果是方形,那麼就返回縮小範圍繼續測試,如果是三角形,則反饋結果進行渲染。
相較於初代的Turing RTX架構,NVIDIA Ampere架構在算力上有著成倍的增長,同時新的架構翻倍了光線與三角形的相交吞吐量,RT Core達到58 RT TFLOPS,而Turing為34 RT TFLOPS。
而光線追蹤最耗時的正是求交計算,因此,要提升光線追蹤效能,主要是對兩種求交(BVH/三角形求交)進行加速。
在Turing的RT Core中,可以每個週期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 裡,NVIDIA增加了一個新的三角形位置插值模組以及一個的額外的三角形求交模組,這樣做的目的是為了提升諸如運動模糊特效時候的光線追蹤效能。
《軒轅劍7》光線追蹤演示
關於概念性的東西我們就說這麼多,相信玩家更想看到的還是光追的實際效果,首先我們來測試一下近期上線的國產遊戲《軒轅劍7》。
在《軒轅劍7》中,我們以序章的街道場景來做對比,第一張圖為開啟光追後的效果,光線追蹤的效果顯而易見。
開啟光追后街道的燈光、陰影以及太陽光在水面的反射都有很大改善,而遊戲整體的色調也由冷變暖,更富有生活氣息。
第二組對比我們選擇了太史府門前,通過對比不難發現,開啟光追後的效果影響了遊戲整體的氣氛,第一張的燈光氛圍營造出了回家溫馨的感覺,而第二張畫面陰暗感覺馬上會有什麼不好的事發生,雖然比較符合遊戲背景,但整體觀感略差。
Tensor Core及DLSS詳解
我們都知道光線追蹤在遊戲內會耗費巨大的計算資源,這也導致了它在20系顯示卡中由於算力的因素,玩家反響並不大。而在全新的NVIDIA Ampere架構中不但引入了第二代RT Core,還有第三代Tensor Core。
NVIDIA自Volta架構開始,在GPU中增加了針對深度學習加速設計的矩陣運算單元,並稱之為Tensor Core(張量計算核心)。
在圖靈架構裡,NVIDIA引入了第二代Tensor Core,而到了RTX 30系列所採用的Ampere架構,則進化到了第三代Tensor Core。
在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動識別並消除不太重要的DNN(深度神經網路)權重,同時依然能保持不錯的精度。
首先原始的密集矩陣會經過訓練,刪除掉稀疏矩陣,再經過訓練稀疏矩陣,從而實現稀疏優化,進而提高Tensor Core的效能。
在實際應用中,深度學習技術在圖形影象各個領域都有著價值巨大的應用,而在遊戲體驗中則是被稱為深度學習超取樣的DLSS技術。最新一代的DLSS能夠使得遊戲畫質極大提升,細節和銳度媲美、甚至超越原生解析度。
DLSS本質是一種影象重建演演算法,其加原理其實也很簡單。開啟DLSS後,遊戲引擎中的諸如動態光源、陰影的計算,封閉空間環境遮擋(SSAO)、螢幕空間反射(SSR),甚至實時光線追蹤。
都會被降低到1/2甚至1/4畫素的低解析度下執行,GPU的負擔大幅度減輕。渲染得出的最終場景會通過Tensor Core結合DLSS進行高解析度重建,從而用較低的GPU負載獲得流暢且畫質極佳的遊戲體驗效果。
《堡壘之夜》、《死亡擱淺》DLSS效果展示
下面我們來通過實測看一下不同遊戲中開啟DLSS後的效果,我們選擇了《堡壘之夜》和《死亡擱淺》進行測試。
首先來看《堡壘之夜》的對比畫面,其實在遊戲中DLSS的開關幾乎不會影像畫面,但是帶來幀數的變化卻非常明顯。
第一組對比由於天色的變化略失精準,但開啟DLSS質量模式後,角色衣服的褶皺及稜角更明顯。在幀數上DLSS關為78幀,DLSS質量為115幀,幀數提升47%。
第二組對比為DLSS效能與DLSS極致效能,兩者從畫面上幾乎看不出區別,但是幀數仍然提升非常恐怖。
相較於關閉DLSS的幀數,DLSS效能為129幀,提升65%;DLSS極致效能為145幀,提升85%。
145幀的成績已經完全達到高重新整理電競顯示器的影格率要求,同時在遊戲中也能更順暢,最主要的是畫質沒有任何降低。
下面我們來看小島先生的最新遊戲《死亡擱淺》,這款遊戲有個特別的設計就是自帶銳化,從圖中我們也能看到,在一些細小部位,銳化的痕跡十分明顯。
在關閉DLSS的情況幀數為118,而開啟DLSS質量模式後幀數為145,畫面經過AI處理,消除了很多鋸齒。幀數方面,開啟DLSS質量模式後,提升為22%。
在選擇DLSS效能和DLSS極致效能後,幀數為150幀和163幀。同樣畫面相較原生畫質來說將銳化效果進一步消除,觀感更柔和。與原生畫面的幀數相比,提升分別為27%和38%。
其實和光追相比,我認為DLSS對於玩家來說更是終極夢想,在畫質不變甚至更好的情況下極大提升遊戲幀數,這意味著你可以花費更少的價格體驗到更高階顯示卡的效能,同時如果你的顯示卡效能夠強勁幀數比較富裕,還可以再開啟光追效果,進一步增加沉浸感。
相關文章
-
7+2強化供電!599元梅捷SY-狂龍H510M圖賞
除了廣為人知的Z590和B560之外,英特爾還發布了入門級的H510晶片組,也是上一代H410晶片組的升級版。 在相容性方面,H510晶片組與Z590晶片組和B560晶片組沒有什麼區別,都可以相容1
2021-05-10 19:00:28
-
支援5333高頻記憶體!技嘉小雕PRO B560M主機板圖賞
Intel第十一代酷睿已經上市,新架構帶來了巨大的IPC提升幅度,同時,Intel還開放了B560/H570主機板的記憶體超頻功能,這使得主流玩家也可以輕鬆享受高頻記憶體帶來的流暢遊戲體驗。
2021-05-09 16:00:04
-
24K純金!微星MEG Z590 ACE GOLD EDITION戰神至臻圖賞
顯示卡、散熱器、風扇都能玩RGB,機箱中,主機板幾乎是最不起眼的存在。 而近日,微星推出了一款亮眼的主機板,首次用上了24K純金設計,它就是MEG Z590 ACE戰神至臻,一起來瞧瞧。 MEG
2021-05-07 22:00:14