時間接近2021年中,世界經濟正在從慘痛的疫情當中恢復;而當人們的工作和生活逐漸恢復平常,很多深遠的改變卻已悄然發生。 在過去的一年多時間裡,絕大多數企業都意識到了數
2021-06-23 13:38:25
時間接近2021年中,世界經濟正在從慘痛的疫情當中恢復;而當人們的工作和生活逐漸恢復平常,很多深遠的改變卻已悄然發生。
在過去的一年多時間裡,絕大多數企業都意識到了數字化轉型的重要性,越來越多的辦公由遠端協作完成,越來越多的工廠也開始轉向數字化、無人化和智慧化;內容更加短平快的短視訊行業保持了烈火烹油的發展態勢,進一步成為行業發展主流;更多人將線上互動娛樂作為自己的重要娛樂方式,繼續將行業營收和利潤快速推高……這些行業是後疫情時代經濟增長的代表,更是算力等於生產力的精闢註腳。
於是,在越來越多人投身這些行業、共享發展紅利之時,市場對多元算力的需求也隨之爆發。
算力等於時間,時間等於金錢
無論是普通製造業常用的Autodesk 123D,或是精密加工製造常用的Cero系列軟體,亦或是計算機動畫領域常用的Blender和MAYA、室內外建築設計常用的SketchUp……設計人員的大致工作流程都是用較短的時間構建或匯入3D模型,然後用更長的時間等待渲染或分析結果。顯然,在這些領域中,等待時間的長短就是生產力強弱的直接表現。因此,處在行業上升通道中的企業要想搶佔先機、拿到更多發展紅利,除了擴大團隊規模之外,使用全新硬體減少工作流中的等待時間就是最直接、最有效的方法。
那麼,問題接踵而至,怎樣的硬體才能最可能多的減少工作流中的等待?一路凱歌的NVIDIA其實早已準備好了答案——RTX A6000。
作為橫跨資料中心、數字內容創意和消費娛樂多重領域的晶片行業巨頭。NVIDIA已經在過去用海量的頂尖產品無數次證明,無論是在頂尖超算、在AI開發前沿,還是在創意內容工作室或玩家的電腦中,NVIDIA都是絕對算力的保障。
在公司層面,5月底,NVIDIA公佈了有史以來最耀眼的財報;其中,營收56.6億美元、增幅84%,淨利23.13億美元、增幅107%。而在過去的一年中,NVIDIA股價更從360美元一路挑高至720美元附近。營收、淨利和股價的高歌猛進當然有多重市場因素,但更與NVIDIA在2020年底推出的安培架構系列產品取得歷史性的成功有關。
通過大幅提高CUDA單元數量並對SM單元進行重新優化設計,全新的RTX系列顯示卡在效能上迎來了大幅度的提升。當這些表現在數字內容創意領域,就是全新的RTX A6000。
從Quadro P6000到Quadro RTX 6000,顯示卡的CUDA核心數量從3840增長至4608,增幅20%;但Quadro RTX 6000到RTX A6000,CUDA核心數直接從4608增加至10752,增幅133%。而為了配合CUDA核心數量的巨幅增加,NVIDIA也豪爽的對視訊記憶體容量進行了翻倍處理;一下子從24GB來到了48GB。
這也難怪,全新的A6000「給的太多了」,實在無法與傳統的Quadro系列相提並論;因此,新的RTX A6000也終於放棄了Quadro字首,以更簡潔有力的「RTX」示人。
現在,RTX A6000也終於來到PConline評測室,那麼就讓我們來看看RTX A6000能夠在數字內容創意方面帶來怎樣的提升。
源自內芯的強大——RTX A6000規格簡介:
安培架構堪稱NVIDIA近年來最大的一次革新。除了CUDA數量的大幅增加,相對於上一代產品, 安培架構對SM單元也進行了重新設計。安培架構的一個SM單元最多可以在每個時鐘週期內執行128條FP32指令,同時也可以在每個時鐘週期內執行64條FP32+64條INT32指令,最終讓FP32效能達到翻倍的同時,也兼顧了通用性。
另一方面,作為NVIDIA的第二代RTX架構,RTX A6000核心內還集成了第2代RT Core和第3代Tensor Core。憑藉著翻倍的吞吐量,RTX A6000能提供先進的光線追蹤和AI人工智慧訓練功能。
換句話說,RTX A6000的核心不僅具備更大的處理規模,執行效率也會更高。在行業應用場景中,這意味著創作人員對模型的每一次修改、每一次旋轉、每一幀渲染都能更快得到結果。而這種「快」絕不僅僅是等待時間的成倍縮短,更代表在越來越多的場景中,人們都能夠得到接近實時的計算機視覺影象反饋。
或者,用更簡單的方式來理解,企業創造價值所需的時間變得比以往更短了。
與普通的娛樂用途不同,定位於生產環境的RTX A6000通常要面對更高的模型精度、更復雜的渲染場景和更高的解析度。這不僅對核心的計算能力提出了更高要求,也對需要顯示卡具備更多高效能的視訊記憶體。RTX A6000配備了48GB GDDR6視訊記憶體並提供了ECC功能,這就解決了顯示卡在長時間高負載應用中出現的視訊記憶體報錯問題,為生產應用的可靠性提供了保障。
在介面層面,RTX A6000首次提供了對PCI-E Gen4的支援,比上代介面高一倍的頻寬和更低的延遲有助於RTX A6000在資料密集型應用中獲得更好的效能表現。同時,顯示卡搭載的第三代NVIDIA NVLink互聯介面也允許使用者在單機內同時安裝兩張顯示卡,以便更進一步的提升效能。
另外,顯示卡還提供了SYNC介面,用以連線專業的多屏顯示同步卡。由此,RTX A6000也可以用在大型控制中心、監控、金融等多屏輸出環境。
測試平臺介紹與偵錯:
PConline實驗室搭建了酷睿i7-11700K+Z490的測試平臺,這套平臺支援PCIe 4.0,能夠讓RTX A6000不留瓶頸的發揮性能。此外,在測試前安裝了466.11版本驅動。
本次測試還安裝了NVIDIA RTX Experience,它的前身名為Quadro Experience,類似於普通遊戲顯示卡的GeForce Experience;NVIDIA RTX Experience可以提供豐富且非常實用的功能,例如使用本地錄製和捕獲工具、即時分享內容、接收新版企業驅動更新提醒、工作和娛樂優化設定,以充分發揮RTX A6000的全新特性。
RTX Experience的驅動推送更新功能:
NVIDIA RTX Experience自帶的應用程式掃描功能,可以識別當前電腦中安裝完成且支援GPU加速的應用程式。
事實上,目前支援GPU做加速的應用程式已經越來越多,能夠覆蓋各個領域的不同人群。而搭載完整GA102核心的RTX A6000在效能表現方面自然備受期待,下面將正式開始測試。
理論效能和專業生產力測試:
首先測試CUDA-Z,這是一個實用的工具,和GPU-Z類似,能夠對NVIDIA GPU的資訊進行採集。而在CUDA-Z的效能測試中,RTX A6000單精度浮點峰值達到了40T,但雙精度浮點依舊被閹割;看來在HPC領域,還是需要搭載GA100核心的DGX A100計算系統。
SPECviewperf 2020是專業圖形工作站領域流行的綜合性能測試軟體,相比於該系列的上一個大版本SPEC viewperf 13,全新的SPECviewperf 2020對測試子集進行了更新,並引入了一些新素材和新模型。目前包括3ds Max、Maya、Catia、UG NX、Solidworks、Creo等應用負載的效能測試。
SPECviewperf 2020安裝和測試時間都比較長,以下是RTX A6000的測試結果:
渲染效能測試:
V-Ray是由chaosgroup出品的一款高質量渲染軟體,是目前業界最受歡迎的渲染引擎。基於V-Ray 核心開發的有VRay for 3ds max、Maya、Sketchup、Rhino等諸多版本,為不同領域的優秀3D建模軟體提供了高質量的圖片和動畫渲染。
使用V-Ray Benchmark 5進行測試,如果是傳統的GPU CUDA渲染,RTX A6000得分1485vpaths。
V-Ray Benchmark 5還支援RTX光線追蹤渲染,RTX A6000的分數為2350vrays。
Blender是一款免費開源三維圖形影象軟體,提供從建模、動畫、材質、渲染、到音訊處理、視訊剪輯等一系列動畫短片製作解決方案,本次使用Blender 2.92版本進行測試。
目前,Blender 2.92除了支援傳統的CPU渲染之外,也支援GPU CUDA或Optix光追渲染,在偏好設定中可以自由切換。
手動匯入bwm27、classroom、fishy_cat、koro、pavillon_barcelona和victor等多個素材進行渲染,並記錄時間。
可以看到在Blender 2.92中,無論是CUDA渲染,還是使用Optix光線追蹤渲染,RTX A6000都能提供極高的效率,對比酷睿i7-11700K這樣的中高階桌面處理器,使用RTX A6000能讓渲染的等待時間做到大幅減小。
而說到GPU渲染,那不得不提Octane Render,這是目前非常流行的GPU渲染引擎,受到大多數現代和流行的3D軟體的支援,如Cinema 4D,3ds Max,Maya,Revit,Blender,Houdini,Modo等等。而OctaneBench則是基於Octane Render開發的基準測試。
本次使用OctaneBench 2020.3進行測試,該版本目前也支援Optix光追渲染,開啟Enable RTX後,RTX A6000的測試綜合得分高達649.49。
當然,即使是不開啟Enable RTX,RTX A6000的測試綜合得分也能達到525.68。
照片處理和視訊編輯測試:
Procyon是來自UL的一款全新的基準測試套裝,為專業使用者而打造,目前PC版內建照片編輯基準測試和視訊編輯基準測試。
其中Photo Editing Benchmark是照片編輯基準測試,使用 Adobe Lightroom來匯入、處理和修改選定的影象。在測試的第二部分中,Adobe Photoshop中的照片將被進行多次編輯和圖層效果。
Procyon照片編輯基準測試測試過程,使用Adobe Photoshop,測試時安裝的Adobe Photoshop版本為22.3.1。
Procyon照片編輯基準測試測試過程,使用Adobe Lightroom進行批量處理,測試時安裝的Adobe Lightroom版本為10.2。
照片編輯基準測試結果的綜合分數為8540,具體看子項目,Image Retouching分數為8411、Batch Processing分數為8672。
Procyon還提供了Video Editing視訊編輯基準測試,該基準測試使用Adobe Premiere Pro將視訊項目檔案匯出為通用格式。每個視訊項目都包括各種編輯編輯、調整和效果。基準分數基於匯出視訊所需的時間。本次測試時安裝的Adobe Premiere Pro版本為15.2.0.35。
在Procyon的視訊編輯基準測試中,RTX A6000展現出了強大的編解碼效率,測試平臺綜合得分為8204,具體來看GPU硬體加速下H.264 1080p高清視訊匯出耗時僅為23.742s、H.265 4K UHD超清視訊匯出耗時也只有50.712s。
DaVinci Resolve是一款在同一個軟體工具中,將剪輯、調色、視覺特效、動態圖形和音訊後期製作融於一身的解決方案,備受好萊塢專業人士歡迎。
DaVinci Resolve對顯示卡的效能有極高的要求,而這恰恰讓RTX A6000有了用武之地。使用PugetBench For DaVinci Resolve V0.92.1進行測試,這套平臺的綜合分數達到了1373。
總結:
採用安培架構的RTX A6000使用了三星的先進8nm工藝製造,TDP 300W;雖然功耗提升了約15%,但卻迎來效能的大幅提升。這意味著企業在創造更多價值的同時,單位算力的功耗卻能夠降低很多。對於大型企業、渲染農場或其他算力密集型環境來說,這便是更低OPEX成本的代名詞。
而從效能表現來看,全新的RTX A6000內部整合的過萬CUDA核心的確能夠在3D設計、渲染等場景中提供更高效能,進而實現更好的應用體驗、大幅減少等待。這就能夠直接提高創意人員的工作效率,提升最終客戶的滿意度。
數字化時代的門扉雖已扣響,但我們也必須承認,距離構建一個完整數字化的世界,我們仍有相當長的路要走。在這條路上,還有太多的產品需要被重新設計,有太多的創意需要觀眾,有太多的計算等待結果。而RTX A6000所帶來的效能提升和等待時間降低則代表企業具備了一條通向更大價值空間的全新路徑,一條距離更短、限制更少的高速捷徑。
或許所有人都應該瞭解,當我們越來越多的被設計所服務、為創意而感動時,算力的進步正在讓這一切更快到來!
相關文章
時間接近2021年中,世界經濟正在從慘痛的疫情當中恢復;而當人們的工作和生活逐漸恢復平常,很多深遠的改變卻已悄然發生。 在過去的一年多時間裡,絕大多數企業都意識到了數
2021-06-23 13:38:25
三星和AMD很早就開始合作開發新的ARM架構晶片,按照之前透露的資訊來看,在CPU部分會採用三星的ARM處理器,而在GPU部分則會採用AMD最新的RDNA 2架構。從現在來看,最快我們下個月就
2021-06-23 13:18:00
#AppleWatch#蘋果WatchOS 8的11項實用功能搶先體驗!將於7月開放測試蘋果第7代Apple Watch的傳聞滿天飛,訊息指出邊框更窄、機身設計由圓潤改為平整,不過這都只是「傳聞」,很確定
2021-06-23 12:56:57
今年華為在多個場合都表示,在2021年華為要讓搭載鴻蒙的裝置達到3億臺。這其中華為自己的終端包括手機、智慧手錶和平板,佔據了2億臺;而剩下的1億,則需要第三方廠商的loT裝置來實
2021-06-23 12:56:14
當我們還對玫瑰、月季和薔薇傻傻分不清楚的時候,計算機視覺已經可以在一萬種極其相似的自然界物種裡精確地分門別類了。影象分類是計算機視覺領域一個由來已久,經過了深入挖掘
2021-06-23 12:55:11
基於開源RISC-V架構的晶片設計公司SiFive宣佈推出新的SiFive Performance系列處理器核心,包括P270和PP550兩款,後者是SiFive迄今為止效能最高的處理器。近期有訊息指,英特爾有
2021-06-23 12:54:35