首頁 > 科技

CPU與GPU、VCU的關係愈加「微妙」

2021-06-08 18:47:33

一個GPU總需要一個CPU,但CPU的選擇已經不再單一,GPU的功能也不再「簡單」,曾經穩固的關係,不再是單純的合作。

四月份,英偉達釋出了採用Arm架構的首款資料中心CPU Grace引發廣泛關注。本月,外媒Tomshardware報道,像CPU一樣總需要一個CPU的谷歌自研視訊編解碼處理單元Argos VCU,預計可以替換3000-4000萬個英特爾CPU。

依賴CPU的GPU和VCU為什麼會有替代CPU的勢頭?晶片巨頭與網際網路巨頭間的競合關係,是如何加深的?

CPU市場的雙重變化

回答CPU與其它依賴CPU處理器關係變化之前,不妨先了解CPU市場本身的變化。在很長一段時間,由於CPU的效能已經足夠滿足包括PC在內的各種應用需求,再加上記憶體和頻寬成為CPU效能提升的瓶頸。CPU王者英特爾在提升CPU效能動力不足,以及先進製程工藝進展不如預期的情況下,連續多代CPU效能提升幅度不大,被稱作「擠牙膏」。

英特爾在領先位置緩慢前進的幾年間,AMD憑藉Zen架構的迅速迭代以及臺積電先進製造工藝的加持,效能迅速接近甚至超越英特爾酷睿和至強CPU的效能。「AMD Yes」表達了消費者對於AMD產品迅速提升的認可。

英特爾和AMD的x86 CPU是PC時代的標誌,然而在效能提升陷入瓶頸,以及先進半導體制程提升難度越來越大的背景下,兩家最具代表性的CPU公司表現相差甚遠,並且開始在市場份額上有所體現。

依舊有領先優勢的英特爾感受到了老對手帶來的競爭壓力,因此無論是產品效能提升還是市場策略都更加積極。然而,英特爾在伺服器CPU市場除了要面臨同為x86陣營AMD的競爭,Arm陣營的公司也來勢洶洶。

Ampere董事長兼執行長Renee James說:「我們知道未來將與過去不同,因為軟體環境變了,不再是關於PC和PC伺服器的業務,而是圍繞雲和雲邊緣。現在,需要另一種不同的微處理器。」

Ampere基於Arm Neoverse N1核心,推出了80核的Altra CPU和128核Altra Max CPU,持續重新整理伺服器CPU核心數的紀錄,突出與x86 CPU相比更高的核數以及在雲原生市場的優勢。

同樣是強調差異化優勢,英偉達的Grace主要是面向資料密集型HPC和AI應用。英偉達執行長黃仁勳稱基於Grace的系統與英偉達GPU緊密結合,效能將比目前最先進的NVIDIA DGX系統(在x86 CPU上運行)高出10倍。

無論是Ampere還是英偉達,其差異化高效能CPU的基礎都是Arm。而Arm也在今年三月推出了面向未來十年的新一代架構Armv9,Arm希望將其架構在智慧終端的成功擴展到高效能運算市場,包括邊緣、雲端及5G等。基於Armv9架構的Neoverse N2正是Arm向高效能市場拓展的關鍵產品。

整體看來,已經在PC和伺服器CPU市場大獲成功的x86陣營正開始一場激烈的競爭。此時,面向雲端計算、AI的Arm架構CPU迅速發展,要在新興市場分一杯羹。未來,RISC-V CPU會以怎樣的方式參與到CPU市場的競爭,也讓人充滿期待。

異構時代,定製CPU優勢突顯

CPU市場發生雙重變化的一個關鍵因素是市場需求,在市場的驅動下,CPU的價值也更多體現在異構系統中。英偉達在今年四月釋出Grace CPU的時候,也同時將其資料中心產品路線圖升級為GPU+CPU+DPU的三類晶片,逐年飛躍,一個架構的策略。在這個新的策略中,GPU和DPU效能的充分發揮依舊需要有CPU強大的效能,也就是說,CPU計算和控制的基礎和核心作用沒有改變。

變的是新興應用對於算力的大幅快速增長,異構系統的效能是更重要的關注點。「目前市場上每年交付的3000萬臺數據中心伺服器中,有1/3用於運行軟體定義的資料中心堆棧,其負載的增長速度遠遠快於摩爾定律。除非我們找到加速的辦法,否則用於運行應用的算力將會越來越少。」黃仁勳說,「新時代的計算機需要新的晶片、新的系統架構、新的網路、新的軟體和工具。」

這也是英偉達推出DPU,並且將DPU歸入其資料中心產品路線圖的原因。「現代超大規模雲技術推動資料中心從基礎上走向了新的架構, 利用一種專門針對資料中心基礎架構軟體而設計的新型處理器, 來解除安裝和加速由虛擬化、網路、儲存、安全和其它雲原生AI服務產生的巨大計算負荷。BlueField DPU正是為此而生。」黃仁勳此前表示。

異構組合才能更好滿足未來市場的需求,這也已經是業界共識,從英特爾擁有CPU+GPU+FPGA+AI加速器的完整晶片組合,到英偉達宣佈收購Arm,再到AMD宣佈收購賽靈思,晶片巨頭們都希望通過不同類型的晶片組合滿足雲端計算、AI等計算更加密集應用的需求。

在這種變化中,CPU的選擇也會更加多樣。Computex 21上,黃仁勳在回答雷鋒網等提問時表示:「未來的世界非常多樣,當然也會有不同的CPU,包括x86架構和Arm架構,大型CPU和小型CPU,面向邊緣、資料中心、超算等CPU,我們的策略是在我們服務的市場,選擇最合適的CPU,我們會繼續支援x86 CPU。」

面向特定的市場,並非所有CPU都合適。因此在不同的市場需要不同的CPU,比如在膝上型電腦市場,英特爾的x86 CPU是不錯的選擇,在DGX系統中,AMD的CPU表現非常好。在5G基站中,基於Arm的Marvell CPU是一個理想選擇。在雲端計算市場,Ampere的CPU效能出色。英偉達的CPU為的是解決AI推薦系統和自然語言理解這樣大型AI模型的計算挑戰。

「我相信未來既需要通用CPU,也需要定製CPU。支援Arm和x86對我們來說都是很好的戰略。」黃仁勳表示。

CPU與GPU、VCU更加微妙的競合關係

既有自研的Arm CPU,也支援x86 CPU,讓英偉達與CPU巨頭間的競合關係中競爭的成分更高。在PC時代,晶片巨頭間的競爭,是CPU公司或者GPU公司之間的競爭,CPU與GPU公司以合作為主旋律。

邁入AI時代,英偉達憑藉其GPU硬體加上通用的軟體,成為了AI晶片公司的代表,在AI市場成為了英特爾強大的競爭對手。面向市場空間巨大的雲端計算和5G市場,英偉達的GPU依舊離不開英特爾和AMD的CPU,但同時英偉達會更加註重Arm架構CPU的開發,晶片巨頭間的競合關係進一步加深。

這種關係變化更明顯的轉變在晶片巨頭與網際網路巨頭之間。比如文章開頭提到的谷歌Argos VCU,多年來谷歌都使用英特爾CPU中的視訊編解碼引擎,但隨著視訊內容越來越多,以及解析度越來越高,谷歌需要效能更強但是功耗和成本更低的晶片。

定製的專用晶片效能往往會比通用晶片更強,通過自研核心功能加上整合第三方IP,能在規模應用中實現優勢。谷歌表示,與英特爾Skylake驅動的伺服器系統相比,其基於VCU的裝置在效能、TCO(總體擁有成本)、計算效率方面實現了7倍(H.264)和高達33倍(VP9)的提升。

CPU、GPU 和配備 VCU 的系統離線雙通道單輸出 (SOT) 吞吐量

除了VPU,谷歌也已經通過自研的TPU減少了購買CPU和GPU。谷歌與晶片巨頭們的關係,不再單純是緊密的合作伙伴,在特定市場也成為了競爭對手。

對於這種轉變,英特爾公司副總裁兼中國區總經理王銳此前對雷鋒網表示,「競爭對手可以在某一參數或者是在製程上縮短與我們的差距。但要打造整個架構,在計算和AI的各個方面都要能夠趕超英特爾,不是那麼容易的事情。」

這是晶片巨頭應對技術、市場變化的自信和底氣,當然,晶片巨頭們也需要更多地考慮與自研晶片的網際網路巨頭們的關係。

不要忽略,無論是晶片巨頭們之間的競爭,還是晶片巨頭與網際網路巨頭們之間關係的變化,本質上除了市場和應用變化的驅動,還有成熟的晶片產業鏈,包括成熟的設計工具、IP、代工廠和封裝,很大程度降低了GPU公司設計CPU,以及網際網路巨頭設計定製晶片的門檻。

晶片行業的門檻還在進一步降低,這還會帶來怎樣的變化?雷鋒網


IT145.com E-mail:sddin#qq.com