首頁 > 科技

揭開面紗!英特爾第12代酷睿Alder Lake平臺架構詳解!

2021-08-21 03:01:39

昨天晚上,英特爾在年度架構日活動上,正式公開了第12代酷睿Alder Lake平臺和Xe HPG銳炫遊戲顯示卡的架構詳情。下面,咱們就來簡單瞭解一下來自2022年新品的特色吧。

第12代酷睿一門三劍客

第12代酷睿Alder Lake平臺將衍生出3大序列產品線,分別是面向桌面平臺的S系列(LGA1700獨立封裝,最多8大8小16核心24執行緒,整合32EU核顯,功耗最高125W);低功耗版的UP3系列(BGA Type3整合封裝,最多6大8小14核心20執行緒,整合最多96EU核顯,功耗12W~35W);超低功耗的UP4系列(BGA Type4整合封裝,最多2大8小10核心12執行緒,整合最多96EU核顯,功耗低至9W)。

其中,UP3和UP4都是筆記本專用。UP3還會被進一步細分出U15和H35,取代現有的i5-1135G7和i5-11300H等老將。UP4則是Y系列,更加適合平板二合一裝置。如果不出意外,2021年第12代酷睿Alder Lake平臺還會增加面向遊戲本的H45系列移動版,核心規模可以達到S系列的級別。

3大序列產品線的架構相同,而且都整合新一代GNA 3.0高斯神經加速器,它們的差異主要在於核心規模,以及對一些原生功能的支援。比如,只有移動版才標配IPU(影象處理器單元)、雷電4和Wi-Fi6,而且UP3提供4個雷電4埠,UP4則僅支援2個。

作為第12代酷睿Alder Lake平臺的「皇帝」,最多將擁有8大核8小核,共計24個執行緒,三級快取最高可達30MB。作為對比,第11代酷睿移動版的三級快取最高為24W,桌面版更是僅有16MB。

第12代酷睿的移動版支援DDR5-4800、DDR4-3200、LPDDR5-5200(板載)、LPDDR4X-4266(板載)四種規格的記憶體,還支援記憶體的動態電壓頻率縮放,並強化超頻。由於桌上型電腦平臺大都採用標準的記憶體插槽設計,所以支不支援LPDDR5和LPDDR4X就不重要了。

第12代酷睿桌面版的CPU部分提供16條PCIe 5.0和4條PCIe 4.0通道,與其配套的晶片組(Z690)則最多支援12條PCIe 4.0和16條PCIe 3.0。移動版可能沒那麼多,但也足夠滿足高效能獨顯和PCIe 4.0 SSD的帶寬了。

第12代酷睿通過三種高速通道將各個模組串聯了起來。第一個是Compute Fabric,用於連線CPU和快取記憶體,頻寬可達1TB/s,支援動態快取優化。第二個是Memory Fabric,用於連線記憶體和其他模組,頻寬最高204GB/s,支援動態位寬和頻率。第三個是I/O Fabric,用於輸入輸出,最高頻寬64GB/s,支援基於需求的實時頻寬控制。

Lakefield的接班人

英特爾曾在第10代酷睿時期推出過代號為「Lakefield」的混合酷睿平臺——酷睿i3-L13G4和i5-L16G7這兩顆處理器首發英特爾Foveros 3D封裝技術和混合CPU架構(Intel Hybrid Technology),採用了類似ARM big.LITTLE大小核技術,內建1+4大小核組成的5核心,結合7W的TDP,可以幫助移動裝置進一步瘦身。

可惜,與Lakefield平臺搭檔的Windows 10系統卻不太給力,對大小核的優化不到位,以至於搭載這一平臺的Windows裝置沒能發揮出能效比方面的優勢,很多消費者甚至都不知道Lakefield到底是個啥。

第12代酷睿平臺最大的特色,就是繼承了來自Lakefield的衣鉢,同樣採用大小核混合架構設計。

大核名曰Golden Cove

英特爾將第12代酷睿內的大核稱為「效能核心」(Performance Cores),又稱「P核心」(P-Cores),採用全新的Golden Cove微架構,支援超執行緒技術、AVX-512指令集和DLBoost深度學習加速功能,最多8核心16執行緒。

Golden Cove微架構是此前第10代酷睿Sunny Cove、第11代酷睿移動版Willow Cove、第11代酷睿桌面版Cypress Cove的迭代升級版。Golden Cove微架構在大量基礎模組都重構或升級,官方稱其是近十年來的最大變革,堪比當年的Skylake,在提高速度、突破低時延和單執行緒應用程式效能的限制。該架構還支援AMX高階矩陣擴展指令,內建下一代AI加速技術,用於學習推理和訓練,包括專用硬體和新指令集架構,可明顯提高矩陣乘法運算。

英特爾表示,Golden Cove微架構相比於現在第11代酷睿桌面上的Cypress Cove實現了平均大約19%的IPC(同頻效能)提升。

小核名曰Gracemont

英特爾將第12代酷睿內的小核稱為「能效核心」(Efficiency Ccores),又稱「E核心」(E-Cores),採用全新的Gracemont微架構,不支援超執行緒技術,最多8核心8執行緒。Gracemont是第一個支援AVX2指令集的能效核心,還支援整數AI操作新擴展、Intel控制流強制技術、Intel虛擬化重定向保護技術。

Gracemont微架構隸屬於Atom凌動家族,是繼Bonnell→ Saltwell→ Silvermont→ Airmont→ Goldmont→ Tremont之後的迭代升級版。Gracemont微架構的核心非常小,在1個Golden Cove大核心的空間裡可以塞進4個Gracemont小核心,以及它們共享的4MB二級快取。

英特爾表示,Gracemont微架構的IPC效能相比第6代酷睿Skylake提升超過40%,在同等效能下功耗則可降低40%。4核4執行緒的Gracemont對比2核4執行緒的Skylake,峰值效能可提升80%,而同等效能下功耗可降低80%。

第12代酷睿最愛Windows 11

上代Lakefield平臺之所以沒能掀起太大的波瀾,除了其自身硬體規格偏弱以外,與其配套的Windows 10系統也玩不轉大小核架構,無法發揮其應有的能效比優勢。

為此,英特爾針對第12代酷睿大小核混合架構設計了全新的「Thread Director」(執行緒排程器),並與微軟進行了深度調優,在Windows 11系統的任務排程器可更好地將合適的負載分配給不同核心/執行緒。

英特爾表示,Thread Director可以在最短30微秒的時間裡確定一個執行緒的性質、歸屬,而傳統的系統排程器需要上百甚至幾百微秒,還可能分配錯誤。此外,Thread Director還會針對性地優化頻率,尤其是在移動端,保證效率的同時還能提高能效,而且可以在微秒級別調整頻率。

換句話說,只有Windows 11系統才能「拯救」和「玩轉」大小核。

Xe HPG銳炫遊戲顯示卡駕到

在《NVIDIA和AMD嚇一跳!英特爾銳炫品牌獨顯真來了!》一文中,CFan曾報道了英特爾銳炫品牌獨顯的訊息。在英特爾架構日活動上,官方還公佈了Xe HPG架構的不少細節。

首先,英特爾銳炫顯示卡並沒有採用自家的工藝,而是由臺積電旗下的6nm工藝代工。

在過去,英特爾GPU(如UHD、銳炬Xe核芯顯示卡)的基本模組都是「EU執行單元」。在銳炫顯示卡時代,將改為「Xe核心」,每個Xe核心內都包含16個向量單元(每個向量單元還可進一步拆分成8個FP32 ALU單元),16個矩陣數學單元,零級和一級快取、載入儲存單元等等。

Xe核心的上一層級是「渲染切片」(Render Slice),專為DX12 Ultimate設計,每個包含4個Xe核心、4個光追單元、4個紋理取樣器、幾何前端、光柵前端、2個畫素後端,支援DirectX光追和Vulkan光追。

英特爾銳炫品牌下的首款產品型號是Alchemist(DG2),包含最多8個渲染切片,共享大容量二級快取,並首發支援DisplayPort 2.0。

英特爾表示,銳炫Alchemist顯示卡採用的Xe HPG微架構,相比已用於第11代酷睿核顯的Xe LP微架構,可以實現1.5倍的頻率提升、1.5倍的能效提升。目前,英特爾已經完成了核心顯示卡驅動程式元件的重新架構,特別是記憶體管理器、編譯器,號稱計算密集型遊戲的吞吐量平均提高了15%,最多可達80%,而遊戲載入時間縮短了25%。

在未來,銳炫顯示卡還會從Alchemist逐步迭代到Battlemage、Celestial和Druid。


IT145.com E-mail:sddin#qq.com