上回書說到,Intel Alder Lake 12代酷睿將採用全新的大小核混合架構設計,其中大核/效能核(P-Core)基於Golden Cove架構,最多8個,小核/能效核(E-Core)基於Gracemont架構,最多也是8
2021-08-20 03:00:16
上回書說到,Intel Alder Lake 12代酷睿將採用全新的大小核混合架構設計,其中大核/效能核(P-Core)基於Golden Cove架構,最多8個,小核/能效核(E-Core)基於Gracemont架構,最多也是8個。
兩種架構的核心有何差異?一年一度的架構日活動上,Intel終於揭開了它們的神祕面紗。
當然,CPU架構設計是極為高深的,一般人把握不了,也無需研究太多,我們這裡大致過一下最關鍵的一些技術點。
Golden Cove是此前10代酷睿Sunny Cove、11代酷睿移動版Willow Cove、11代酷睿桌面版Cypress Cove的進一步升級版,但變化非常大,大量基礎模組都重構或升級,其設計理念也將影響未來多代產品的演化。
負責指令拾取和解碼的前端部分,就發生了翻天覆地的變化,號稱近十年來的最大變革,堪比當年的Skylake,官方稱它旨在提高速度、突破低時延和單執行緒應用程式效能的限制。
最直接、最明顯的就是解碼器寬度由4個升級為6個,這可是x86架構的第一次,同時每時鐘週期執行uop從6個增至8個,解碼長度從16位元組翻番至32位元組。?op快取、佇列也都大大強化,快取可達4K,佇列每執行緒可處理72條目,單執行緒達144個。
編碼預取大大增強,分支目標從5K增至12K,4K iTLB、2K/4M iTLB分別翻番至256、32,同時改進了分支預測精度,編碼預取機制更加智慧。
亂序引擎部分,同樣更寬、更深、更智慧,分配由5路增至6路,執行埠由10個增至12個,排程器尺寸增大,重排序緩衝區(ROB)從352條目增至512條目,兩倍多於AMD Zen3,僅次於蘋果M1(大約630條目),重新命名和分配階段也可以執行更多指令。
整數執行引擎部分,增加了第五個整數執行埠,所有五個埠都可以執行ALU、LEA,理論上就原生ALU吞吐能力而言是最寬的x86核心。
向量執行引擎部分,增加了新的快速加法器(FADD),比傳統FMA單元效率更高、延遲更低,FMA單元則增加支援FP16浮點資料類型,屬於AVX-512指令集的一部分。
載入和儲存部分,通過載入AGU增加了一個專用的執行埠,這樣載入埠從2個增至3個,同時載入緩衝和儲存緩衝更深,載入延遲更低,而針對當今負載不斷增加的記憶體級並行需求,資料處理能力也大大增加。
二級快取,桌面和移動端每核心還是1.25MB,伺服器端的Sapphire Rapids則增加到2MB,並支援多路徑預取、全寫入預測頻寬優化,可減少記憶體讀取。
Intel宣稱,Golden Cove架構相比於現在11代酷睿桌面上的Cypress Cove,實現了平均大約19%的IPC(每時鐘週期指令數)提升,可以理解為同頻效能的提升幅度。
它還支援AMX高階矩陣擴展指令,內建下一代AI加速技術,用於學習推理和訓練,包括專用硬體和新指令集架構,可明顯提高矩陣乘法運算。
Gracemont小核心屬於Atom凌動家族,是2008年以來的第七代,之前分別是Bonnell、Saltwell、Silvermont、Airmont、Goldmont(包括Plus版本)、Tremont。
按照Intel的說法,Gracemont核心非常迷你,一個Golden Cove大核心的空間裡,可以放入四個Gracemont小核心,以及它們共享的4MB二級快取。
別看是小核心,效能其實一點都不弱。Intel聲稱,單核單執行緒對比,Gracemont的同頻效能相比六代酷睿Skylake提升超過40%,而同等效能下功耗則可降低40%。
四核四執行緒的Gracemont對比雙核四執行緒的Skylake,峰值效能可提升80%,而同等效能下功耗可降低80%。
Intel表示,這種小核心設計可以在有限的晶片空間內,實現多核任務負載,並具備寬泛的頻率範圍,降低整體消耗,為更高頻率運行提供果功耗和散熱空間,滿足更多動態任務負載。
它還可以利用各種技術進步,在不額外增加功耗的情況下,對工作負載進行優先順序排序,並直接提升效能。
架構方面,小核心就相對簡單不少了,但變化也非常大,比如指令快取增大至64KB,可在不耗費記憶體子系統功率的情況下儲存可用指令,還有Intel的第一個按需指令長度解碼器,可生成預解碼資訊,加速現代工作負載。
同時藉助更深的分支歷史、更大的指令尺寸,分支預測精度大大增加,擁有5000個條目的分支目標快取區。
後端也更寬了,具備5組寬度分配、8組寬度引退、256個亂序視窗入口、17個執行埠,以及4個整數ALU、2個載入AGU、2個儲存AGU、2個跳轉埠、2個整數儲存資料、2個浮點/向量儲存、2個浮點/向量堆棧、以及第3個向量ALU。
記憶體部分,使用了雙載入、雙儲存單元的配置,二級快取增大至4MB,以及深度緩衝、高階預取器,支援Intel Resource Director資源重定向技術,可以讓軟體在不同核心、不同軟體執行緒之間實現精準的控制。
哦對了,Gracemont是第一個支援AVX2指令集的能效核心,還支援整數AI操作新擴展、Intel控制流強制技術、Intel虛擬化重定向保護技術。
相關文章
上回書說到,Intel Alder Lake 12代酷睿將採用全新的大小核混合架構設計,其中大核/效能核(P-Core)基於Golden Cove架構,最多8個,小核/能效核(E-Core)基於Gracemont架構,最多也是8
2021-08-20 03:00:16
大家好,我是浩南,現在大家看到的是榮耀剛剛釋出的 榮耀平板V7 Pro,據說是移動辦公,超強生產力工具的新勢力,我們一起來體驗看看吧。外觀方面正面是一個11英寸的螢幕,背面採用一個
2021-08-18 03:07:17
在日常工作中經常會使用Excel,有時需要將表格中的一列數字都加上同一個數字得出新值,該怎麼操作呢?1、如下圖表格作為示例,每個數字都加上100;2、先在一個空白的單元格中輸入數字
2021-08-18 03:07:02
8月13日,三星掌門人李在鎔已經獲得假釋。據悉,李在鎔已入獄200多天,韓國此次假釋李在鎔,將會緩解三星集團領導真空的擔憂,不過儘管李在鎔獲得假釋,但由於李在鎔本身官司纏身,日後仍
2021-08-18 03:06:48
說起國產的OLED屏,大家都感覺要比韓系廠商差一些,特別是與三星相比,品質肯定會遜色一點。原因有二點,一是三星的OLED屏起步更早,另外壟斷了眾多的先進的技術和裝置,國產要追上比較
2021-08-18 03:06:43
你會不會正在做無意義的資料分析?並沒有符合你的預期,活躍度? 假設活躍度的口徑,是使用者當天用過登入app的記錄問題1、登入app的使用者真的就算是活躍了嗎?問題2、後臺記錄的登
2021-08-18 03:05:49