首頁 > 軟體

Arm釋出了移動Armv9 CPU微體系結構 它們將構成新晶片的基礎

2021-05-28 04:31:10

編譯:lee

又到了一年中的這個時候,今年早些時候,ARM引入了ARMv9體系結構,旨在重新想象現代處理器。重點是人工智慧、DSP(照片和視訊處理)和改進的安全性。現在新架構的優勢可以在實際產品上進行評估。

在上個月Arm的釋出會之後最新基礎設施Neoverse V1和Neoverse N2現在是移動IP的時候了。今年,things Arm比以往任何時候都有了更大的變化,因為我們看到了三個新一代的移動和客戶端微體系結構:旗艦級Cortex-X2核心,Cortex-A710形式的A78後續產品,以及多年來第一次,一個全新的小核心與新的Cortex-A510。這三個新的cpu組成了一個新的三個Armv9相容設計,旨在標誌著一個更大的架構/ISA轉變,而這在業界來得非常少。

除了新的CPU核心,我們還看到了新的L3和DSU-110叢集設計,Arm也在其互連IP上進行了重大升級,新的快取一致性CI-700網狀網路和NI-700片上網路IP。

Cortex-X2、A710和A510緊隨去年的X1、A78和A55。特別是對於新的Cortex-X2和A710來說,它們是其前身的直接微體系結構繼承者。這些部分在重複IPC和效率方面的一代代改進的同時,還以Armv9和新的擴展(如SVE2)的形式包含了全新的架構特性。

Cortex-A510是Arm的新小核心,是一個更大的微體系結構飛躍,因為它代表了Arm的 Cambridge CPU設計團隊的一個全新的CPU設計。A510帶來了大量的IPC改進,同時仍然繼續關注功耗效率,而且,也許最有趣的是,它在順序微體系結構中保留了它的特性。

新解決方案的旗艦和明星是Cortex-X2核心,它是Cortex-X1的繼承者,後者成為Exynos 2100和Snapdragon 888晶片的一部分。與上一代相比,其預期效能提高了16%。我們知道,核心將在智慧手機和膝上型電腦的旗艦平臺上得到應用。

不過,儘管Cortex-X2的地位很高,但主要的新產品是Cortex-A510核心,它取代了Cortex-A55,而Cortex-A55是晶片製造商大量安裝在處理器上的。與Cortex-A55相比,新的節能核心效能提高了35%,而且能效也提高了20%。

Armv9 CPU系列–AArch64僅用於所有實際用途

新的CPU系列標誌著多年來最大的體系結構飛躍之一,因為ARMD公司現在正在將所有三個新的CPU IP都放在Armv9.0上。新的Arm架構的細節早在三月底就有報道。新的ISA的基礎特性包括:新註冊了以前的可選/缺失的Armv8.2功能,這些功能在移動和客戶端設計中沒有得到保證(主要是由於舊的A55核心),以及新的SVE2 SIMD和向量擴展的引入。

我們期待已久的一個重大變化是,我們將看到即將到來的arm cortex-a移動核心中,32位AArch32執行模式將遭到抨擊。從那以後,32位應用程式退出歷史舞臺只剩下時間的問題。直到2019年穀歌宣佈,谷歌Play store將要求64位應用程式上傳,該公司將在今年夏天晚些時候停止向64位相容裝置提供32位應用程式

雖然Arm宣佈這一轉變將在2023年實現,但就所有意圖和目的而言,明年大多數全球使用者都已經在發生這種轉變。Cortex-X2旗艦核心和Cortex-A510小核心都是AArch64專用的微體系結構,不再能夠執行AArch32程式碼。

話雖如此,敏銳的讀者會注意到,三個CPU中有兩個不是放棄,這是因為Cortex-A710實際上仍然支援AArch32。Arm表示,這樣做的原因主要是為了滿足中國移動市場的需求,因為中國移動市場缺乏全球Play商店市場的同類生態系統功能,而中國廠商及其國內應用市場需要多一點時間來推動向僅64位的轉變。這意味著明年我們將有一個奇怪的情況,那就是隻有SoC能夠在其中級核心上執行32位應用程式,而這些應用程式被降級到A710核心中級,而錯過了A510核心的小功率效率或X2核心的效能。

在大核心方面,新的Cortex-X2和Cortex-A710是Cortex-X1和Cortex-A78的繼承者。這兩種設計都是由Arm的Austin設計團隊設計的,代表了4第這個微體系結構家族的一代幾年前就開始使用Cortex-A76,,在Arm藉助明年的新Sophia核心將其移交給全新設計之前。這些核心應該是這個微體系結構家族中的最後一個產品。

在設計理念方面,X2和A710總體上保持了X1和A78所定義的總體目標:X系列繼續專注於通過增加微體系結構來提高效能,並通過Arm願意在合理範圍內對功率做出妥協。同時,A710繼續致力於通過更智慧的設計來提高效能和效率,並將重點放在最大化IP的功率、效能和麵積(PPA)平衡上。

Arm在上面的幻燈片中指出的一點是為持續的電壓操作優化關鍵路徑和物理設計-這更像是該公司在下一代「中間」核心中努力實現的目標,而不是在Cortex-A710中特別體現的目標。

ARM宣佈將形成新晶片基礎的核心和視訊加速器

今年,我們終於看到了一個新的小核心。早在2017年就報道過Cortex-A55,從那時起就再也沒有看到過對Arm的小核心進行任何更新,以至於它被視為上幾代移動SOC的一大弱點。

新的Cortex-A510是Arm Austin設計團隊的一個全新設計,它充分利用了該公司更大核心中採用的許多技術,但在一個新的有序小微體系結構中得到了實現。是的,我們仍在討論有序核心,Arm仍然認為這是獲取移動裝置最佳效率和「使用天數」的最佳選擇。

實際上,A510的功能比Cortex-A57強大,並且比Cortex-A73增強了一點。建議將AI學習效能提高3倍。該公司的幻燈片顯示,在這方面它的效能優於Cortex-A78(可能是由於採用了新架構)。

保證功耗增加10%,Cortex-G710核心功耗降低30%。在Cortex-A78的背景下,效能更好。

Mali-G710圖形是Mali-G78的延續,效能和能源效率提高了20%,ai學習效能提高了35%。它是使用第三代Valhall架構創建的,每個核心的每個時鐘週期已躍升至64個FMA。

最近釋出的所有GPU的另一個重大決定是轉向所謂的命令流介面(CSF),以取代自最早的Mali GPU以來一直使用的Mali 任務排程器。它還帶來了與Vulkan相關的改進,新的GPU固件,更低的延遲和更低的資源消耗。Mali-G710將提供7-16個著色器核心。

Mali-G610是Mali-G710的類似產品,但核心數量較少(從1到6)。在Mali-G510的情況下,效能也會更好。以及專為可穿戴裝置設計的Mali-G310。

儘管它是一個有序的核心,Arm做了一個比較,認為新設計與2017年的旗艦核心Cortex-A73非常相似,實現了非常相似的IPC和頻率功能,同時消耗了更少的功率。

新設計還提供了一個非常有趣的共享複雜方法,並與第二個核心共享L2和FP/SIMD管道,設計方法Arm稱之為「合併核心」,無疑會讓讀者想起10年前AMD在推土機堆芯中的CMT方法,儘管在方法上存在相當重要的差異。


IT145.com E-mail:sddin#qq.com