首頁 > 軟體

應對複雜計算新挑戰,Arm罕見陣容高築競爭壁壘

2021-05-28 10:31:49

在上一波移動應用的發展浪潮中,Arm抓住了移動計算的紅利,成為全球半導體晶片IP龍頭。面向未來更細分、更復雜的應用場景需求,IP市場競爭趨於細化,一方面新的開源架構正在崛起,另一方面,其他IP玩家也在通過持續的優化升級強化專長。

面向下一波計算浪潮,IP行業格局會否被重塑?Arm高築壁壘的意志可見一斑。今年以來,先是通過Armv9升級架構,日前,又釋出了全新的全面計算戰略,通過全平臺的產品組合和升級,以進一步挖深、挖寬護城河。

Arm 高階副總裁兼終端裝置事業部總經理Paul Williamson介紹,這是Arm歷年來最大陣容的產品釋出,這些產品都是基於全新的Armv9架構。全面計算解決方案旨在針對不同的應用場景提供更優的解決方案,實現更快的速度,打造更好的使用者體驗。

全面計算為未來計算平臺提供基礎

其實在2019年,Arm就提出要在共同架構下推動全面計算。Arm當時所看到的是:產業發展已經來到關鍵的十字路口,業界在解決整合問題時面臨一個重大挑戰:單個IP與碎片化的解決方案在優化時面臨挑戰。

這意味著,在解決系統創新設計的挑戰時,要從IP設計開始就在思考方式上做出重大轉變。Arm的關注焦點從單一的產品演進,轉化為以應用場景與體驗為導向的系統解決方案,對IP、軟體以及工具本身以及彼此的協作進行全面優化。

Arm全新的IP設計思路可以歸納為兩點:一是以應用場景、消費者體驗與生態系統的需求為核心,二是深度聚焦在效能、安全性與開發人員介入權的優化。從而為未來的計算平臺提供安全的基礎,提升效能與效率,給予開發人員通過整個Arm生態系統獲取更多效能的機會。

Paul Williamson表示,在全面計算的概念下,IP的PPA也許不再是最重要的,反而是系統級的效能尤為重要。此外,要確保開發者擁有最佳的開發體驗、並且對每一臺裝置的效能與安全功能都有更簡易的取用途徑。

再提全面計算有何不同?

時隔兩年,Arm再次提出全面計算有了更為清晰的產品佈局和更為完善的路線圖,全新的IP套件包括:首批 Armv9 Cortex CPU、出貨量持續位居全球榜首的Mali GPU 和全新的 CoreLink 系統 IP。

Arm Cortex CPU:全面計算解決方案的基石

最新推出的Armv9架構,成為Arm面向未來計算進行整體規劃的重要基石。三款基於Armv9架構的CPU核包括:旗艦級Cortex-X2、大核 CPU Cortex-A710、高效率小核Cortex-A510。

其中,Cortex-X2 主要面向智慧手機市場,比當前旗艦型安卓智慧手機的效能還高出 30%。除了峰值效能外,Cortex-X2 還可在旗艦智慧手機和膝上型電腦之間擴展,使合作伙伴可以根據市場需求來設計基於不同場景的計算能力。

Cortex-A710 是首款基於Armv9 架構的大核CPU,與Cortex-A78相比,能效提升30%,效能提升10%。通過效能和效率的提升,當智慧手機運行高要求的App時,使用者將獲得比以往更長的使用時間以及更優化的體驗。

Cortex-A510是Arm 過去四年來推出的首款高效率小核,其效能提升35%,機器學習效能提升超過3倍。它所帶來的效能水平已經接近幾年前推出的上一代大核Cortex-A73,效能差距不到10%,但能效優化可達35%,適用於智慧手機、家用裝置和可穿戴裝置。

據Paul Williamson介紹,在Arm釋出Cortex-X1前,普遍為「4大核+4小核」的結構設計。釋出X1後,出現了「2超大核+2大核+4小核」或「1超大核+3大核+4小核」的Tri-Cluster CPU架,不同的架構組合分別應對不同的負載需求。

在消費應用中常見的「1超大核+3大核+4小核」的架構中,如果將X1替換為X2,A78替換為A710,A55替換為A510,DSU替換為DSU-110。通過對比Armv8.2世代和Armv9世代,預計尖峰效能將會提升30%,持續效能將會提升30%,小負載效能將會提升35%。

面向細分市場的新款 Arm Mali GPU套件

視覺體驗仍然是消費者與裝置互動、並享用裝置的關鍵,Arm 新推出面向廣泛應用的多款 GPU,搭配Armv9 CPU,繼續提升使用者體驗。

最新的Arm Mali-G710 是針對旗艦智慧手機和Chromebook筆記本市場的高效能 GPU,在計算密集型體驗方面的效能提升 20%(如AAA高保真遊戲)。對於與機器學習有關的任務(如全新相機和視訊模式的影象增強),Mali-G710 也帶來35%的機器學習效能提升。

Mali-G610可以說是一款次旗艦GPU,繼承了Mali-G710 的功能,但價格更低,可將高階應用場景帶給更多的開發者和消費者。

Arm Mali-G510 實現了效能和效率的較好平衡,在中端智慧手機、旗艦智慧電視和機頂盒上,實現了100%的效能提升以及22%的節能優化,從而延長了電池續航時間,提升了100% 的機器學習效能。

Arm Mali-G310 是Arm目前最高效的GPU,以最小的面積成本提供了最高的效能。通過 Mali-G310,Valhall 架構和高質量圖形技術將被引入到更低成本的裝置中,例如入門級智慧手機、AR 裝置和可穿戴裝置。

提升系統性能的互連技術

互連技術對於提高系統性能至關重要。最新的CoreLink CI-700一致性互連技術和CoreLink NI-700片上網路互連技術,可與 Arm CPU、GPU和NPU IP無縫搭配,跨 SoC 解決方案增強系統性能。CoreLink CI-700 和 CoreLink NI-700 對新的 Armv9-A 功能提供硬體級支援,如記憶體標籤擴展(Memory Tagging Extension),支援更高的安全性、改進的頻寬和延遲。

可以看出,全新的全面計算解決方案是系統範圍內整體優化的思路,橫跨硬體 IP、物理 IP、軟體、工具和標準,能夠為合作伙伴提供更為廣泛的選擇,以滿足細分市場的應用場景和成本區間需求。同時,這也將解鎖整個生態系統的新體驗,例如,專為移動裝置設計、支援 AI 功能的互動式應用場景,可以使使用者身臨其境觀看電視8K 內容等體驗。

2023年移動應用僅提供 64 位大、小核

隨著IP戰略的升級,Arm宣佈,將在2023 年,面向移動應用僅提供64位的大核和小核。為此,Arm全球合作伙伴正在努力確保所有App都將在今年年底前支援 64 位。

據Paul Williamson介紹,Cortex-X2是完全面向智慧手機市場的產品,預計在未來幾代手機產品中就能看到Cortex-X2的身影。對智慧手機和其他終端計算裝置而言,64位將提供終極的效能表現。Arm目前正與中國應用商店生態合作伙伴進行密切協作,確保主要App都能在今年年底前支援 64 位,從而為中國消費者提供Cortex-X2所帶來的效能提升體驗。

Arm方面產品專家透露,向64位過渡需要分階段實現,目前,Cortex-X2、Cortex-A510已經是64位CPU,A710仍然支援32位。預計到2023年,Arm在移動應用的大核跟小核都將僅支援64位。

全面計算+生態合作高築競爭壁壘

未來,在滿足靈活多樣的市場需求面前,IP設計始終面臨挑戰。特別是對一些複雜用例,畢竟更多的IP就意味著更大的優化挑戰。Paul Williamson表示,Arm全面計算框架提供了跨多種應用的可擴展性,與此同時,也能夠為具體的場景用例提供特定的加速或增強功能,這在真實的用例中非常有價值。在一致的開發框架和特定的加速功能下,全面計算解決方案既能針對應用場景構建優化的解決方案,同時也能平衡解決方案的效能和成本,這是下游設計真正需要的。

來自Arm的最新統計資料顯示,2020年的最後一個季度,Arm 晶片合作伙伴共出貨73 億顆 Arm 架構晶片(年增 22%),創下出貨量歷史新高,相當於每秒出貨超過 900 顆晶片、每日出貨 7000 萬顆晶片。Arm 的合作伙伴在 2020 年總出貨量高達 250 億顆 Arm 架構的晶片(年增 13%)累計總數已超過 1,900 億。

此外,Arm 的 GPU 出貨量累計超過80 億,其中在2020年超過10億,Arm Mali GPU持續位居全球GPU出貨量榜首。

授權業務方面,2020 財年,Arm與 104 家客戶簽署了162個授權協議,其中有超過一半的授權物件為首次與 Arm 合作的企業。

除了授權業務,Arm聯合合作伙伴所建立的IP、晶片、應用的一體化生態,也形成了其他對手暫時無法逾越的生態壁壘。Arm 生態系統近期的新客戶包括 SEMIFIVE 與 Telechips。此外,Arm Flexible Access 目前已有 90 家合作伙伴,通過該計劃,這些合作伙伴可以更容易地獲取各項全球領先的 Arm IP、工具與支援。

Paul Williamson 表示:「我們正致力於將Armv9技術引入各個領域,以系統級設計最大程度地提高效能。藉助移動生態系統的規模優勢,在膝上型電腦、桌上型電腦、雲等應用領域打造領先的解決方案。」不止如此,Armv9 還希望延伸到5G網路、資料中心、以及更多終端與車載架構計算。

這一勢頭正是Arm對全球資料實現用Arm技術進行處理的預期,不論是在終端、資料網路還是在雲端,Arm希望構建一個龐大、順暢、無縫的計算執行網路。


IT145.com E-mail:sddin#qq.com