首頁 > 軟體

AI時代的安全計算——第三代英特爾至強可擴展處理器特性解讀

2021-05-31 09:30:51

2021年的第一季度,英特爾釋出了全新的第三代至強可擴展處理器Ice Lake全系列產品,新的處理器啟用了全新架構、全新工藝並帶來了大量的特性,核心數量提升至40個以上,另外還帶來了AI計算、可信計算等面向時下最流行的功能。在上市一段時間之後,英特爾又不斷優化和加強了第三代至強可擴展處理器的部分功能,使其更符合現代計算的需求。

2021年是英特爾的產品大年。在年初,英特爾釋出了全新的第11代酷睿桌上型電腦處理器和第11代酷睿H35系列處理器,將英特爾桌面和移動處理器的效能帶到了一個新的高度。接下來的三四月份,英特爾又釋出了第三代至強可擴展處理器Ice Lake全系列產品,在將處理器核心數量大幅度提升至40核的基礎上,又加入了大量的全新技術特性。5月份,英特爾又憑藉第11代酷睿H45系列處理器實現了對移動產品的全覆蓋。在如此多和如此密集的產品釋出背後,人們看到了一個在產品上銳意進取、在技術上不懈努力的英特爾。

▲英特爾第三代至強可擴展處理器帶來了多方面的提升。

對英特爾來說,產品的釋出往往是萬里長征才走完了一半,產品釋出後對產品特性和應用的持續推廣尤其是和實際市場、具體應用的結合也非常重要。這一點在英特爾第三代至強可擴展處理器上表現得特別明顯。第三代至強可擴展處理器相比上代產品整體變化非常大,其核心微架構升級、工藝進化,因此帶來了非常顯著的效能、功能提升。

根據英特爾的資料,第三代至強可擴展處理器相比上代產品在效能方面提升了46%,這裡的提升是指平均資料,在諸如人工智慧和網路計算等領域,由於新的指令集的引入,其提升幅度更高。此外,新產品在安全特性、機密計算、整體頻寬、平臺功能方面都有顯著改善。由於產品在功能和相關特性上變化巨大,因此在產品釋出前後,英特爾還持續跟蹤和接收使用者反饋,並且和客戶一起,根據新產品特性,在安全、人工智慧和機密計算方面進行了結合實際應用場景的持續研發和不斷更新。下面,本文和大家一起來分享這些新的資訊。

安全第一:英特爾在軟體防護和密碼操作硬體加速方面的進展

在全新的第三代至強可擴展處理器上,英特爾引入了兩個新的特性,一個是英特爾軟體防護擴展SGX,另一個則是英特爾密碼操作硬體加速。

先來看SGX技術。從歷史來看,英特爾對產品的安全特性一直很重視,從第六代酷睿處理器開始,英特爾就引入了相關安全特性,當時稱之為Intel Software Guard Extension,也就是現在我們看到的,在第三代至強可擴展處理器上加入的英特爾軟體防護擴展SGX的「始祖」。值得一提的是,所謂「擴展」,並不是一個功能或者一個特性,而是指通過新的擴展指令集的方式,方便軟體開發者通過直接去呼叫CPU指令來實現平臺安全隔離技術,整體設計更為底層、高效和獨特。

▲SGX是英特爾在安全技術上的一次突破。

SGX的作用也非常明白,那就是針對敏感資料提供獨立於作業系統和硬體配置的增強安全防護。這個功能的應用場景是什麼呢?舉例來說,目前企業上雲的趨勢非常明顯。企業在使用雲端計算時,資料傳輸到雲是加密的、在雲端的資料也是加密儲存的,但是在雲端計算的過程中,由於雲端伺服器要實現對資料的操作和處理,那麼這個過程的資料可能就沒有辦法很好加密了。而SGX就是提供了可以把資料中心、雲端計算伺服器中的指定記憶體區域的資料和當前的作業系統、硬體隔離開來的功能,實現敏感資料的安全處理。

▲SGX針對敏感資料提供獨立於作業系統和硬體配置的增強安全防護。

由於資料隔離,雲端資料的安全性就有了保障,伺服器的作業系統和硬體在沒有許可的情況下是不可能得到這些敏感資料的。從這個角度來看,英特爾SGX是一種基於硬體的可信執行環境,記憶體中的資料看起來依舊在記憶體中,但是隔離的特性使其成為了當前系統的「飛地」,安全性就有了保證。

英特爾宣稱他們可以讓CPU在記憶體中為單獨的應用程式劃分出單獨的區域,由CPU專門對這塊區域進行加密解密操作。這種情況下,即使是作業系統、虛擬機器管理程式這些高許可權的軟體或者攻擊者、惡意訪問者,都無法得到記憶體中加密後的資料。不僅如此,SGX保護的空間是可大可小的,最小4KB,最大1TB,基本上可以滿足目前絕大部分軟體的的需求了。

▲SGX可以對指定記憶體區域的資料和當前的作業系統、硬體隔離開來,實現敏感資料的安全處理。

在具體的客戶方面,英特爾提到阿里雲和騰訊雲目前已經開始部署相關的技術並實現了可信計算。國外的使用者比如德國的電子醫保資料也採用這個功能,符合歐盟嚴格的GDPR安全規範,讓使用者的資料隱私得到了很好的保護。

接下來則是英特爾密碼操作硬體加速。這個是一個比較好理解的概念,目前對很多敏感資料都採用密碼加密處理,對密碼的操作一般採用對稱密碼操作或者非對稱密碼操作,其中前者可以採用電子簽名這種標準的演算法來實現,但是無論如何,類似這樣的密碼操作都需要耗費CPU的算力,如果將這種標準演算法實現硬體加速以後,就可以降低CPU的算力損耗,這是非常有意義的。

▲英特爾密碼操作硬體加速帶來了非常顯著的效能提升。

在具體實現方面,英特爾提到了三個方式。一是通過CPU指令集來實現AES加密的高速度、高效率,這個指令集在2010年的時候首次應用,被稱為AES-NI,目前也在不斷的加強中。二是英特爾在每一代CPU上都針對加密解密計算做一些微架構上的調整,使得整體效能不斷提升。三則是軟體優化,通過軟體結合硬體的優化,能夠帶來密碼硬體操作的提速。

▲英特爾密碼操作硬體加速使用了第三代至強可擴展處理器的大量新特性和新的指令集。

英特爾還帶來了一些有關密碼硬體加速的案例。比如新的第三代至強可擴展處理器在計算OpenSSL RSA 2048位的簽名上,相比上一代CPU,單執行緒情況下有5.6倍的提升,在進行AES-GCM對稱加密方式的情況下,相對上一代產品,單執行緒情況下有3.3倍的提升,這個提升幅度是相當可觀的。

在非對稱加密解密方面,英特爾也提到了一些功能優化,比如藉助AVX-512指令集實現相關計算加速,英特爾舉例稱第三代至強可擴展處理器通過VPMADD52指令,再通過多快取並行操作的機制,在RSA 2048這樣一個電子簽名的操作上實現比上一代CPU高達5.6倍的提升。在密碼學的伽羅華域方面,英特爾採用V AES和V CL Multiply提升了效能。軟體優化方面,英特爾實現了多快取並行執行和函數級別的縫合技術,後者可以實現不同格式的加密計算的一次性處理,大大提高了計算效率。

AI無處不在:智算領先

在之前的介紹文章中,我們曾提到第三代至強可擴展處理器在AI計算方面做出了很大加強,其中一個重要的改進就是AVX-512,英特爾是目前業內唯一支援AVX-512指令集的廠商,另一個是AI加速有關的指令集。藉助於這兩個方面的加速和軟體的優化,英特爾宣稱新的第三代至強可擴展處理器相比上代產品提升了74%的AI計算效能,比競爭對手快了大約25倍,不過這樣的資料應該是在比較極端的狀態下實現的。此外,英特爾在軟體上持續投入,比如英特爾在TensorFlow上優化了ResNet的效能,相較於預設發行版可以提升10倍。在Scikit-Learn上經過優化,相比非優化版本獲得了100倍的效能提升。

▲英特爾第三代至強可擴展處理器在AI計算上有了長足進步。

由於英特爾在AI計算上很好的優化,因此帶來了非常領先的計算優勢和具體應用場景的優勢。在這一部分,英特爾給出了兩個例子,一個是在數字娛樂方面的優化,比如目前人們在遊戲中常見的捏臉技術,可以使玩家在遊戲中獲得非常出色的角色融入感。有關「捏臉」和相關應用,英特爾在這裡做了一個非常好的嘗試,那就是利用AI,通過使用者上傳人臉照片,自動和遊戲內的3D模型耦合,這裡利用到了第三代至強可擴展處理器的VNNI指令集,僅僅使用int8整數計算,就完成了2D人臉模型到3D遊戲模型的轉換,相比傳統需要使用FP32的計算,第三代至強可擴展處理器和新的指令集帶來了4.23倍的效能提升,同時技術和應用也非常簡單。第二個例子是英特爾和阿里雲在一起針對自然語言進行優化,利用的也是第三代至強可擴展處理器的VNNI int8相關特性,實現了3倍的效能提升。

▲英特爾和阿里巴巴合作的相關情況。

▲英特爾和平安科技合作帶來了提供了邊緣端隱私安全。

除了上述AI加速的內容外,英特爾在AI資料的安全方面也有很多獨特的創新。比如藉助第三代至強可擴展處理器的SGX技術配合AI計算,可以實現資料不用離開當前的機房就能夠完成AI模型訓練,這種技術被稱為「聯邦學習技術」。由於資料不用離開機房,因此在安全防護、資料控制方面就更為方便,因此受到了很多敏感資料使用者的歡迎,比如金融企業。英特爾和銀聯就推出了名為Analytics Zoo的新技術,此外英特爾還和平安科技進行合作,實現了基於英特爾SGX技術加持的雲邊協同的隱私計算實踐方案,其特點也是在SGX的控制下,資料模型中包含的敏感資訊不會被威脅或者竊取,即完成了工作、提高了效率,還加強了資料安全性,整體效果很不錯。

▲英特爾和銀聯合作帶來了Analytics Zoo技術。

機器學習和隱私保護:安全效率兩不誤

在上文,我們介紹了一些安全和AI計算的相關內容。在這一部分,主要談及個人隱私和機器學習有關的內容。

目前全球各國對隱私保護都越來越嚴格,比如我國有《個人隱私保護法》,歐盟有GDPR,美國加州有CCPA等法律。這些隱私保護法律對個人隱私的獲取、使用都規定的越來越嚴格。具體到現在的AI計算來看的話,很多AI計算都留不開個人資訊的收集,比如人臉資訊、醫療資訊、個人行為和操作等。目前有三類資料保護亟待研究,一個是訓練的模型資料,比如從千百萬使用者採集來的資訊進行模型訓練,這些資訊是非常敏感的。二則是模型資料,這些模型資料是通過機器學習、機器訓練而來,其資料本質是千百萬使用者的行為,因此也需要保護並且很多資料模型還涉及部分敏感資訊,這就更加重要了。三是預測結果,比如模型根據資料給出的預測結果,具體到個人或者某個具體的群體的話,那也必須保護起來,不能被非法、無序使用。

▲深度學習中的隱私問題很難處理。

在這種情況下,英特爾提出的解決方案是結合前文提到的SGX,聯邦學習等功能來實現資料的管控和處理。另外,SGX還有包括遠端認證等功能,可以實現操作的每一方的遠端互相認證,這就解決了操作中的可信問題,打破資料孤島。與常規的其他的一些隱私保護或者是安全技術相比,不管是在安全性、效能和可用性方面,SGX都有明顯的優勢。SGX是一個硬體級的安全技術,整體計算效能也非常出色。易用性方面,SGX不會打破現有應用方式,也不會重新構建底層,更不會破壞資料和模型,整體遷移性、易用性都很出色。

▲結合SGX,英特爾帶來了AI計算的隱私保護。

在一些具體案例方面,英特爾給出了一些例子包括通過SGX技術、LibOS技術,以及Analytics Zoo現有的API和例項給使用者構建一個可信的大資料AI平臺。其中最典型的就是螞蟻集團的Occlum LibOS項目,這是一個開源的LibOS項目,現在的情況是通過Occlum LibOS,可以在SGX上運行的應用越來越多了。除了之前講到的深度學習應用,一些大資料的比如說Spark、Flink、Hadoop都可以無縫通過Occlum LibOS運行在SGX當中,從而帶來了極高的安全性。

▲LibOS和SGX結合起來,實現了應用的易用性和安全性。

▲英特爾SGX助力聯邦學習。

▲基於SGX的大資料和機器學習隱私計算。

▲英特爾展示螞蟻集團的Occlum LibOS項目。

▲英特爾展示第三代至強可擴展處理器在隱私和大資料計算方面的效能優勢。

從英特爾本次會議給出的資訊來看,未來計算的發展方向一定是和效率、安全高度相關。在效率方面,英特爾通過第三代至強可擴展處理器已經實現了計算能力的飛躍,在安全方面,SGX技術配合相關的AI計算、隱私保護等功能,英特爾也帶來了目前業內最領先的安全管理技術之一,並且已經和多家企業合作落地,實現了技術和應用的結合。總的來說,第三代至強可擴展處理器在釋出後僅僅數個月就帶來了如此多改變業內應用模式的方案和應用案例,確實體現了英特爾在企業級市場上的統治力。


IT145.com E-mail:sddin#qq.com