在软件方面,<em>Intel</em>对Quartus软件进行了极大的优化提升,和Agilex同步开发。<em>Intel</em>优化了重定时感知综合,包括在布局布线以及全局重定时算法方面得到了优化,从而实现它的最大性能,另外通过精细的寄存器
2021-05-20 06:00:47
「來源: |EETOP ID:eetop-1」
英特爾在半導體領域稱雄幾十年,憑藉的就是其x86架構和曾經遙遙領先競爭對手的半導體制造工藝。然而在過去的三四年,英特爾在10納米工藝上卻遇到了阻礙,甚至被曾經望塵莫及的競爭對手完成了彎道超車,並紛紛投入量產。痛定思痛的英特爾於2019年,一口氣釋出了四款基於10納米工藝的晶片產品, Agilex FPGA 正是其中一款基於英特爾10納米工藝的旗艦級FPGA產品。
經過近兩年的評估期, Agilex FPGA 已於2021年1月進行大規模量產出貨。5月13日,英特爾資料平臺事業部副總裁兼可程式設計解決方案事業部(PSG)產品營銷總經理Deepali Trehan召開媒體見面會,並在一對一採訪中向媒體披露了更多技術細節。
Deepali Trehan,英特爾資料平臺事業部副總裁兼可程式設計解決方案事業部(PSG)產品營銷總經理
效能巔峰:Agilex FPGA簡介
英特爾 Agilex FPGA 裝置採用異構 3D 系統級封裝 (SiP) 技術,集成了英特爾首款基於 10 納米 SuperFin 技術的 FPGA 架構和第二代英特爾 HyperFlex FPGA 架構,還集成了四核 Arm* Cortex-A53 處理器,以提供高度的系統整合性。Agilex代表著全行業最佳的收發速率,達到了每秒116Gbps。此外,測試晶片還可以達到每秒 224Gbps。英特爾 Agilex FPGA 目前可提供業界領先的能效和效能:
相比競爭對手的 7 納米 FPGA,視訊 IP 效能提升了 50%相比競爭對手的 7 納米 FPGA,結構效能功耗比提升了約 2 倍,有助於幫助資料中心等應用實現更加靈活、高能效的設計英特爾 Agilex FPGA 將資料中心、網路和邊緣應用的效能平均提升了 45%相比前代 FPGA,結構效能提升了高達 49%,可有效支援高速 5G 前傳閘道器應用
英特爾 Agilex FPGA平面圖(未按比例繪製)
據介紹,英特爾 Agilex FPGA 系列包含F、I、M三個系列,特別適用於需要靈活性,敏捷性和高效能的應用,例如邊緣計算,網路,雲或資料中心加速器。對於三個不同的系列,Agilex F系列在量產當中,此次重點介紹的正是該系列的產品;I系列在實驗室當中,預計將會在本季度向客戶發貨;M系列還在開發當中,目前並沒有公佈量產時間。
Agilex是原FPGA巨頭Altera在2015年底被英特爾收購、併成為其可程式設計方案事業部(PSG)後正式推出的一個全新的FPGA系列。Agilex是Agile(敏捷)和Flexible(靈活)的合二為一,而這兩個特點正是現代FPGA技術最為核心的兩大要點。除了Altera的技術積累之外,Agilex的成功更離不開英特爾核心技術的加持。對於晶片製程而言,在相同的工藝節點下,英特爾的工藝往往具有更優異的效能,這也是業界公認的事實。現如今,英特爾的十納米工藝已經達到穩定並量產,這也正是它敢於正面叫板競爭對手的底氣所在。
棋逢對手:與賽靈思的巔峰對決
隨著邊緣、5G網路以及資料中心的不斷髮展,三大領域都呈現了一個共同的趨勢,即資料的爆增,快速變化的環境,以及對於快速部署的需求。FPGA因其靈活性,在這一個發展趨勢中,越來越受到客戶的青睞。為了穩固FPGA實力和擴大市場佔比,近幾年,賽靈思和英特爾除了升級自身技術和產品陣列外,均在併購和構建生態系統方面加大了火力,進一步挖掘FPGA快速部署的上升空間。
相比其它7納米FPGA的卓越表現
Deepali Trehan提供了一系列 Agilex FPGA 與賽靈思7nm Versal進行對比的資料。英特爾 Agilex FPGA -2V FPGA 相對於 Xilinx Versal -2M 的對比資料顯示,Agilex FPGA比Versal的邏輯結構效能功耗比高約2倍,在視訊IP效能上有超過50%的效能提升,邏輯結構效能功耗比高約2倍。具體:
Warp影象轉換器快32%,OSVP 1X 可擴展視訊處理器快48%,OSVP 8X 可擴展視訊處理器快33%,MPVDMA 多埠視訊直接記憶體訪問快71%,Combiner 視訊流合併快73%據介紹,Agilex中的視訊IP塊都是由Omnitek所開發的。Omnitek是一家初創企業,主打視訊加速與推理,原來的專長是專為賽靈思的FPGA進行IP塊開發。2019年Omnitek被英特爾收購,Agilex中所使用的IP塊就是此前專為賽靈思的裝置架構來進行開發的。在Agilex上使用時,Omnitek基於Agilex的架構進行了簡要的改變,僅僅改變了記憶體和DSP例項。
FPGA是一種非常好的能夠提升能源效率的架構,可以說它的應用非常廣泛,跨整個資料中心、雲以及企業級,以及通過無線或者是有線網路來實現,包括在邊緣採取嵌入式的方式。FPGA最大的價值在於靈活性,所以它可以服務於在雲、網路和邊緣端的各種應用程式。雙巨頭格局下,且看FPGA雙雄英特爾和賽靈思還將如何創新,不斷收穫新城池。
黑科技加持:架構再次創新
據介紹,Agilex是專門為以資料為中心的世界設計的,目的是在資料的處理、儲存以及移動過程當中提供行業的領導力。Agilex的效能特徵,包括行業內最高的達到每秒116Gbps的收發速率,以及支援PCIe Gen5、CXL與至強進行聯合使用,DDR5、HBM以及傲騰持久記憶體進行相容。對於產品效能,Deepali Trehan表示,英特爾此前對Agilex效能的預期,是在最大時鐘速率(Fmax)上比上一代14nm Stratix 10提高40%,但最新的實測資料顯示是高出了45%的效能。
在設計當中,Agilex第一款完全從一開始的概念到設計、到實施、到驗證以及到最後的生產製造都是端到端在英特爾全方位開發的FPGA。我們來看看Agilex究竟是通過怎樣的設計來實現這些優勢的。
10納米SuperFin技術
Agilex FPGA是基於10納米SuperFin技術,這也是目前世界上最先進的FinFET製程技術之一。它融入了諸多新技術,比如自對齊四重曝光(SAQP)、鈷局部互連、有源柵極上接觸(COAG)等。SuperFin電晶體技術的推出,是英特爾有史以來最為強大的單節點內效能增強。憑藉該技術,英特爾實現了其新一代的10nm工藝可以媲美其初代的7nm工藝。
此外,Agilex FPGA還提供了提供面向FPGA優化的金屬層堆疊和電晶體,以及融合了英特爾專有嵌入式多晶片互連橋接(EMIB)整合的3D異構系統級封裝(SiP)技術,所有這些都有助於每瓦效能的提升,降低耗散功率,以及減少成本的支援。
新一代HyperFlex寄存器結構
英特爾在Stratix10 FPGA中首次引入了HyperFlex架構。它的主要思想就是在FPGA的佈線網路上,加入很多名為Hyper-Register的小型寄存器,這樣可以把原本比較長的時序路徑分割成多個較短的路徑,從而提升FPGA的時鐘頻率。不過HyperFlex在實際應用中還是存在很多問題,比如很多情況下並不會用到所有的hyper-register,這就需要每個寄存器都配備一個2:1選擇器用來選通。此外,這樣的架構還會帶來較大的額外延時。在賽靈思推出的ACAP中,引入了名為「Imux寄存器」的新結構,並且對上述問題進行了針對性的改進。
英特爾在第二代Hyperflex架構中也對這些問題進行了大幅度的改進,尤其是對互連路由寄存器進行了重新設計,以減少延遲和麵積,這個重構的互連結構減少了負載和延遲,用較短的線路替代了高扇出線路,增加了直接邏輯塊輸出,並使用較短的連線改進了點對點的路由,減少了延遲並且縮小了面積。並在資源配置上也進行了優化,從而降低功耗和提高效能。
基於Chiplets架構的收發器設計
Chiplets是一種物理IP模組,它代表了一種創新的方法,被認為是處理器的未來。Chiplets通過用多個較小的晶片代替一個矽晶片來有效地繞過摩爾定律,這些晶片在統一的封裝解決方案中一起工作。與單片微晶片相比,這種方法提供了更多的矽來新增電晶體。
收發器眼圖,224 Gbps PAM4測試晶片
在收發器的設計上,Agilex採取了異構基於Chiplet的一種設計,因此它可以針對具體的應用程式需求,可以適用於任何代工廠,製程節點,以及任何IP開發商,所以它真正的帶來了一種自由度,使得使用者可以根據應用的需求來具體開發行業領先的功能。僅此一項,英特爾就將單個收發器通道的速度從58Gbps提升到了代表著全行業最佳收發速率的116Gbps。
基於chiplet的開發,英特爾還在繼續挖掘。Deepali Trehan說:「Agilex I系列包括一個特別的chiplet,它支援F系列中沒有的CXL介面;M系列包括一個增強的核心結構chiplet,讓介面支援DDR5和英特爾傲騰持久記憶體。如果需要,我們現在的測試晶片還可以達到每秒224Gbps。」
進一步優化Quartus Prime軟體
在軟體方面,Intel對Quartus軟體進行了極大的優化提升,和Agilex同步開發。Intel優化了重定時感知綜合,包括在佈局佈線以及全局重定時演算法方面得到了優化,從而實現它的最大效能,另外通過精細的寄存器重新定時和時鐘偏斜排程,實現併發的建立和保持時間優化,達到籤核質量(signoff-quality)的時序分析。
Intel同時還開發了多個編譯流程來符合客戶不同的開發需求,以滿足他們提升運行時間以及快速故障排除方面的需求。通過這些在軟體方面所付出的努力,將編譯時間下降了45%。同時Intel又進行多達135種的Design Assistant規則,以便在規則方面實現好的控制。通過這些努力可以實現快速的編譯以及減少在FPGA方面的迭代的需求。
典型應用案例:SmartNIC
SmartNIC是英特爾Agilex FPGA和其至強處理器進行聯合使用的一個很好的例子。基於乙太網的NIC如今在整個網路中都得到廣泛使用,提供伺服器、CPU和其它網路處理元件的端點連線效能。英特爾在SmartNIC領域進行了大量投資,並制定了新產品的長期路線圖,以保持領先優勢。
英特爾Agilex FPGA對於快速增長的英特爾SmartNIC品類至關重要。在至強當中插入Agilex FPGA,可以用於至強處理器工作負載的加速。這樣CPU的一些管理功能進行解除安裝,它可以直接訪問CPU和RAM,而不需要用虛擬化的方式。通過全新的優化,英特爾Agilex FPGA提供比競爭對手的7納米FPGA高30%的邏輯結構效能和高2倍的結構每瓦效能,能夠為FPGA加速的應用實現更高的效能、更快速的實時功能和更低的總體擁有成本。
—— 結束語 ——
當前,處理器巨頭都在重點佈局5G、資料中心和邊緣三大領域。英特爾認為,這三大領域的需求多種多樣而且不斷變化,面臨的挑戰是繼續在核心領域取得進步,例如提高資料傳輸和處理的效能,同時還要滿足每個具體領域的獨特需求。具體來看,在5G方面,基礎設施的某些環節需要超高能效,而無線應用中常見的訊號處理功能需要高效能;在雲和企業領域,不斷變化的基礎設施和應用加速中有相當多的工作負載需要高效能和高能效;在邊緣,需要更高的計算力來滿足對更高的互動、更多富媒體內容和更低的時延的需求,同時仍需滿足嚴苛的功耗、散熱和空間限制要求。
以資料為中心的世界需要更高的能效
所有正在發生行業轉型的重要技術,包括邊緣、5G、雲端計算等,背後都是資料的爆增所驅動的。無論是網路、資料中心還是邊緣都有大量激增的資料處理要求,資料的爆增正在驅動著比以往更多的對計算力的要求。因此對於整個參與處理的所有部件以及產品,提升其效能就變得至關重要。但效能提升並不意味著功耗的下降。當前,能耗的不斷增加導致TCO(即總擁有成本,包括產品採購到後期使用、維護的成本)巨大的提升,非常缺乏可持續性,同時對環境產生巨大影響。大家都在尋求降低功耗的方式,降低功耗的目的是一方面去滿足不斷增長的資料處理需求,另一方面也要不斷提高能源效率來降低功耗,也就是說大家關注的是每瓦效能這樣的指標。越高的每瓦效能就越好,這意味著能有更優的計算力以及更少的能源消耗。
除此之外,還需要更高的靈活性。要想成功,解決方案提供商必須通過得到良好支援的開發流程快速地把處理、記憶體、數字訊號處理、專門介面和FPGA靈活性整合到高度整合化的元件中,滿足目標市場的確切需求。英特爾正在轉型以加速增長。他們已經圍繞關鍵轉折性技術建立了龐大的業務,例如雲、人工智慧、5G和智慧自主邊緣。英特爾擁有針對從邊緣到雲的工作負載的廣泛計算架構,而英特爾FPGA產品是其中的關鍵組成部分。Deepali表示:「就是對於靈活性需求非常高的時候。加速器方面,可以說發展變化十分迅速,同時會不斷湧現出新的用例。一切都是基於應用的,英特爾提供全方位的選擇,同時我們又提供統一開發的策略。」
相關文章
在软件方面,<em>Intel</em>对Quartus软件进行了极大的优化提升,和Agilex同步开发。<em>Intel</em>优化了重定时感知综合,包括在布局布线以及全局重定时算法方面得到了优化,从而实现它的最大性能,另外通过精细的寄存器
2021-05-20 06:00:47
中控屏内部搭载了斑马智行Vinus智能系统,这一系统基于<em>安卓</em>底层研发,是目前国内较为成熟且先进的车机系统。 悬浮式仪表盘 由于中控台进行了全面革新,因此原来的全液晶仪表盘样式被替换为了悬浮式液晶仪表盘
2021-05-20 06:00:20
对于下游的情况以及保持增速的原因,北京君正称,智能视频芯片是2014年开始进行产品研发的,之前没有针对这个行业的特定技术积累,但我们拥有<em>CPU</em>技术、SOC技术、低功耗技术及VPU技术等。从2014年至今,公司积累
2021-05-20 05:00:52
在16th的时候,尽管魅族的每一代旗舰都使用了<em>高通</em>的顶级芯片,但是它的速度总是比同行慢那么一拍。 魅族16sPro这次打了一场漂亮的翻身仗,直接用上了<em>高通</em>刚刚发布的骁龙855Plus平台,毕竟,目前使用855
2021-05-20 05:00:39
在Google I/O 2021上,Google宣布最新一代<em>Android</em>系统<em>Android</em> 12开启Beta测试,包括Google Pixel、小米、一加等设备,都可以通过相应的渠道抢先体验。 <em>Android</em> 12是一个从外到内都改进巨大
2021-05-20 05:00:17
基于Web的产品无处不在,并且通常非常易于使用。您可能现在正在通过手机,台式机或笔记本电脑的<em>浏览器</em>阅读文章。归根结底,机器学习模型应在不保存在玻璃盒子中的现实世界中使用。那么,有什么比通过基于Web的媒体
2021-05-20 04:30:32