首頁 > 硬體

安培大核心火了:中國八大巨頭集體擁抱NVIDIA A100

2020-12-16 14:00:40

NVIDIA今天在GTC大會上宣佈,多家中國頂級雲服務提供商、系統製造商都部署了NVIDIA A100 Tensor Core GPU、NVIDIA技術,為各種AI應用提速。

今年5月,NVIDIA推出了首款基於安培架構的A100 GPU,臺積電7nm工藝製造,整合多達542億個電晶體,核心面積達826平方毫米,內建6912個FP32 CUDA核心,最高加速頻率1.4GHz,搭配512-bit 40GB HBM2視訊記憶體,頻寬達1.6TB/s。

相比上代伏特架構的V100核心,它的INT8推理、FP32訓練效能提升20倍,FP64計算效能提升2.5倍,是歷史上進步最大的一次。

A100 GPU還配備了精度更高的第三代Tensor Core張量核心、GPU間傳輸率高達600GB/s的第三代NVIDIA NVLink、NVIDIA NVSwitch、PCIe 4.0、NVIDIA Magnum IO軟體SDK,可實現成千上萬個GPU叢集的高效擴充套件。

部署A100的中國雲服務商有:

- 阿里雲

已釋出gn7 GPU系列雲伺服器,內建8塊A100,主要面向AI訓練和高效能運算應用,可提供新一代GPU計算範例,相比上一代平臺AI效能提升最高20倍,高效能運算提升2.5倍。

- 百度智慧雲

即將推出lgn3 GPU系列雲伺服器、vGPU雲伺服器、百度太行裸金屬伺服器。

最多搭載8塊A100 GPU、8TB NVMe SSD、數百G頻寬,主要面向AI訓練/推理、高效能運算應用、科學計算等場景,計算能力20倍於上代V100。

- 滴滴雲

A100裸金屬伺服器,設定8塊A100 GPU、2顆AMD EPYC 7302處理器、1024GB記憶體、2個240GB SATA SSD、2個2TB NVME SSD,適用於AI、資料分析、高效能運算等多種應用場景。

- 騰訊雲

已推出雲伺服器GT4,搭配AMD第二代霄龍平臺,最高180核心vGPU,適用於深度學習訓練、推理、高效能運算、資料分析、視訊分析等領域。

部署A100的中國OEM廠商有:

- 新華三

已推出搭載8顆A100 GPU的全互聯6U伺服器H3C UniServer R5500 G5,同時全線GPU伺服器機型已同步適配升級,包括H3C UniServer R4900 G3(2U 3GPU)、R5300 G3(4U 8GPU)、R4950 G5(2U 4GPU),部分機型已完成NVQUAL認證,全面覆蓋叢集建設、大規模AI模型訓練、高效能運算、AI專案部署等應用場景。 

- 浪潮

已釋出釋出多款支援A100 40G的AI伺服器,可設定8-16顆,包括NF5488M5-D、NF5488A5、 NF5688M6、NF5888M6,還推出了三款支援A100 PCIe版本的伺服器NF5468M6、NF5468A5、NF5280M6。

配備最新A100 80GB GPU的AI伺服器NF5488M5-D、NF5488A5也已全球量產供貨。

- 聯想

推出了配備A100 GPU的HG680X,4U 8GPU規格,可滿足單機多卡需求,支援兩種拓撲形式,儲存支援最多8個NVMe SSD加16個2.5英寸SAS/SSD,或者24個2.5英寸SAS/SSD。

適用於大型深度學習模型訓練場景、大量資料的推理場景,適應不同深度學習演演算法與改進,可滿足網際網路、金融、製造等不同行業客戶的多樣化需求。

- 寧暢

X640 G30 GPU伺服器完成8卡A100的適配,並通過了NVIDIA NVQUAL的官方認證,可針對不同場景進行GPU互聯拓撲調整、升級算力。現已在客戶處完成批次部署,應用於海量資料訓練、深度學習、語音識別、影象識別等領域。


IT145.com E-mail:sddin#qq.com