馬雲打造的達摩院，奪得60餘個國際冠軍後，再次拿下中國第一

2021-06-27 19:08:19

2020年下半年，國內網際網路巨頭在社群團購市場打響的燒錢大戰，引起不少消費者的反對。

對於巨頭們靠低價搶市場，擠壓普通菜販的行為，有網友指責道：「美國的網際網路公司都在想怎麼發射火箭，你們卻在跟菜販搶生意。」

對此，人民日報也曾建議網際網路巨頭多關注一下科技創新。

在筆者看來，雖然這些巨頭們的做法的確有錯誤的地方，但他們對於科學技術同樣重視。

例如阿里巴巴的達摩院，就是馬雲打造的專門用於探索未知的科技機構。公開資料顯示，達摩院成立於2017年，至今為止已經運營4年。

在今年上半年，達摩院公佈了過去三年的成績單。根據官方資料可知，在學術方面，達摩院已經發表了1000多篇國際頂會論文，奪得60多項國際頂尖賽事冠軍。

值得一提的是，近日阿里巴巴達摩院還拿下一個中國第一。

6月25日，阿里巴巴達摩院釋出「低碳版」巨模型M6。筆者瞭解到，早在今年3月份，M6就被髮布，但彼時只是中國第一個千億多模態大模型。

僅僅時隔三個月，達摩院就將這款大模型從千億級升級到萬億級，其實力可想而知。那麼這款萬億級M6大模型到底有什麼作用呢？

前文所說的大模型，指的是參數模型，百科資料顯示，這是一類可以通過結構化表示式和參數集表示的模型。

基於上述理論的大模型被認為是下一代人工智慧的基礎設施，參數規模越大的AI模型，會具備更高的智慧上限。

但受算力成本極為高昂的原因，目前學界、工業領域對大模型潛力的研究受限。不過，達摩院釋出的這款大模型在一定程度上解決了這個行業難題。

據筆者瞭解，達摩院只用了480塊GPU就訓練出了規模達到人類神經元10倍的大模型。相比英偉達、谷歌等外企的大模型，實現了能耗降低超80%、效率提升近11倍的成績。

而之所以達摩院能夠領先谷歌等國際巨頭，主要是因為其團隊對MOE框架進行了改進和創新，擴增單個模型的承載容量。

與此同時，還利用加速線性代數、混合精度訓練以及半精度通訊等優化技術，在效果接近無損的情況下降低了所需要的計算資源。

由此可見，達摩院不愧是被馬雲寄予厚望，要求它「活得比阿里巴巴更長」的科技機構。

文/諦林稽核/子揚校對/知秋