首頁 > 科技

馬雲打造的達摩院,奪得60餘個國際冠軍後,再次拿下中國第一

2021-06-27 19:08:19

2020年下半年,國內網際網路巨頭在社群團購市場打響的燒錢大戰,引起不少消費者的反對。

對於巨頭們靠低價搶市場,擠壓普通菜販的行為,有網友指責道:「美國的網際網路公司都在想怎麼發射火箭,你們卻在跟菜販搶生意。」

對此,人民日報也曾建議網際網路巨頭多關注一下科技創新。

在筆者看來,雖然這些巨頭們的做法的確有錯誤的地方,但他們對於科學技術同樣重視。

例如阿里巴巴的達摩院,就是馬雲打造的專門用於探索未知的科技機構。公開資料顯示,達摩院成立於2017年,至今為止已經運營4年。

在今年上半年,達摩院公佈了過去三年的成績單。根據官方資料可知,在學術方面,達摩院已經發表了1000多篇國際頂會論文,奪得60多項國際頂尖賽事冠軍。

值得一提的是,近日阿里巴巴達摩院還拿下一個中國第一。

6月25日,阿里巴巴達摩院釋出「低碳版」巨模型M6。筆者瞭解到,早在今年3月份,M6就被髮布,但彼時只是中國第一個千億多模態大模型。

僅僅時隔三個月,達摩院就將這款大模型從千億級升級到萬億級,其實力可想而知。那麼這款萬億級M6大模型到底有什麼作用呢?

前文所說的大模型,指的是參數模型,百科資料顯示,這是一類可以通過結構化表示式和參數集表示的模型。

基於上述理論的大模型被認為是下一代人工智慧的基礎設施,參數規模越大的AI模型,會具備更高的智慧上限。

但受算力成本極為高昂的原因,目前學界、工業領域對大模型潛力的研究受限。不過,達摩院釋出的這款大模型在一定程度上解決了這個行業難題。

據筆者瞭解,達摩院只用了480塊GPU就訓練出了規模達到人類神經元10倍的大模型。相比英偉達、谷歌等外企的大模型,實現了能耗降低超80%、效率提升近11倍的成績。

而之所以達摩院能夠領先谷歌等國際巨頭,主要是因為其團隊對MOE框架進行了改進和創新,擴增單個模型的承載容量。

與此同時,還利用加速線性代數、混合精度訓練以及半精度通訊等優化技術,在效果接近無損的情況下降低了所需要的計算資源。

由此可見,達摩院不愧是被馬雲寄予厚望,要求它「活得比阿里巴巴更長」的科技機構。

文/諦林 稽核/子揚 校對/知秋


IT145.com E-mail:sddin#qq.com