首頁 > 軟體

為了醫療AI,他們做出了一個「違背祖師爺」的決定

2021-05-19 21:34:33

蕭簫 曉查 發自 凹非寺 量子位 報道 | 公眾號 QbitAI

搞深度學習的人,應該感謝「祖師爺」Geoffrey Hinton在2012年的嘗試。

那一年9月30日,Hinton團隊上傳了AlexNet在ImageNet視覺識別挑戰賽的成績:

15.3%的錯誤率,比第二名低了10.8個百分點之多!

圖片

之所以能出現如此巨大的飛躍,是因為Hinton團隊使用了GPU進行AI運算加速,讓神經網路AlexNet的實現成為可能,開啟了深度學習大爆發的時代。

那一篇論文的引用量如今已超過8萬次,成為深度學習領域引用最高的論文。

Hinton徹底帶火了GPU,帶火了以計算機視覺為主的醫療AI。連Hinton本人也對AI輔助醫療技術將會迅速成熟充滿了信心。

但是,Hinton可能萬萬沒想到,現在搞醫療AI的人,尤其是落地部署和使用醫療AI的人,卻做出了一個違背「祖師爺」的決定:

CPU來做醫學影像領域的輔助診斷推理。

醫學影像領域,為何要用CPU?

從AlexNet誕生算起,GPU加速技術已發展近十年。為何醫療AI還要選擇CPU呢?

能不能落地是一個非常重要的原因。

要知道,用AI輔助醫療診斷不過才出現幾年時間,大多數醫療機構可能還沒有做好全面迎接醫療AI的準備。

作為終端使用者的醫院或醫療機構使用AI,與從事AI技術或應用研發的企業推進醫療AI的研究有很大的不同。

圖片

從事醫療AI研究的公司和機構,可以快速升級到最新的硬體,用GPU加速AI訓練。

但在真正使用醫療AI的醫院裡,頻繁升級硬體的難度很大,如果在過去的伺服器中加入GPU之類的AI加速硬體,就勢必改造系統,不僅增加成本,也會帶來更復雜的部署和應用難題。

倘若能用既有的、基於CPU的硬體架構高效、經濟、快捷地進行AI醫療的輔助診斷推理,何樂而不為呢?

一方面,醫院無需明顯增加系統和人力等成本,也無需大幅修改硬體部署,就能讓先進的AI應用更快地部署和投入實戰,真正讓醫療AI普惠到每個患者。

另一方面,在醫學影像AI方面,既有的CPU平臺,尤其是英特爾主打企業計算任務的至強(Xeon),也已經做好了準備,自然也就被熱心於醫療AI實踐的使用者們看中了。

那麼,問題來了,在GPU原本擅長的領域,CPU的能力真的可以勝任嗎?

是時候拋棄對CPU的偏見了

事實證明,只要軟硬體配合得當,CPU一樣可以實現出色的AI應用效果,尤其是進行準確、快速的AI推理。效能優化到位的話,在這方面的表現就可與GPU相媲美。

舉例來說,從去年開始影響全球的新冠肺炎疫情,對醫療機構的快速診斷能力提出了嚴峻的挑戰。國內專注醫療AI應用開發的匯醫慧影,就在這個關鍵時期推出了專攻新冠肺炎CT輔助診斷場景的AI應用系統,而且使用的就是第二代英特爾至強可擴展處理器與英特爾OpenVINO工具套件這一軟硬體組合。

結果是,OpenVINO幫助AI模型更好地利用了CPU整合的深度學習加速技術,與新冠肺炎篩查相關的肺部CT影像分析場景,在20秒內就能完成一個數據樣本的推理。

除了效能上的提升外,英特爾至強CPU+OpenVINO工具套件,在加速之餘也保證了AI模型的診斷精度不變。

其實早在數年前,浙江大學尚韻興就曾與英特爾公司合作,用至強CPU和英特爾的軟體優化工具開發過深度學習模型,用於在臨床分析甲狀腺的超聲波影像。

圖片

使用深度學習進行的甲狀腺結節檢測和定性診斷(右)

這種AI輔助診斷的準確度,當時就已經比中國甲等醫院的放射科醫生至少高出10%

當然,這並不是說醫學影像AI應用會取代醫生,而是讓影像科醫生在輔助下能有更高的工作效率,也可以讓經驗豐富的醫生專注於更復雜的病例。

當然,CPU也僅僅是AI計算硬體中的一種,而非唯一的選擇。可它越來越受到醫療AI領域的青睞,必然有更為深刻的原因:

那便是惠民。

CPU讓AI醫療更普惠

將「AI+CPU模式」推廣到醫學影像中,結果就是AI技術更容易落地,被推廣,因為用CPU做AI可以減少異構帶來的問題,開發和部署的門檻低、上手快

在國內,許多AI醫療輔助診斷案例也實實在在地說明,用CPU做AI確實降低了醫院的成本負擔,讓經費、人才和資源有限的醫院也能用上先進的AI模型。

這些AI模型對不同的醫院和患者可是一視同仁的,它讓社群醫院也能具備和大醫院相近的輔助診斷精度,患者也不必因為一些小病趕去大醫院,尤其是外地的大醫院,從而有望從技術層面上解決老百姓「看病遠、看病難、看病貴」的問題。

另一家AI醫療企業江豐生物也發現,目前醫療機構的資訊化系統,基本都基於英特爾架構的伺服器構建,如果加裝GPU將耗費高昂的成本。

通過與英特爾的合作,江豐生物基於至強CPU和深度學習技術開發了結核分枝桿菌智慧篩查系統,巧妙利用英特爾CPU多核、大記憶體的特性,採用多例項非同步併發進行處理,最終效能提升到原來的11.4倍

要知道,目前我國每年新增結核病患者約90萬例,屬於全球結核病高負擔國家之一;但同時我國肺結核患者的治療成功率又達90%以上,治療手段已經非常先進。

這說明,問題出在結核病的篩查手段上。

英特爾與江豐生物的合作,就是利用更易於使用的CPU,開發出快速檢測病理切片影象的AI方案,大大地提升了醫療機構病理檢測的生產力。

這種方案能夠保持86.8%的檢測準確率,以及88.9%的塗片級分級準確率,80秒內即能完成單例塗片的數字化掃描和塗片定量分級。

圖片

江豐生物還基於至強CPU和深度學習技術開發了宮頸液基細胞學篩查系統,宮頸癌是一種女性常見的生殖道惡性腫瘤,在全球女性的惡性腫瘤疾病中,宮頸癌發病率高居第二位。

這個項目在3萬多例宮頸液基細胞學數字影象的標註資料上,搭建了目標檢測深度學習框架。利用至強CPU和大記憶體的優勢,解決了訓練影象尺寸受GPU視訊記憶體資源約束的問題。用比GPU訓練影象尺寸大5倍的圖塊訓練得到的可疑細胞檢測模型,綜合MAP接近0.43,比用GPU訓練得到的模型漲點接近5%。

圖片

宮頸液基細胞學篩查系統-技術路線圖

江豐這些醫療AI創新成果在落地時,也體現了選擇CPU平臺的好處——模型的部署和使用都非常方便,從三級醫院至基層醫院都能快速推廣落地。

這樣,就能在極大程度上消除病理科醫生水平差異帶來的問題,病患也能通過AI及時獲得更精確的診斷,以及相配套的治療方案。

CPU做AI計算,它很難嗎?

雖然已經有了很多例項,目前仍然有許多人對CPU做AI抱有疑慮。

而這些疑慮,主要集中在計算速度生態系統這兩點上:

例如:CPU做AI計算,訓練和推理速度是不是太低了?又比如:同時,AI生態,對GPU架構的支援好像更多喲。

但英特爾,早已為CPU在AI行業的應用,做好了硬體兩手準備。

圖片

一方面,針對AI應用的算力和資料加速,英特爾早從數年前就開始佈局,從硬體架構上對AI推進了三方面的優化:

在2017年釋出的第一代至強可擴展處理器上,匯入支援AVX-512高階向量擴展技術,讓CPU單位時間內能處理更多浮點運算任務,用以加速高精度的AI應用;在2019年釋出的第二代至強可擴展處理器上,基於AVX-512技術擴展出了英特爾深度學習加速(DL Boost)技術,支援INT8加速,主攻推理加速;2020年釋出的面向四路和八路伺服器的第三代至強可擴展處理器時,為這項技術增添了BF16加速能力,從而兼顧推理和訓練的加速;在2019年推出傲騰持久記憶體,兼具接近DRAM記憶體的高效能,以及DRAM記憶體所不具備的容量、價格和資料非易失優勢,讓基於CPU的AI系統可以將更大體量的資料快取在距離CPU更近的地方,加速訓練和推理。

圖片

時間到了2021年,上述這些產品已經演進到最新的面向單路和雙路系統的第三代至強可擴展處理器,它採用進一步優化的全新微架構,基於10納米制程工藝生產,並可搭配效能進一步提升的第二代傲騰持久記憶體。據測試,它在AI效能(INT8實時推理吞吐量)上已能達到第二代至強可擴展處理器的1.74倍。

面向多路伺服器的第三代至強可擴展處理器,推理和訓練效能也分別可達到上一代產品的1.9倍1.93倍

這些測試結果也是新款至強CPU與英特爾AI優化軟體工具搭檔的成果,與硬體的創新幾乎同步,英特爾在軟體上主要乾了這些事兒:

推出可優化CPU上AI應用效能的基礎軟體工具oneDNN將oneDNN融入Tensorflow和Pytorch等AI框架,將它們改造成面向英特爾架構優化的AI框架;推出可以在大資料平臺上開展AI應用,將大資料與AI無縫對接的Analytics Zoo;釋出整合各種英特爾架構優化能力,更易部署且對影象識別、語義分割、單眼深度估計等幾乎所有CV應用提供優化的OpenVINO。

圖片

順帶一提,現在連OpenCV都支援呼叫OpenVINO後端了。(真香!)

如今看來,用CPU做AI,確實沒啥可擔心的——

甚至在醫療AI行業,這還是個更好的選擇。

大概,就連當年積極將GPU引入醫療AI行業的Hinton,也沒預料到會是這幅景象:

如今的CPU,正在醫療AI領域大放異彩。


IT145.com E-mail:sddin#qq.com