瞭解深度學習的缺點：揚長避短瑜不掩瑕

2021-05-28 14:32:12

技術的兩面性

作者：閆錦鋒

考慮到深度學習帶來的所有創新和突破，很多人自然認為它是一副靈丹妙藥。深度學習的廣泛應用將意味著我們不再需要開車，甚至可能意味著我們將治癒癌症。

這怎麼可能不領我們激動和樂觀呢？這很自然且合理的。但需要注意的是，深度學習仍處於初期階段，實際上存在許多惱人的問題。降低我們的期望值是個好主意。

加里·馬庫斯

2018年，加里·馬庫斯(Gary Marcus)寫了一篇題為《深度學習：批判性評估》(Deep Learning: a Critical Appraisal)的論文，在文中他明確提出了深度學習面臨的挑戰。他在論文中指出：

在語音識別、影象識別和遊戲體驗等領域取得長足進展的背景下，以及大眾媒體對深度學習相當熱情的背景下，我提出了關於深度學習的十個應關注問題，並建議如果我們要實現人工通用智慧，深度學習必須有其他技術來補充。

馬庫斯顯然有著合適的身份來表達他的擔憂，因為他在人工智慧方面既有學術背景也有商業背景。在成為紐約大學心理學系教授之前，他把自己的初創公司幾何智慧(Geometric Intelligence)賣給了優步(Uber)。馬庫斯也是幾本暢銷書的作者，比如《人類思維的隨機構造》（The Haphazard Construction of the Human Mind）。

以下是他對深度學習的一些擔憂：

黑盒：一個深度學習模型可以很容易地擁有數百萬個參數，涉及許多隱藏層。對此有一個清晰的認識真的超出了一個人的能力範圍。的確，在識別資料集中的貓時，這未必是一個問題。但對於醫療診斷或確定石油鑽井平臺安全性的模型來說，這絕對是一個問題。在這種情況下，監管機構將希望對模型的透明度有一個良好的瞭解。正因為如此，研究人員正在試圖創建來確定「可解釋性」的系統，這可以提供對深度學習模型的理解。資料：人腦有其缺陷。但是它對一些功能做得非常好，如通過抽象學習的能力。例如，假設5歲的Jan和她的家人去一家餐館。她的媽媽指著盤子上的一個東西說這是一個「墨西哥玉米卷」。她不需要解釋或提供任何資訊。相反，Jan的大腦會立即處理這些資訊並理解整個模式。將來，當她看到另一個玉米餅時——即使它有不同，比如調料不同——她會知道它是什麼。在大多數情況下，這是直觀的。但不幸的是，當涉及到深度學習時，沒有抽象學習的「玉米餅」! 系統必須處理大量的資訊來識別它。當然，這對大型IT公司來說都不是問題。但許多公司的資料集要有限得多。結果是，深度學習可能不是一個好的選擇。層次結構：這種組織方式在深度學習中並不存在。正因為如此，語言理解還有很長的路要走(特別是長時間的討論)。

層次結構

開放式推理：馬庫斯指出，深度學習無法理解「約翰承諾過瑪麗要離開」和「約翰承諾過要離開瑪麗」之間的細微差別。此外，深度學習還遠遠不能，例如，閱讀簡·奧斯丁的《傲慢與偏見》，並能夠預測伊麗莎白·班納特的性格動機。概念性思維：深度學習不能理解民主、正義、幸福等概念。它也沒有想象力，思考新的想法或計劃。常識：這是深度學習做不好的事情。這意味著模型很容易被混淆。例如，假設你問一個人工智慧系統，「有可能用海綿製造一臺電腦嗎？」在很大程度上，它可能不知道這是一個荒謬的問題。因果關係：深度學習無法確定這一點。關鍵在於找到相關性。先驗知識：CNNs在先驗資訊方面可以有一些幫助，但這很有限的。深度學習仍然是相當獨立的，因為它只能一次解決一個問題。它不能跨越多個域獲取資料並創建演算法。此外，模型不會對資料自適應。如果資料中有變化，那麼需要對新的模型培訓和測試。最後，深入學習並沒有常人本能知道的先驗知識——比如基本物理學、基礎數學。這些都需要通過明確的程式設計納入人工智慧系統。靜態：深度學習在相當簡單的環境中最有效。這就是為什麼人工智慧對棋盤遊戲如此有效的原因，它有清晰的規則和界限。但現實世界總是混亂和不可預測的。這意味著深度學習也在複雜的問題時是不足的，甚至在自動駕駛汽車時都會出錯，。算力資源：一個深度學習模型通常需要大量的CPU能力，有時還會有GPUs。這可能會代價高昂。不過，一個備選項是使用第三方雲服務。這些缺陷可真不少。但這篇論文仍然遺漏了一些缺點。這裡有一些其他需要考慮的：

蝴蝶效應：由於資料、網路和連線的複雜性，微小的變化可以對深度學習模型的結果產生重大影響。這很容易導致錯誤或誤導性的結論。

蝴蝶效應：從局部到全局

過度擬合：我們早些時候的文章中解釋了這個概念。至於馬可斯，他最大的擔心是「被困在局部最小值，從而過度地呆在知識空間的錯誤部分，過多地關注一種特定類別的可訪問。但一些有約束模型可以適用於唾手可得的結果，進而規避更危險的短途旅行，最終可能導致更安全的搜尋路徑。」當然，他並不是一個悲觀主義者。他認為，研究人員需要超越深度學習，找到能解決棘手問題的新技術。

感謝您的閱讀，我每週都會發布幾次關於機器學習、人工智慧、程式設計和所有與電腦科學相關的內容。

往期內容：

神經網路大盤點：從遞迴神經網路、卷積神經網路到生成對抗網路

深度學習的當家花旦——人工神經網路

人工神經網路和反向傳播淺析：深度學習的起手式

什麼是深度學習？人類大腦和深度學習有何關係？

瞭解深度學習的缺點：揚長避短 瑜不掩瑕

熱門文章

瞭解深度學習的缺點：揚長避短瑜不掩瑕