如果你是一名司機,你肯定會有一個感覺,如果在你熟悉的路段開車,你會熟練很多,因為你知道哪裡有岔路口,哪裡有人行道等,哪裡有紅綠燈,哪裡可能會有摩托車出現,你會有習慣性的動作保證你的駕駛安全。但如果在你不熟悉的路段,就會緊張很多,因為一切未知。
事實上自動駕駛也是如此,要想提高自動駕駛的熟練度,不僅演算法、技術要跟上,還需要進行大量的學習和訓練,就相當於你熟悉道路的過程樣。
所謂的自動駕駛的學習訓練,就是指在不同的場景下,各種應對處理方式。這就需要海量的「訓練場地」和龐大的素材資料集。而在此之前,國外廠商Waymo,擁有全球最大的2D自動駕駛資料集。
不過現在,這個全球最大的2D自動駕駛資料集,已經不再是Waymo的了,是華為的了,近日,華為諾亞方舟實驗室聯合中山大學釋出了新一代2D自動駕駛資料集SODA10M。
這個資料集有多大?包括了1000萬張無標註圖片以及2萬張帶標註圖片。來自32個城市,囊括了國內大部分地區。而帶有標註的2萬張圖片,則直接標出了6種主要的人車場景類別,分別是:Pedestrian、Cyclist、Car、Truck、Tram、Tricycle。
這個資料集的規模,可以說是之前Waymo拿下第一的那個資料集的的十倍量了。
這些資料是怎麼採集的?並沒有大家想的那麼高大上,華為通過眾包的方式,通過國內上萬名的計程車司機採集的,有些是通過手機,有些是通過記錄儀。
當然,這些照片並不是僅僅拍照就完事了,是有很多要求的,比如不同天氣條件下的採集、對地點的要求,圖片中心點的要求等等,所有的圖片最終都是要經過驗證的,不是你隨便拿手機拍一張就算合格的。
而有了這個全球最大的2D自動駕駛資料集之後,可以想象的是,未來華為的自動駕駛技術,能夠得到更有效的訓練,從而獲得更安全的、更智慧的、更高效率的自動駕駛,你覺得呢?