2021-05-12 14:32:11
如何利用Excel來進行資料分析
1、資料分析步驟:
提出問題→理解資料→資料淨化→構建模型→資料視覺化
2、實踐案例:
利用一份招聘網站的資料作為實戰案例。
第一步提出問題:
1)在哪些城市找到資料分師工作的機會比較大?
2)資料分師的薪水如何?
3)根據工作經驗的不同,薪酬是怎樣變化的?
第二步理解資料:
初始資料有6875條,14項內容。
設定表格列寬(步驟如下圖),顯示全部內容,方便後續操作,最後儲存。
第三步清洗資料:
這一步需要花費的時間佔大部分,把資料處理成自己想要的樣子。
1、選擇子集:選擇公司全名和公司ID兩列並隱藏(取消隱藏方法:全選表格→開始→格式→隱藏和取消隱藏→取消隱藏列)
2、列名重新命名:雙擊列名可以修改成自己想要的列名。
3、刪除重複值:選擇職位ID將其重複值刪除(步驟如下圖)
4、缺失值處理:選擇職位ID列計數5032,選擇城市列計數5030,城市列缺失兩個資料。
查詢並定位城市列的缺失值(步驟如下圖),缺失值填上海。
缺失值處理的4種方法,根據情況靈活使用:
1)通過人工手動補全;
2)刪除缺失的資料;
3)用平均值代替缺失值;
4)用統計模型計算出的值去代替缺失值。
5、一致化處理:對“公司所屬領域”進行一致化處理(步驟如下圖)
將原來的“公司所屬領域”列隱藏,並將複製的列進行分列:
6、資料排序:
7、異常值處理:
第四步構建模型
第五步資料視覺化
通過上面的分析,我們可以得到的以下分析結論有:
1)資料分析這一崗位,有大量的工作機會集中在北上廣深以及新一線城市,如果你將來去這些城市找工作,可以提高你成功的條件概率。
2)從待遇上看,資料分析師留在深圳發展是個不錯的選擇,其次是北京、上海。
3)資料分析是個年輕的職業方向,大量的工作經驗需求集中在1-3年。
對於資料分析師來說,5年似乎是個瓶頸期,如果在5年之內沒有提升自己的能力,大概以後的競爭壓力會比較大。
4)隨著經驗的提升,資料分析師的薪酬也在不斷提高,10年以上工作經驗的人,能獲得相當豐厚的薪酬。
3、劃重點:
1)分列功能會覆蓋掉右列單元格,所以我們記得先要複製這一列到最後一個空白列的地方,再進行分列操作。
2)上面圖片中的函數:IF(COUNT(FIND({"資料運營","資料分析","分析師"},L2)),"是","否")。
3)Ctrl+Eneter快捷鍵,在不連續的單元格中同時輸入同一個資料或公式時很好用。
4)精確查詢和近似查詢(模糊查詢)的區別
(1)精確查詢是指從第一行開始往最後一行逐個查詢。一找到匹配項就停止查詢,所以返回找到的第一個值。
(2)當你要近似查詢的時候,它就會苦逼地查遍所有的資料,返回的是最後一個匹配到的值。
5)在使用vlookup函數時,在很多情況下使用的是精確匹配,而在進行分組時需要用模糊匹配,所以這裡要輸入“1”來進行模糊匹配。
6)Excel設定了快捷鍵F4幫助用戶迅速切換相對參照、絕對參照和混合參照,步驟如下:
(1)選定包含該公式的單元格;
(2)在編輯列中選擇要更改的公式內容,並按 F4 鍵;
(3)以參照單元格A1為例,每次按 F4 鍵時,Excel會依次在以下組合間切換:
按一次F4是絕對參照
按兩次、三次F4是混合參照
按四次F4是相對參照
7)使用這個函數過程中,如果出現錯誤標識“#N/A”,一般是3個原因導致:
(1)第2個引數:查詢範圍里第一列的值必須是要查詢的值。
比如這個案例裡第2個引數選定的的範圍里第一列是姓名,是要查詢值的列。
(2)資料存在空格,此時可以巢狀使用TRIM函數將空格批次刪除。
(3)資料型別或格式不一致,此時將資料型別或格式轉為一致即可。
註:本文源自Binwu
相關文章