首頁 > 軟體

如何利用Excel來進行資料分析

2020-07-14 14:34:16
Excel表格可以說是一個經常會用到的資料分析輔助工具,這裡為大家總結了利用Excel來進行資料分析的一般步驟和方法。

1、資料分析步驟:

提出問題→理解資料→資料淨化→構建模型→資料視覺化

2、實踐案例:

利用一份招聘網站的資料作為實戰案例。

第一步提出問題:

1)在哪些城市找到資料分師工作的機會比較大?

2)資料分師的薪水如何?

3)根據工作經驗的不同,薪酬是怎樣變化的?

第二步理解資料:

初始資料有6875條,14項內容。

設定表格列寬(步驟如下圖),顯示全部內容,方便後續操作,最後儲存。


第三步清洗資料:

這一步需要花費的時間佔大部分,把資料處理成自己想要的樣子。

1、選擇子集:選擇公司全名和公司ID兩列並隱藏(取消隱藏方法:全選表格→開始→格式→隱藏和取消隱藏→取消隱藏列)

2、列名重新命名:雙擊列名可以修改成自己想要的列名。

3、刪除重複值:選擇職位ID將其重複值刪除(步驟如下圖)


4、缺失值處理:選擇職位ID列計數5032,選擇城市列計數5030,城市列缺失兩個資料。

查詢並定位城市列的缺失值(步驟如下圖),缺失值填上海。


缺失值處理的4種方法,根據情況靈活使用:

1)通過人工手動補全;

2)刪除缺失的資料;

3)用平均值代替缺失值;

4)用統計模型計算出的值去代替缺失值。

5、一致化處理:對“公司所屬領域”進行一致化處理(步驟如下圖)

將原來的“公司所屬領域”列隱藏,並將複製的列進行分列:

6、資料排序:

7、異常值處理:

第四步構建模型

第五步資料視覺化

通過上面的分析,我們可以得到的以下分析結論有:

1)資料分析這一崗位,有大量的工作機會集中在北上廣深以及新一線城市,如果你將來去這些城市找工作,可以提高你成功的條件概率。

2)從待遇上看,資料分析師留在深圳發展是個不錯的選擇,其次是北京、上海。

3)資料分析是個年輕的職業方向,大量的工作經驗需求集中在1-3年。

對於資料分析師來說,5年似乎是個瓶頸期,如果在5年之內沒有提升自己的能力,大概以後的競爭壓力會比較大。

4)隨著經驗的提升,資料分析師的薪酬也在不斷提高,10年以上工作經驗的人,能獲得相當豐厚的薪酬。

3、劃重點:

1)分列功能會覆蓋掉右列單元格,所以我們記得先要複製這一列到最後一個空白列的地方,再進行分列操作。

2)上面圖片中的函數:IF(COUNT(FIND({"資料運營","資料分析","分析師"},L2)),"是","否")。

3)Ctrl+Eneter快捷鍵,在不連續的單元格中同時輸入同一個資料或公式時很好用。

4)精確查詢和近似查詢(模糊查詢)的區別

(1)精確查詢是指從第一行開始往最後一行逐個查詢。一找到匹配項就停止查詢,所以返回找到的第一個值。

(2)當你要近似查詢的時候,它就會苦逼地查遍所有的資料,返回的是最後一個匹配到的值。

5)在使用vlookup函數時,在很多情況下使用的是精確匹配,而在進行分組時需要用模糊匹配,所以這裡要輸入“1”來進行模糊匹配。

6)Excel設定了快捷鍵F4幫助用戶迅速切換相對參照、絕對參照和混合參照,步驟如下:

(1)選定包含該公式的單元格;

(2)在編輯列中選擇要更改的公式內容,並按 F4 鍵;

(3)以參照單元格A1為例,每次按 F4 鍵時,Excel會依次在以下組合間切換:

按一次F4是絕對參照

按兩次、三次F4是混合參照

按四次F4是相對參照

7)使用這個函數過程中,如果出現錯誤標識“#N/A”,一般是3個原因導致:

(1)第2個引數:查詢範圍里第一列的值必須是要查詢的值。

比如這個案例裡第2個引數選定的的範圍里第一列是姓名,是要查詢值的列。

(2)資料存在空格,此時可以巢狀使用TRIM函數將空格批次刪除。

(3)資料型別或格式不一致,此時將資料型別或格式轉為一致即可。
註:本文源自Binwu


IT145.com E-mail:sddin#qq.com