首頁 > 科技

手把手教你用Python實現Excel中的Vlookup功能

2021-06-09 14:45:32

來源:Python爬蟲與資料探勘

作者:崔豔飛

一、前言

大家好,我是崔豔飛。工作中經常會遇到,需要把兩張Excel或Csv資料表通過關鍵欄位進行關聯,匹配對應資料的情況,Excel雖有Vlookup函數可以處理,但資料量大時容易計算機無響應,可能出現數據丟失,處理速度較慢是軟肋,而Python只需幾行程式碼就能輕鬆實現,且處理速度快,詳細如下。

二、項目目標

用Python實現兩張Excel或Csv表資料關聯處理。

三、項目準備

軟體:PyCharm

需要的庫:pandas

四、項目分析

1)如何讀取要處理的Csv檔案?

利用pandas庫讀取Csv檔案。

2)如何讀取要處理的Excel檔案?

利用pandas庫讀取Excel檔案。

3)如何通過關鍵欄位關聯匹配兩張表中的資料?

利用merge()函數,通過關鍵欄位,關聯組合兩張表中的資料。

4)如何儲存結果?

利用to_csvl儲存關聯組合後的資料。

五、項目實現

1、第一步匯入需要的庫

import pandas as pd

2、第二步讀取要處理的Csv檔案

# 讀入表1

df1 = pd.read_csv('D:/a/1.csv', encoding='gbk')

3、第三步讀取要處理的Excel檔案

# 讀入表2

df2 = pd.read_excel('D:/a/2.xlsx', encoding='utf-8')

4、第四步關聯匹配資料,並儲存結果檔案

# 關聯資料

data = df1.merge(df2, on='姓名',left_index=False, right_index=False, sort=False)

# 儲存資料

data.to_csv('D:/a/result.csv', encoding='gbk',index=False)

六、效果展示

1、處理前表1資料:

2、處理前表2資料:

3、處理後的關聯匹配資料:

七、總結

本文介紹瞭如何利用Python進行Excel和Csv間的資料關聯處理,替代了Excel的Vlookup函數,由於不用顯示原始檔,節省了系統資源,處理效率更高,資料量越大,優勢越明顯,Python還有很多類似的函數,資料處理,唯快不破,有興趣的同學可以研究下,有問題隨時留言,一起討論學習。


IT145.com E-mail:sddin#qq.com