來源:Python爬蟲與資料探勘作者:崔豔飛一、前言大家好,我是崔豔飛。工作中經常會遇到,需要把兩張Excel或Csv資料表通過關鍵欄位進行關聯,匹配對應資料的情況,Excel雖有Vlookup函數
2021-06-09 14:45:32
來源:Python爬蟲與資料探勘
作者:崔豔飛
一、前言
大家好,我是崔豔飛。工作中經常會遇到,需要把兩張Excel或Csv資料表通過關鍵欄位進行關聯,匹配對應資料的情況,Excel雖有Vlookup函數可以處理,但資料量大時容易計算機無響應,可能出現數據丟失,處理速度較慢是軟肋,而Python只需幾行程式碼就能輕鬆實現,且處理速度快,詳細如下。
二、項目目標
用Python實現兩張Excel或Csv表資料關聯處理。
三、項目準備
軟體:PyCharm
需要的庫:pandas
四、項目分析
1)如何讀取要處理的Csv檔案?
利用pandas庫讀取Csv檔案。
2)如何讀取要處理的Excel檔案?
利用pandas庫讀取Excel檔案。
3)如何通過關鍵欄位關聯匹配兩張表中的資料?
利用merge()函數,通過關鍵欄位,關聯組合兩張表中的資料。
4)如何儲存結果?
利用to_csvl儲存關聯組合後的資料。
五、項目實現
1、第一步匯入需要的庫
import pandas as pd
2、第二步讀取要處理的Csv檔案
# 讀入表1
df1 = pd.read_csv('D:/a/1.csv', encoding='gbk')
3、第三步讀取要處理的Excel檔案
# 讀入表2
df2 = pd.read_excel('D:/a/2.xlsx', encoding='utf-8')
4、第四步關聯匹配資料,並儲存結果檔案
# 關聯資料
data = df1.merge(df2, on='姓名',left_index=False, right_index=False, sort=False)
# 儲存資料
data.to_csv('D:/a/result.csv', encoding='gbk',index=False)
六、效果展示
1、處理前表1資料:
2、處理前表2資料:
3、處理後的關聯匹配資料:
七、總結
本文介紹瞭如何利用Python進行Excel和Csv間的資料關聯處理,替代了Excel的Vlookup函數,由於不用顯示原始檔,節省了系統資源,處理效率更高,資料量越大,優勢越明顯,Python還有很多類似的函數,資料處理,唯快不破,有興趣的同學可以研究下,有問題隨時留言,一起討論學習。
相關文章
來源:Python爬蟲與資料探勘作者:崔豔飛一、前言大家好,我是崔豔飛。工作中經常會遇到,需要把兩張Excel或Csv資料表通過關鍵欄位進行關聯,匹配對應資料的情況,Excel雖有Vlookup函數
2021-06-09 14:45:32
小米子品牌紅米現在風生水起了,自從林斌將紅米交給盧偉冰後,盧偉冰進行了很大的整改,這讓雷軍非常滿意,盧偉冰也因此很快晉升小米合夥人,成為最快升職的職場達人。盧偉冰親手操辦
2021-06-09 14:45:08
Adobe Acrobat和Reader是美國Adobe公司PDF文件軟體,Adobe Reader免費使用,可查閱PDF文件,無法進行修改加水印等編輯操作,而Adobe Acrobat則是收費的,除了基本查閱PDF外,可進行高階
2021-06-09 14:44:56
IT之家 6 月 9 日訊息 AMD 今日正式釋出了 Radeon PRO W6000 系列工作站顯示卡,採用 RDNA 2 架構,為專業使用者提供卓越效能、穩定性以及可靠性。全新 AMD Radeon W6000 系列
2021-06-09 14:44:20
6月9日訊息,中保研在在北京召開中國保險汽車安全指數媒體釋出會,釋出了C-IASI 2020年測評結果研究報告。在2020年的測試評價工作中,C-IASI共完成23款車型的測試、釋出,其中SUV 1
2021-06-09 14:44:07
#Realme#realme 8 5G評測:輕鬆登入5G越級體驗話說realme近期很常拿到全新處理器的首發,可見realme這品牌並不是一昧只是追求價格上的破盤,而是想要讓大家可以最快享受到新科技
2021-06-09 14:25:10