首頁 > 軟體

python進行資料合併concat/merge

2022-09-16 22:00:58

前言:

兩個表中的資料,要根據關鍵欄位,進行合併。
在Excel中可以使用vlookup的方式,在python中可以使用concat或者是merge的方法。

1、pd.concat

pd.concat 函數:

  • 拼接的物件可以是series,還可以是dataframe
  • 拼接物件的個數不受限axis 控制拼接方向(既支援上下拼接,也支援左右拼接)
  • 左右拼接 axis=1,左右拼接的依據是行索引;上下拼接 axis =0 ,拼接依據是列名,預設是上下拼接
  • join 指定拼接方法
    • join=“inner” 內聯,表示保留兩個表共有的行索引
    • join=“outer” 外聯,表示保留兩個表所有的行索引,預設外聯
#匯入需要的包
import pandas as pd
#建立需要的資料集:產品表
dict1={"產品編號":["CP13","CP14","CP15","CP16","CP17"],"產品名稱":["產品A003","產品A004","產品A005","產品A006","產品A007"]}
df1 = pd.DataFrame(dict1)
df1

#建立需要的資料集:詳情表
dict2={"訂單編號":["20220913","20220914","20220915","20220915"],
       "產品編號":["CP13","CP14","CP15","CP16"],
       "產品銷量":[13,24,45,32],
       "負責人":["張三","趙六","李八","李八"]}
df2 = pd.DataFrame(dict2)
df2

pd.concat([df1,df2])#預設上下拼接,拼接依據是列名;預設外聯,保留兩個表都有的索引資訊

pd.concat([df1,df2],ignore_index=True)#重置行索引

#左右拼接的依據是行索引  axis預設是0上下拼接,1為左右拼接;預設外聯(join = 'outer')
pd.concat([df1,df2],axis=1) 

#join指定了拼接方法,內聯,表示保留兩個表共有的行索引
pd.concat([df1,df2],axis=1,join="inner") 

2、 df.append

和concat上下拼接的結果類似

df1.append(df2) 

3、 pd.merge()

  • 拼接物件是dataframe或者series,左表必須是datafram
  • 拼接的數量只能是兩個
  • 拼接方向只能左右拼
#left_on寫左表進行拼接的欄位,right_on寫右表要進行拼接的欄位
pd.merge(df1,df2,left_on="產品編號",right_on="產品編號",how = 'right')
#若兩表拼接欄位名完全一樣,可寫一個on
pd.merge(df1,df2,on="產品編號")

4、 df.join

和concat左右拼接的結果類似

df1.join(df2, lsuffix='_b', rsuffix='_a')

總結

到此這篇關於python進行資料合併concat/merge的文章就介紹到這了,更多相關python資料合併內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com