首頁 > 軟體

Python pandas.replace的用法詳解

2022-06-24 14:03:09

1. pandas.replace()介紹

pandas.Series.replace 官方檔案

Series.replace(to_replace=None, value=NoDefault.no_default, inplace=False, limit=None, regex=False, method=NoDefault.no_default)

  • to_replace: 需要替換的值
  • value:替換後的值
  • inplace: 是否在原資料表上更改,預設 inplace=False
  • limit:向前或向後填充的最大尺寸間隙,用於填充缺失值
  • regex: 是否模糊查詢,用於正規表示式查詢,預設 regex=False
  • method: 填充方式,用於填充缺失值(The method to use when for replacement, when to_replace is a scalar, list or tuple and value is None.)
    • pad: 向前填充
    • ffill: 向前填充
    • bfill: 向後填充

Example

2. 單值替換

2.1 全域性替換

df.replace(1, 10)

2.2 選定條件替換

df['attr_1'].replace('場景.季節.冬天', '冬天', inplace=True)

3. 多值替換

3.1 多個值替換同一個值

df.replace([3, 11, 137], 4)

3.2 多個值替換不同值

列表List

df.replace([3, 11, 137, 1], [1, 111, 731, 10])

字典對映

# 修改不同列
df.replace({'場景.普通運動.跑步':'跑步', 11:100})

# 修改同一列
df.replace({'attr_1':{'場景.普通運動.跑步':'跑步', '場景.戶外休閒.爬山':'爬山'}})

4. 模糊查詢替換

df.replace('場景.','', regex=True)
df.replace(regex='場景.', value=' ')

df.replace(regex={'場景.': '', '方案.':''})
df.replace(regex=['場景.', '方案.'], value='')

也可以這樣

df['Attr_B'] = df['Attr_B'].str.replace('夾克', '大衣')
df

5. 缺失值替換

5.1 method的用法 (向前/後填充)

Example

向前填充(以他的前一行的值填充)

s.replace(np.nan, method='pad')
s.replace(np.nan, method='ffill')

向後填充(以他的後一行的值填充)

s.replace(np.nan, method='bfill')

5.2 limit的用法 (限制最大填充間隔)

連著多個空值時,limit為幾填充幾個

Example

s.replace(np.nan, method='ffill', limit=1)

s.replace(np.nan, method='ffill', limit=2)

補充:使用範例程式碼

#Series物件值替換
s = df.iloc[2]#獲取行索引為2資料
#單值替換
s.replace('?',np.nan)#用np.nan替換?
s.replace({'?':'NA'})#用NA替換?
#多值替換
s.replace(['?',r'$'],[np.nan,'NA'])#列表值替換
s.replace({'?':np.nan,'$':'NA'})#字典對映
#同缺失值填充方法類似
s.replace(['?','$'],method='pad')#向前填充
s.replace(['?','$'],method='ffill')#向前填充
s.replace(['?','$'],method='bfill')#向後填充
#limit引數控制填充次數
s.replace(['?','$'],method='bfill',limit=1)
#DataFrame物件值替換
#單值替換
df.replace('?',np.nan)#用np.nan替換?
df.replace({'?':'NA'})#用NA替換?
#按列指定單值替換
df.replace({'EMPNO':'?'},np.nan)#用np.nan替換EMPNO列中?
df.replace({'EMPNO':'?','ENAME':'.'},np.nan)#用np.nan替換EMPNO列中?和ENAME中.
#多值替換
df.replace(['?','.','$'],[np.nan,'NA','None'])##用np.nan替換?用NA替換. 用None替換$
df.replace({'?':'NA','$':None})#用NA替換? 用None替換$
df.replace({'?','$'},{'NA',None})#用NA替換? 用None替換$
#正則替換
df.replace(r'?|.|$',np.nan,regex=True)#用np.nan替換?或.或$原字元
df.replace([r'?',r'$'],np.nan,regex=True)#用np.nan替換?和$
df.replace([r'?',r'$'],[np.nan,'NA'],regex=True)#用np.nan替換?用NA替換$符號
df.replace(regex={r'?':None})
#value引數顯示傳遞
df.replace(regex=[r'?|.|$'],value=np.nan)#用np.nan替換?或.或$原字元

總結 

到此這篇關於Python pandas.replace用法的文章就介紹到這了,更多相關Python pandas.replace用法內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com