Pandas reindex重置索引的使用

2022-06-16 18:02:18

重置索引（reindex）可以更改原 DataFrame 的行標籤或列標籤，並使更改後的行、列標籤與 DataFrame 中的資料逐一匹配。通過重置索引操作，您可以完成對現有資料的重新排序。如果重置的索引標籤在原 DataFrame 中不存在，那麼該標籤對應的元素值將全部填充為 NaN。

重置行列標籤

看一組簡單範例：

import pandas as pd
import numpy as np
N=20
df = pd.DataFrame({
   'A': pd.date_range(start='2016-01-01',periods=N,freq='D'),
   'x': np.linspace(0,stop=N-1,num=N),
   'y': np.random.rand(N),
   'C': np.random.choice(['Low','Medium','High'],N).tolist(),
   'D': np.random.normal(100, 10, size=(N)).tolist()
})
#重置行、列索引標籤
df_reindexed = df.reindex(index=[0,2,5], columns=['A', 'C', 'B'])
print(df_reindexed)

輸出結果：

A C B
0 2020-12-07 Medium NaN
2 2020-12-09 Low NaN
5 2020-12-12 High NaN

現有 a、b 兩個 DataFrame 物件，如果想讓 a 的行索引與 b 相同，您可以使用 reindex_like() 方法。範例如下：

import pandas as pd
import numpy as np
a = pd.DataFrame(np.random.randn(10,3),columns=['col1','col2','col3'])
b = pd.DataFrame(np.random.randn(7,3),columns=['col1','col2','col3'])
a= a.reindex_like(b)
print(a)

輸出結果：

col1 col2 col3
0 1.776556 -0.821724 -1.220195
1 -1.401443 0.317407 -0.663848
2 0.300353 -1.010991 0.939143
3 0.444041 -1.875384 0.846112
4 0.967159 0.369450 -0.414128
5 0.320863 -1.223477 -0.337110
6 -0.933665 0.909382 1.129481

上述範例，a 會按照 b 的形式重建行索引。需要特別注意的是，a 與 b 的列索引標籤必須相同。

填充元素值

reindex_like() 提供了一個可選的引數method，使用它來填充相應的元素值，引數值介紹如下：

pad/ffill：向前填充值；

bfill/backfill：向後填充值；

nearest：從距離最近的索引值開始填充。

範例如下：

import pandas as pd
import numpy as np
df1 = pd.DataFrame(np.random.randn(6,3),columns=['col1','col2','col3'])
df2 = pd.DataFrame(np.random.randn(2,3),columns=['col1','col2','col3'])
#使df2和df1行標籤相同
print(df2.reindex_like(df1))
#向前填充
print(df2.reindex_like(df1,method='ffill'))

輸出結果：

#填充前
col1 col2 col3
0 0.129055 0.835440 0.383065
1 -0.357231 0.379293 1.211549
2 NaN NaN NaN
3 NaN NaN NaN
4 NaN NaN NaN
5 NaN NaN NaN
#填充後
col1 col2 col3
0 0.129055 0.835440 0.383065
1 -0.357231 0.379293 1.211549
2 -0.357231 0.379293 1.211549
3 -0.357231 0.379293 1.211549
4 -0.357231 0.379293 1.211549
5 -0.357231 0.379293 1.211549

限制填充行數

reindex_like() 還提供了一個額外引數 limit，該引數用來控制填充的最大行數。範例如下：

import pandas as pd
import numpy as np
df1 = pd.DataFrame(np.random.randn(6,3),columns=['col1','col2','col3'])
df2 = pd.DataFrame(np.random.randn(2,3),columns=['col1','col2','col3'])
print (df2.reindex_like(df1))
#最多填充2行
print (df2.reindex_like(df1,method='ffill',limit=2))

輸出結果：

col1 col2 col3
0 -1.829469 0.310332 -2.008861
1 -1.038512 0.749333 -0.094335
2 NaN NaN NaN
3 NaN NaN NaN
4 NaN NaN NaN
5 NaN NaN NaN

col1 col2 col3
0 -1.829469 0.310332 -2.008861
1 -1.038512 0.749333 -0.094335
2 -1.038512 0.749333 -0.094335
3 -1.038512 0.749333 -0.094335
4 NaN NaN NaN
5 NaN NaN NaN

由上述範例可以看出，填充了 2、3 行缺失值，也就是隻填充了 2 行資料。

重新命名標籤

rename() 方法允許您使用某些對映(dict或Series)或任意函數來對行、列標籤重新命名，範例如下：

import pandas as pd
import numpy as np
df1 = pd.DataFrame(np.random.randn(6,3),columns=['col1','col2','col3'])
print (df1)
#對行和列重新命名
print (df1.rename(columns={'col1' : 'c1', 'col2' : 'c2'},index = {0 : 'apple', 1 : 'banana', 2 : 'durian'}))

輸出結果：

col1 col2 col3
0 -1.762133 -0.636819 -0.309572
1 -0.093965 -0.924387 -2.031457
2 -1.231485 -0.738667 1.415724
3 -0.826322 0.206574 -0.731701
4 1.863816 -0.175705 0.491907
5 0.677361 0.870041 -0.636518

c1 c2 col3
apple -1.762133 -0.636819 -0.309572
banana -0.093965 -0.924387 -2.031457
durian -1.231485 -0.738667 1.415724
3 -0.826322 0.206574 -0.731701
4 1.863816 -0.175705 0.491907
5 0.677361 0.870041 -0.636518

rename() 方法提供了一個 inplace 引數，預設值為 False，表示拷貝一份原資料，並在複製後的資料上做重新命名操作。若 inplace=True 則表示在原資料的基礎上重新命名。

到此這篇關於Pandas reindex重置索引的使用的文章就介紹到這了,更多相關Pandas reindex重置索引內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com！

Pandas reindex重置索引的使用

目錄

重置行列標籤

填充元素值

限制填充行數

重新命名標籤

熱門文章