首頁 > 軟體

numpy中的converters和usecols用法詳解

2022-05-30 14:01:38

用Python開啟Excel資料,讀取時需要將”學號“和“ID"轉換成字元,以便後續操作

df = pd.read_excel(path, converters={'學號': str, 'ID': str})

以下是我的經歷來體會:

我在從Excel讀入python的資料時,發現讀出的是空值:

import pandas as pd 
df=pd.read_excel("D:/Python/05DataMineML/2022STU(1).xlsx")
df

但是分明是有資料的,大概率出現的原因是sheetname(表的名稱)出現了問題。

那就試試其他的方法:

下圖是Excel的表頭,共有115行資料。

方法一:使用usecols

#獲取欄位的第一種寫法
import pandas as pd
df=pd.read_excel('../05DataMineML/2022STU(1).xlsx',usecols=['學號','姓名','20220101','20220125','20220202','20220208','20220213','20220220','20220226','20220311','20220320','20220327','20220403','randscore'],index_col='姓名',sheet_name='2022STUMOOC')
df.info()

index_col:指定作為表格的索引值
usecols:pandas讀取excel使用read_excel()中的usecols引數讀取指定的列
sheet_name:表名

重點:要使用usecols引數,sheet_name必須顯式寫出來。

方法二:使用numpy

#獲取欄位的第二種寫法:使用numpy
import pandas as pd
import numpy as np
df=pd.read_excel('../05DataMineML/2022STU(1).xlsx',converters={'學號':str},usecols=np.arange(3,16),index_col='姓名',sheet_name='2022STU')
df.head()

這裡就涉及converters:

converters={'學號':str}:將學號轉換為字元型別,以便後續操作。

這裡使用了usecols=np.arange(3,16)

方法三:使用切片區間

#獲取欄位的第三種寫法:切片區間
import pandas as pd
import numpy as np
df=pd.read_excel('../05DataMineML/2022STUMOOC (1).xlsx',converters={'學號':str},usecols=("D:P"),index_col='姓名',sheet_name='2022STUMOOC')
df

這裡使用了usecols=("D:P"),也就是使用瞭如下圖每列的序號值做切片

總結:

converters用法:轉換型別。比如將Excel資料一列從int變成str

usecols用法

usecols=[‘學號',‘姓名']
usecols=np.arange(3,16)
usecols=(「D:P」)

到此這篇關於numpy中的converters和usecols用法詳解的文章就介紹到這了,更多相關numpy converters和usecols內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com