首頁 > 軟體

瑞文的Python課堂_Pandas進階_1

2021-05-28 06:00:05

每日一城:立陶宛首都維爾紐斯

讀書筆記:《Python資料分析從入門到實踐》,每週二、四、日更新

4.1 資料計算

一、sum函數

DataFrame.sum([axis=,skipna=])

參數說明:

1)axis=1代表行累加,axis=0代表列累加

2)skipna=1表示NaN值自動轉換為0(預設)

3)返回值:返回Series物件或DataFrame物件

4)eg:df['總成績']=df.sum(axis=1)

二、mean函數

new=df.mean()

df=df.append(new,ignore_index=True)

當new為Series物件且無name時,ignore_index=True為必須

eg:df=df.append(new,ignore_index=True)

三、max、min函數

四、求中位數,median函數

DataFrame.median(axis=,skipna=,numeric_only)

參數說明:

numeric_only=False,僅計算數值型,預設無

五、求眾數,mode函數

DataFrame.median(axis=,numeric_only=False,dropna=True)

參數說明:

dropna=:是否刪除缺失值,預設為True

六、求方差,var函數

DataFrame.var(axis=,ddof=,numeric_only=True)

參數說明:

1)axis=:1代表行,0代表列

2)ddof:整型,預設為1,自由度,計算使用的除數是N-自由的,N為樣本數

七、求標準差,std函數

同var函數

八、求分位數,quantile函數

DataFrame.quantile(q=0.5,axis=,ddof=,numeric_only=True,interpolation='linear')

參數說明:

1)q:分位數

2)interpolation:指定插值方法,當期望的分位數位於兩個數值i和j之間時

線性:i+(j-i)*分數,其中分數是指i和j包圍的小數部分

較低:i

較高:j

最近:i或j都以最近者為準

中點:(i+j)/2


IT145.com E-mail:sddin#qq.com