首頁 > 軟體

python資料分析之如何刪除value=0的行

2022-12-11 14:01:35

前言

拿到一堆資料,首先我們是要對其進行資料的預處理,其中資料存在一些值為空或者是我們不想要的資料,對其進行刪除或者是修改資料值。下面是對於該例子進行刪除和修改:

>>> df
out[]:
   salary   age   gender
0   10000    23     男
1   15000    34     女
2   23000    21     男
3     0      20     女
4   28500     0     男
5   35000    37     男

一、資料處理

1. df.replace()方法:將“男”用1來表示,“女孩”用0來表示。

>>> df.replace(["男", "女"], [1, 0])
out[]:
   salary   age   gender
0   10000    23     1
1   15000    34     0
2   23000    21     1
3     0      20     0
4   28500     0     1
5   35000    37     1

2.  pd.DataFrame.loc()方法來指定列中資料為0的行:

>>> df = df.loc[~((df['salary'] == 0) | (df['age'] == 0))]
>>> df
out[]:
   salary   age   gender
0   10000    23     1
1   15000    34     0
2   23000    21     1
3   35000    37     1

還可以用: 

df = df.loc[df['salary'] * df['age'] != 0]

二、刪除某行方法的使用

1.刪除全行都是為0的行

程式碼如下:

>>> df.loc[~(df==0).all(axis=1)]

 看起來比較對稱可以這樣寫:

>>> df.loc[(df!=0).any(axis=1)]

使用dropna方法來刪除:

>>> new_df = df[df.loc[:]!=0].dropna()

2.用nan替換零,然後刪除所有行中資料都為nan的行。之後,將nan替換為零。

程式碼如下:

import numpy as np
df = df.replace(0, np.nan)# 把0替換成nan
df = df.dropna(how='all', axis=0)# 刪除所有為nan的行
df = df.replace(np.nan, 0)# 再把nan替換成0

3.刪除某行中某個值為0的行

程式碼如下:|

>>> df= df[df['salary'] != 0]

4.使用lambda函數來刪除行

程式碼如下:

import pandas as pd
import numpy as np
 
np.random.seed(0)
 
df = pd.DataFrame(np.random.randn(5,3),
                  index=['one', 'two', 'three', 'four', 'five'],
                  columns=list('abc'))
 
df.loc[['one', 'three']] = 0 # 把第一行和第三行改為0
 
print(df)
print(df.loc[~df.apply(lambda row: (row==0).all(), axis=1)])

輸出為:

要在任何行中刪除所有值為0的列: 

new_df = df[df.loc[:]!=0].dropna()
new_df

 輸出為:

總結

到此這篇關於python資料分析之如何刪除value=0行的文章就介紹到這了,更多相關python刪除value=0的行內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com