<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
缺失值可能是資料科學中最不受歡迎的值,然而,它們總是在身邊。忽略缺失值也是不合理的,因此我們需要找到有效且適當地處理它們的方法。
在本文中,我們將介紹 8 種不同的方法來解決缺失值問題,哪種方法最適合特定情況取決於資料和任務。
讓我們首先建立一個範例資料框並向其中新增一些缺失值。
我們有一個 10 行 6 列的資料框。
下一步是新增缺失值。 我們將使用 loc 方法選擇行和列組合,並使它們等於“np.nan”,這是標準缺失值表示之一。
這是資料框現在的樣子:
item 和 measure 1 列具有整數值,但由於缺少值,它們已被向上轉換為浮點數。
在 Pandas 1.0 中,引入了整數型別缺失值表示 (),因此我們也可以在整數列中包含缺失值。 但是,我們需要顯式宣告資料型別。
儘管有缺失值,我們現在可以保留整數列。
現在我們有一個包含一些缺失值的資料框。 是時候看看處理它們的不同方法了。
一種選擇是刪除包含缺失值的行或列。
使用預設引數值,dropna 函數會刪除包含任何缺失值的行。資料框中只有一行沒有任何缺失值。同時我們還可以選擇使用軸引數刪除至少有一個缺失值的列。
另一種情況是有一列或一行充滿缺失值。 這樣的列或行是無用的,所以我們可以刪除它們。
dropna 函數也可以用於此目的。 我們只需要改變 how 引數的值。
基於“any”或“all”的刪除並不總是最好的選擇。 我們有時需要刪除具有“大量”或“一些”缺失值的行或列。
我們不能將這樣的表示式分配給 how 引數,但 Pandas 為我們提供了一種更準確的方法,即 thresh 引數。
例如,“thresh=4”意味著至少有 4 個非缺失值的行將被保留。 其他的將被丟棄。
我們的資料框有 6 列,因此將刪除具有 3 個或更多缺失值的行。
只有第三行有 2 個以上的缺失值,所以它是唯一一個被丟棄的。
在刪除列時,我們可以只考慮部分列。
dropna 函數的子集引數用於此任務。 例如,我們可以刪除在度量 1 或度量 2 列中有缺失值的行,如下所示:
到目前為止,我們已經看到了根據缺失值刪除行或列的不同方法。放棄並不是唯一的選擇。 在某些情況下,我們可能會選擇填充缺失值而不是刪除它們。
事實上,填充可能是更好的選擇,因為資料意味著價值。 如何填補缺失值,當然取決於資料的結構和任務。
fillna 函數用於填充缺失值。
我們可以選擇一個常數值來替代缺失值。如果我們只給 fillna 函數一個常數值,它將用該值替換資料框中的所有缺失值。
更合理的方法是為不同的列確定單獨的常數值。 我們可以將它們寫入字典並將其傳遞給 values 引數。
item 列中的缺失值替換為 1014,而 measure 1 列中的缺失值替換為 0。
另一種選擇是使用聚合值,例如平均值、中位數或眾數。
下面這行程式碼用該列的平均值替換了第 2 列中的缺失值。
可以用該列中的前一個或下一個值替換該列中的缺失值。在處理時間序列資料時,此方法可能會派上用場。 假設您有一個包含每日溫度測量值的資料框,但缺少一天的溫帶。 最佳解決方案是使用第二天或前一天的溫度。
fillna 函數的方法引數用於執行此任務。
“bfill”向後填充缺失值,以便將它們替換為下一個值。看看最後一欄。 缺失值被替換到第一行。 這可能不適合某些情況。
值得慶幸的是,我們可以限制用這種方法替換的缺失值的數量。 如果我們將 limit 引數設定為 1,那麼一個缺失值只能用它的下一個值替換。 後面的第二個或第三個值將不會用於替換。
我們還可以將另一個資料框傳遞給 fillna 函數。 新資料框中的值將用於替換當前資料框中的缺失值。
將根據行索引和列名稱選擇值。 例如,如果 item 列的第二行中存在缺失值,則將使用新資料框中相同位置的值。
以上是具有相同列的兩個資料框。 第一個 沒有任何缺失值。
我們可以使用 fillna 函數如下:
df 中的值將替換為 df2 中關於列名和行索引的值。
缺失將永遠存在於我們的生活中。 沒有最好的方法來處理它們,但我們可以通過應用準確合理的方法來降低它們的影響。我們已經介紹了 8 種不同的處理缺失值的方法,使用哪一個取決於資料和任務。
到此這篇關於Python處理缺失值的8種不同方法的文章就介紹到這了,更多相關Python處理缺失值內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45