<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
假如我們有一組學生成績,我們需要將這些成績分為不及格(0-59)、及格(60-70)、良(71-85)、優(86-100)這幾組。這時候可以用到cut()
import numpy as np import pandas as pd # 我們先給 scores傳入30個從0到100隨機的數 scores = np.random.uniform(0,100,size=30) # 然後使用 np.round()函數控制資料精度 scores = np.round(scores,1) # 指定分箱的區間 grades = [0,59,70,85,100] cuts = pd.cut(scores,grades) print('nscores:') print(scores) print('ncuts:') print(cuts) # 我們還可以計算出每個箱子中有多少個資料 print('ncats.value_counts:') print(pd.value_counts(cuts)) ======output:====== scores: [ 6. 50.8 80.2 22.1 60.1 75.1 30.8 50.8 81.6 17.4 13.4 24.3 67.3 84.4 63.4 21.3 17.2 3.7 40.1 12.4 15.7 23.1 67.4 94.8 72.6 12.8 81. 82. 70.2 54.1] cuts: [(0, 59], (0, 59], (70, 85], (0, 59], (59, 70], ..., (0, 59], (70, 85], (70, 85], (70, 85], (0, 59]] Length: 30 Categories (4, interval[int64]): [(0, 59] < (59, 70] < (70, 85] < (85, 100]] cuts.value_counts: (0, 59] 17 (70, 85] 8 (59, 70] 4 (85, 100] 1 dtype: int64
預設情況下,cat()的區間劃分是左開右閉,可以傳遞right=False來改變哪一邊是封閉的
程式碼範例:
cuts = pd.cut(scores,grades,right=False)
也可以通過向labels選項傳遞一個列表或陣列來傳入自定義的箱名
程式碼範例:
group_names = ['不及格','及格','良','優秀'] cuts = pd.cut(scores,grades,labels=group_names)
當我們不需要自定義劃分割區間時,而是需要根據資料中最大值和最小值計算出等長的箱子。
程式碼範例:
# 將成績均勻的分在四個箱子中,precision=2的選項將精度控制在兩位 cuts = pd.cut(scores,4,precision=2)
程式碼範例:
import numpy as np import pandas as pd # 正態分佈 data = np.random.randn(100) # 分四個箱子 cuts = pd.qcut(data,4) print('ncuts:') print(cuts) print('ncuts.value_counts:') print(pd.value_counts(cuts)) ======output:====== cuts: [(-0.745, -0.0723], (0.889, 2.834], (-0.745, -0.0723], (0.889, 2.834], (0.889, 2.834], ..., (-0.745, -0.0723], (-0.0723, 0.889], (-3.1599999999999997, -0.745], (-0.745, -0.0723], (-0.0723, 0.889]] Length: 100 Categories (4, interval[float64]): [(-3.1599999999999997, -0.745] < (-0.745, -0.0723] < (-0.0723, 0.889] < (0.889, 2.834]] cuts.value_counts: (0.889, 2.834] 25 (-0.0723, 0.889] 25 (-0.745, -0.0723] 25 (-3.1599999999999997, -0.745] 25 dtype: int64
到此這篇關於python利用pd.cut()和pd.qcut()對資料進行分箱操作的文章就介紹到這了,更多相關python pd.cut()和pd.qcut()分箱操作內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45