<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
用於將資料值按照值本身進行分段並排序到 bins 中。
引數包含:x, bins, right, include_lowest, labels, retbins, precision
x :被劃分的陣列
bins :被劃分的區間/區間數
# x = [1,2,3,5,3,4,1], bins = 3 [In ] pd.cut(np.array([1,2,3,5,3,4,1]),3) [Out] [(0.996, 2.333], (0.996, 2.333], (2.333, 3.667], (3.667, 5.0], (2.333, 3.667], (3.667, 5.0], (0.996, 2.333]] Categories (3, interval[float64]): [(0.996, 2.333] < (2.333, 3.667] < (3.667, 5.0]] # x = [1,2,3,5,3,4,1], bins = [1,2,3] [In ] pd.cut(np.array([1,2,3,5,3,4,1]),[1,2,3]) [Out] [NaN, (1.0, 2.0], (2.0, 3.0], NaN, (2.0, 3.0], NaN, NaN] Categories (2, interval[int64]): [(1, 2] < (2, 3]]
right :是否包含右端點,預設為 True;
include_lowest :是否包含左端點,預設為 False;
# x = [1,2,3,5,3,4,1], bins = [1,2,3], 預設不包含左端點 1,預設包含右端點 3 [In ] pd.cut(np.array([1,2,3,5,3,4,1]),[1,2,3]) [Out] [NaN, (1.0, 2.0], (2.0, 3.0], NaN, (2.0, 3.0], NaN, NaN] Categories (2, interval[int64]): [(1, 2] < (2, 3]] # x = [1,2,3,5,3,4,1], bins = [1,2,3], 設定包含左端點 1,設定包含右端點 3 [In ] pd.cut(np.array([1,2,3,5,3,4,1]),[1,2,3],include_lowest=True,right=False) [Out] [[1.0, 2.0), [2.0, 3.0), NaN, NaN, NaN, NaN, [1.0, 2.0)] Categories (2, interval[int64]): [[1, 2) < [2, 3)]
labels :是否用標記來替代返回的 bins,預設為 False,如需標記,標記數需與 bins 數一致,併為 labels 賦值一組列表;
# x = [1,2,3,5,3,4,1], bins = 3, 設定用指定標籤 ['A','B','C'] 返回序列 [In ] pd.cut(np.array([1,2,3,5,3,4,1]),3,labels=['A','B','C']) [Out] [A, A, B, C, B, C, A] Categories (3, object): [A < B < C]
retbins : 是否返回間距 bins,預設為 False,僅返回 x 中每個值對應的 bin 的列表,若 retbins = True,則返回 bin 的列表及對應的 bins。
# x = [1,2,3,5,3,4,1], bins = 3, 設定一併返回對應 bins 序列 [In ] pd.cut(np.array([1,2,3,5,3,4,1]),3,retbins=True) [Out] ([(0.996, 2.333], (0.996, 2.333], (2.333, 3.667], (3.667, 5.0], (2.333, 3.667], (3.667, 5.0], (0.996, 2.333]] Categories (3, interval[float64]): [(0.996, 2.333] < (2.333, 3.667] < (3.667, 5.0]], array([0.996 , 2.33333333, 3.66666667, 5. ]))
precision : 精度,區間邊界值保留的小數點位數
# x = [1,2,3,5,3,4,1], bins = 3, 精度為2 [In ] pd.cut(np.array([1,2,3,5,3,4,1]),3,precision=2) [Out] [(1.0, 2.33], (1.0, 2.33], (2.33, 3.67], (3.67, 5.0], (2.33, 3.67], (3.67, 5.0], (1.0, 2.33]] Categories (3, interval[float64]): [(1.0, 2.33] < (2.33, 3.67] < (3.67, 5.0]]
基於分位數的離散化功能。 根據等級或基於樣本分位數(或者說基於樣本值落在區間的頻率),將變數分離為相等大小的桶。
引數包含:x, q, labels, retbins, precision, duplicates
[In] ll = [1,2,3,5,3,4,1,2] print('- - - pd.cut()範例1 - - -') print(pd.cut(ll, 4, precision=2).value_counts()) print('- - - pd.cut()範例2 - - -') print(pd.cut(ll, [1,2,4], precision=2).value_counts()) print('- - - pd.qcut()範例 - - -') print(pd.qcut(ll, 4, precision=2).value_counts()) [Out] - - - pd.cut()範例1 - - - (1.0, 2.0] 4 (2.0, 3.0] 2 (3.0, 4.0] 1 (4.0, 5.0] 1 dtype: int64 - - - pd.cut()範例2 - - - (1, 2] 2 (2, 4] 3 dtype: int64 - - - pd.qcut()範例 - - - (0.99, 1.75] 2 (1.75, 2.5] 2 (2.5, 3.25] 2 (3.25, 5.0] 2 dtype: int64
到此這篇關於python中pd.cut()與pd.qcut()的對比及範例的文章就介紹到這了,更多相關python pd.cut()與pd.qcut()內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45