<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
介紹pandas資料聚合和重組的相關知識,僅供參考。
簡介:根據一個或多個鍵進行分組,每一組應用函數,再進行合併
分組的鍵有多種形式:
範例:
import numpy as np import pandas as pd import matplotlib.pyplot as plt from pandas import Series,DataFrame df =DataFrame({'key1':list('aabba'),'key2':['one','two','one','two','one'], 'data1':np.random.randn(5),'data2':np.random.randn(5)}) #根據key1進行分組,並計算data1的均值。 #注意下面的方式,取出來進行分組,而不是在DataFrame中分組,這種方式很靈活 #可以看到這是一個GroupBy物件,具備了應用函數的基礎 #這個過程是將Series進行聚合,產生了新的Series grouped = df['data1'].groupby(df['key1']) print(grouped,'n')
注:
取出來進行分組,而不是在DataFrame中分組分組鍵中的缺失值被排除在外 1.2對分組進行迭代
GroupBy物件支援迭代,可以產生一組二元元組(由分組名和資料塊組成)
groupby預設在axis=0上進行分組,但可以設定在任何軸上分組
對於由DataFrame產生的GroupBy物件,如果用一個或一組列名進行索引,可實現選取部分列進行聚合的目的,即下面語法效果相同。
假設已經知道列的分組方式,現在需要利用這個資訊進行分組統計。
下面為groupby傳入一個已知資訊的字典:
相當於將每一個列重設名,再按新的名字進行求和。
Series也有這樣的功能,被看作一個固定大小的對映,可以用Series作為分組鍵,pandas會自動檢查對齊。
將函數、陣列、字典、Series混用也ok,因為最終都會轉換為陣列
簡介:
這裡的資料聚合是說任何能夠從陣列產生標量值的過程常見的聚合運算都有就地計算資料集統計資訊的優化實現。當然不止這些,可以用自己定義的運算,還可以呼叫分組物件上已經定義好的任何方法。
例:quantile可計算Series或DataFrame列的樣本分位數。
對於自己定義的聚合函數,只需將其傳入aggregate或agg即可:
有些方法(describe)也可應用
自定義函數比經過優化的函數要慢得多,這是因為在構造中間分組資料塊時存在非常大的開銷(函數呼叫、資料重排等)
可使用的函數:
有時候需要對不同的列應用不同的函數 ,或者對一列應用不同的函數
若傳入一組函數或函數名,得到的DataFrame列就會以相應的函數命名
上面有個問題就是列名是自動給出的,以函數名為列名,若傳入元組(name,function)組成的列表,就會自動將第一個元素作為列名
對兩列都應用functions:
得到的結果的列名是層次化索引,可以直接用外層索引選取資料:
如果想對不同的列應用不同的函數,具體的辦法是向agg傳入一個從列對映到函數的字典:
到目前為止,範例中的聚合資料都是由唯一的分組鍵組成的索引(可能還是層次化的)
由於並不是總需要如此,可以向groupby傳入as_index = False禁用該功能
到此這篇關於pandas資料聚合和重組的文章就介紹到這了,更多相關pandas資料聚合內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45