<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
今天本人在趕學校課程作業的時候突然發現groupby這個分組函數還是蠻有用的,有了這個分組之後你可以實現很多統計目標。
當然,最主要的是,他的使用非常簡單
本期我們以上期作業為例,單走一篇文章來看看這個函數可以實現哪些功能:
(本期需要準備的行囊):
這是一個函數,一般作用於dataframe上,有返回值,不改變原變數。輸出的是原dataframe按照傳入引數分組後的結果。
我們一通引入獲得了一個dataframe,按照“user”進行了分組,發現得到的是一個dataframegroupby物件。這個物件內部是什麼呢?我們用遍歷迴圈來看看:
for i in f.groupby("user"): print(i)
發現這個物件內部是一個個元組,每個元組的第一個元素是我們設定的分組依據的值
(例如這裡我們設定的分組依據是user,這裡第一個元組包含的是user為19500時的所有記錄,元組第一個元素就是19500)
而當我們輸出元組裡的第二個元素的時候,發現得到的是類似dataframe的結果
看前面user下面的資料,整齊劃一,是不是?o(〃^▽^〃)o
文章中所用資料為某時段內消費者的行為資料。user為消費者編號,brand為品牌編號,behavr為消費者行為(0代表瀏覽,1代表購買,2代表收藏,3代表加入購物車。且允許存在不瀏覽直接購買的行為)
接下來我們要針對這些資料進行處理,輸出一些有用的結果
因為要求統計的“購買”行為屬於behavr列中的某特殊值。很容易想到先用條件篩選選出所有購買的記錄,再用groupby按各個商品分類,再用size()方法統計分組後每組的數量,以此輸出各個商品的購買量。
那麼會了這個之後來舉一反三一下:求各個商品瀏覽量
自行思考一下再往下翻哦
沒錯,就是改一下一開始條件過濾的數值即可。把購買(1)改成瀏覽(0)
商業資料分析經常會遇到一個資料量——轉化率,其實就是購買的數量比上瀏覽的數量。以此來看這個商品是否足夠吸引人。
我們這裡在上面已經計算出了各個商品的瀏覽量和購買量,事實上只需要比一比就可以了。
正好,pandas的series計算是我們想要的,他會根據鍵值對去分別計算
這個series裡user名字是鍵,數量是值,非常完美符合series計算設定,我們直接除一下就行。
pandas用.div()
來實現比值功能(前面的比後面的)。
要注意的是,series計算可能會帶來缺失值,因為兩個series計算的時候並不能保證兩個series的鍵完全一樣
即有可能出現前一個series有的鍵而後一個沒有。比如這裡可以看出brand 11就只有瀏覽沒有購買,因此統計購買量的時候沒有11這個鍵,但是瀏覽量中有11這個鍵。
在計算的時候不共有的鍵會以缺失值的形式出現,即NaN:
如果我們不想看到這個缺失值NaN,在div內新增fill_value引數可以把缺失值補充上
這就需要用到排序了。其實也很簡單。我們把前面計算好的轉化率用sort_values()
函數排序之後輸出前30個即可:
其實我們不難發現,python語言其實本身過於“高階”。他不需要你思考用什麼演演算法來完成這些操作(特別是你本身還在用第三方庫的時候)。
她總有相關的函數或者方法可以替你完成。並且這個函數內部可能是C語言等基礎語言實現的,程式碼效率會比你自己在python上手碼要快很多
作為使用者,想要快速入門的話,你所需要的——
只是把這些都記住就行了
大概這就是一個像文科一樣的程式語言吧……
以上就是Pandas資料分析之groupby函數用法範例詳解的詳細內容,更多關於Pandas資料分析groupby函數的資料請關注it145.com其它相關文章!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45