<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
我使用的 Pandas 版本如下,順便也匯入 Pandas 庫。
>>> import pandas as pd >>> pd.__version__ '0.25.1'
在開始前先確保直譯器和資料集在同一目錄下:
>>> import os >>> os.chdir('D://source/dataset') # 這是我的資料集所在目錄 >>> os.listdir() # 確認此目錄已經存在 IMDB-Movie-Data 資料集 ['drinksbycountry.csv', 'IMDB-Movie-Data.csv', 'movietweetings', 'titanic_eda_data.csv', 'titanic_train_data.csv']
準備工作就位後,正式開始資料處理技巧之旅。
匯入資料
>>> df = pd.read_csv("IMDB-Movie-Data.csv") >>> df.head(1) # 匯入並顯示第一行 Rank Title Genre ... Votes Revenue (Millions) Metascore 0 1 Guardians of the Galaxy Action,Adventure,Sci-Fi ... 757074 333.13 76.0 [1 rows x 12 columns]
使用 pop 方法移除指定列:
>>> meta = df.pop("Title").to_frame() # 移除 Title 列
確認是否已被移除:
>>> df.head(1) # df 變為 11列 Rank Genre ... Revenue (Millions) Metascore 0 1 Action,Adventure,Sci-Fi ... 333.13 76.0 [1 rows x 11 columns]
pop 後得到 meta,顯示 meta 前 3 行:
>>> meta.head(3) Title 0 Guardians of the Galaxy 1 Prometheus 2 Split
標題是由單片語成,中間用空格分隔。
# .str.count(" ") + 1 得到單詞個數 >>> meta["words_count"] = meta["Title"].str.count(" ") + 1 >>> meta.head(3) # words_count 列代表單詞個數 Title words_count 0 Guardians of the Galaxy 4 1 Prometheus 1 2 Split 1
下面統計電影 Genre 的頻次,
>>> vc = df["Genre"].value_counts()
下面顯示電影 Genre 的 Top5 ,最高頻為出現 50 次的 Action,Adventure,Sci-Fi 類,次之為 48 次的 Drama 類:
>>> vc.head() Action,Adventure,Sci-Fi 50 Drama 48 Comedy,Drama,Romance 35 Comedy 32 Drama,Romance 31 Name: Genre, dtype: int64
展示 Top5 的餅狀圖:
>>> import matplotlib.pyplot as plt >>> vc[:5].plot(kind='pie') <matplotlib.axes._subplots.AxesSubplot object at 0x000001D65B114948> >>> plt.show()
到此這篇關於Python資料處理的三個實用技巧分享的文章就介紹到這了,更多相關Python 資料處理內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45