<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
EDA 是資料分析下的一種現象,用於更好地理解資料方面,例如:
– 資料的主要特徵
– 變數和它們之間的關係
– 確定哪些變數對我們的問題很重要
我們將研究各種探索性資料分析方法,
例如:
我們將使用的資料集是子投票資料集,您可以在 python 中將其匯入為:
import pandas as pd Df = pd.read_csv("https://vincentarelbundock.github.io / Rdatasets / csv / car / Child.csv")
描述性統計是瞭解資料特徵和快速總結資料的有用方法。python 中的 Pandas 提供了一個有趣的方法describe() 。describe 函數對資料集應用基本統計計算,如極值、資料點計數標準差等。任何缺失值或 NaN 值都會被自動跳過。describe() 函數很好地描繪了資料的分佈情況。
DF.describe()
這是您在執行上述程式碼時將獲得的輸出:
另一種有用的方法是 value_counts(),它可以獲取分類屬性值系列中每個類別的計數。例如,假設您正在處理一個客戶資料集,這些客戶在列名 age 下分為青年、中年和老年類別,並且您的資料框是“DF”。您可以執行此語句以瞭解有多少人屬於各個類別。在我們的資料集範例中可以使用教育列
DF["education"].value_counts()
上述程式碼的輸出將是:
另一個有用的工具是 boxplot,您可以通過 matplotlib 模組使用它。箱線圖是資料分佈的圖形表示,顯示極值、中位數和四分位數。我們可以使用箱線圖輕鬆找出異常值。現在再次考慮我們一直在處理的資料集,讓我們在屬性總體上繪製一個箱線圖
import pandas as pd import matplotlib.pyplot as plt DF = pd.read_csv("https://raw.githubusercontent.com / fivethirtyeight / data / master / airline-safety / airline-safety.csv") y = list(DF.population) plt.boxplot(y) plt.show()
發現異常值後,輸出圖將如下所示:
Group by 是 pandas 中可用的一個有趣的度量,它可以幫助我們找出不同分類屬性對其他資料變數的影響。讓我們看一個在同一資料集上的範例,我們想找出人們的年齡和教育對投票資料集的影響。
DF.groupby(['education', 'vote']).mean()
輸出會有點像這樣:
如果按輸出表進行分組難以理解,則進一步的分析師使用資料透視表和熱圖對其進行視覺化。
ANOVA 代表方差分析。執行它是為了找出不同類別資料組之間的關係。
在 ANOVA 下,我們有兩個測量結果:
– F-testscore:顯示組均值相對於變化的變化
– p 值:顯示結果的重要性
這可以使用 python 模組 scipy 方法名稱f_oneway()
這些樣本是每組的樣本測量值。
作為結論,如果 ANOVA 檢驗給我們一個大的 F 檢驗值和一個小的 p 值,我們可以說其他變數和分類變數之間存在很強的相關性。
相關性是上下文中兩個變數之間的簡單關係,使得一個變數影響另一個變數。相關性不同於引起的行為。計算變數之間相關性的一種方法是找到 Pearson 相關性。在這裡,我們找到兩個引數,即皮爾遜係數和 p 值。當 Pearson 相關係數接近 1 或 -1 且 p 值小於 0.0001 時,我們可以說兩個變數之間存在很強的相關性。
Scipy 模組還提供了一種執行 pearson 相關性分析的方法,
這裡的範例是您要比較的屬性。
到此這篇關於Python 資料分析教學探索性資料分析的文章就介紹到這了,更多相關Python 索性資料分析內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45