首頁 > 軟體

Python利用Pandas進行資料分析的方法詳解

2022-09-05 14:01:28

Pandas是最流行的用於資料分析的 Python 庫。它提供高度優化的效能,後端原始碼完全用CPython編寫。

我們可以通過以下方式分析 pandas 中的資料:

1.Series

2.資料框

Series

Series 是 pandas 中定義的一維(1-D)陣列,可用於儲存任何資料型別。

程式碼 #1

建立 Series

# 建立 Series 的程式

# 匯入 Panda 庫
import pandas as pd

# 使用資料和索引建立 Series
a = pd.Series(Data, index = Index)

在這裡,資料可以是:

  • 一個標量值,可以是 integerValue、字串
  • 可以是鍵值對的Python 字典
  • 一個Ndarray

注意:預設情況下,索引從 0、1、2、...(n-1) 開始,其中 n 是資料長度。

程式碼 #2

當 Data 包含標量值時

# 使用標量值建立 Series 的程式

# 數值資料
Data =[1, 3, 4, 5, 6, 2, 9]

# 使用預設索引值建立系列
s = pd.Series(Data)	

# 預定義的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']

# 建立具有預定義索引值的系列
si = pd.Series(Data, Index)

輸出

具有預設索引的標量資料

帶索引的標量資料

程式碼#3

當資料包含字典時

# 建立詞典 Series 程式
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}

# 建立字典型別 Series
sd = pd.Series(dictionary)

輸出

字典型別資料

程式碼 #4

當 Data 包含 Ndarray

# 建立 ndarray series 的程式

# 定義二維陣列
Data =[[2, 3, 4], [5, 6, 7]]

# 建立一系列二維陣列
snd = pd.Series(Data)	

輸出

資料作為 Ndarray

資料框

DataFrames是 pandas 中定義的二維(2-D)資料結構,由行和列組成。

程式碼 #1

建立 DataFrame

# 建立 DataFrame 的程式

# 匯入庫
import pandas as pd

# 使用資料建立 DataFrame
a = pd.DataFrame(Data)

在這裡,資料可以是:

  • 一本或多本詞典
  • 一個或多個Series
  • 2D-numpy Ndarray

程式碼 #2

當資料是字典時

# 使用兩個字典建立資料框的程式

# 定義字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}

# 定義字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}

# 用 dict1 和 dict2 定義資料
Data = {'first':dict1, 'second':dict2}

# 建立資料框
df = pd.DataFrame(Data)

輸出

帶有兩個字典的 DataFrame

程式碼 #3

當資料是Series時

# 建立三個系列的Dataframe的程式
import pandas as pd

# 定義 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])

# 定義 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])

# 定義 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])	

# 定義 Data
Data ={'first':s1, 'second':s2, 'third':s3}

# 建立 DataFrame
dfseries = pd.DataFrame(Data)			

輸出

三個 Series 的 DataFrame

程式碼 #4

當 Data 為 2D-numpy ndarray注意:在建立 2D 陣列的 DataFrame 時必須保持一個約束 - 2D 陣列的維度必須相同。

# 從二維陣列建立 DataFrame 的程式

# 匯入庫
import pandas as pd

# 定義 2d 陣列 1
d1 =[[2, 3, 4], [5, 6, 7]]

# 定義 2d 陣列 2
d2 =[[2, 4, 8], [1, 3, 9]]

# 定義 Data
Data ={'first': d1, 'second': d2}

# 建立 DataFrame
df2d = pd.DataFrame(Data)	

輸出

帶有 2d ndarray 的 DataFrame

到此這篇關於Python利用Pandas進行資料分析的方法詳解的文章就介紹到這了,更多相關Python Pandas資料分析內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com