首頁 > 軟體

利用Python第三方庫xlrd讀取Excel中資料範例程式碼

2022-07-22 18:01:15

1. 安裝 xlrd 庫

Python 讀取 Excel 中的資料主要用到 xlrd 第三方庫。xlrd 其實就是兩個單詞的簡化拼接,我們可以把它拆開來看,xl 代表 excel, rd 代表 read, 合併起來就是 xlrd, 意思就是讀 excel 的第三方庫。

這種命名風格也正是我們推薦使用的,要做到 “顧名思義”,不要使用晦澀難懂,與所實現的功能毫無關聯的名稱。

OK, 廢話不多說了,下面我們就著手安裝 xlrd 庫,pip 命令如下:

pip install xlrd==1.2.0 -i https://mirrors.aliyun.com/pypi/simple

值得注意的是,我在安裝 xlrd 庫的時候,指定了 xlrd 的版本,即 xlrd==1.2.0, 這也是在實踐中積累的經驗哦,因為不指定版本總是會有各種狀況,為了確保不出錯,大家儘量按照我這樣安裝吧。否則,出錯可別找我哦!

2. 使用 xlrd 庫

2.1 開啟 Excel 工作表物件

(咳咳,戰術咳嗽!) 首先,我們先梳理一下思路,把概念搞清楚。什麼概念呢?就是大家知道什麼是工作簿,什麼是工作表,什麼是單元格嗎?

平時我們說的 Excel 工作表檔案,其實嚴格來說它是個工作簿。然後開啟工作簿,裡面有多個 Sheet, 我們把這個稱作 ”工作表“。之後,我們的資料是放在單元格里面的。

下面,讓我們再用圖片的形式展示,一起要分清概念。

工作簿:

工作表:

單元格:

好的,那麼使用 xlrd 讀取 Excel 表中的資料的時候也應按照:工作簿 -> 工作表 -> 單元格,這樣的過程去讀取資料的。

那麼,開啟工作物件的程式碼如下:

import xlrd

# 開啟工作簿
workbook = xlrd.open_workbook(r'C:UsersDesktop工作簿1.xlsx')
# 三種方式獲取工作表
# worksheet = workbook.sheet_by_index(0)
# worksheet = workbook.sheets()[0]        
worksheet = workbook.sheet_by_name('Sheet1')

程式碼解析:

  1. 首先匯入安裝的第三方庫 xlrd.
  2. 之後,使用 xlrd 庫下的方法 open_workbook(), 開啟一個工作簿,方法裡的引數為工作簿的路徑。
  3. 最後,根據拿到的工作簿物件,指定獲取的工作表。當然了,獲取工作表的方法有三種,分別是根據索引和根據工作表名稱獲取,索引是從0開始的。只要使用一種方式即可,這裡我推薦使用根據工作表名稱獲取。

2.2 讀取單個單元格資料

那麼我們在上一小節開啟了工作表物件之後,下面就要獲取表裡的單元格資料了呀!如何獲取單元格資料呢?請看下面的程式碼:

import xlrd

# 開啟工作簿
workbook = xlrd.open_workbook(r'C:UsersDesktop工作簿1.xlsx')
# 獲取工作表
worksheet = workbook.sheet_by_name('Sheet1')
# 獲取單元格資料的兩種方式
# cell_value = worksheet.cell(0, 0).value
cell_value = worksheet.cell_value(0, 0)
print(cell_value)

程式碼解析:

獲取單元格資料的方法也很簡單。這裡提供了兩種方法,都可以獲取單元格資料,大家只要根據自己習慣,掌握一種即可。例如,我這裡使用的是 cell_value() 方法,方法裡傳遞的是單元格的索引。單元格的索引是二維的,第一個引數是所在行,第二個引數是所在列。需要注意的是,所有的索引都是從 0 開始計數的。

2.3 讀取多個單元格資料

上一小節中,我們使用了 cell_value() 方法獲取單個單元格資料,但是這種方式未免效率過於低下了,現在我們想一次性獲取整行或者整列的資料,該如何去做呢 ?請看下面的程式碼:

import xlrd

# 開啟工作簿
workbook = xlrd.open_workbook(r'C:UsersDesktop工作簿1.xlsx')
# 獲取工作表
worksheet = workbook.sheet_by_name('Sheet1')
# 獲取第一行所有單元格資料
row_value = workbookt.row(0)
# 獲取第一列所有單元格資料
col_value = workbook.col(0)

程式碼解析:

與 2.2 小節不同的是,我們通過呼叫方法 row() 和 col() 分別獲取某行和某列所有單元格資料,row() 和 col() 內傳入的引數為索引,索引從 0 開始計數。例如,row(0) 表示獲取第一行所有單元格資料,row(1) 表示獲取第二行所有單元格資料。

那麼我們執行上面的程式碼段,執行結果如下所示:

[text:'班級', text:'學號', text:'姓名', text:'成績']  # row(0) 的結果值
[text:'班級']     # col(0) 的結果值

通過觀察執行結果,我們發現執行的結果都是以列表的形式展示的。值得注意的是,列表的數值並不是字典格式,儘管這和 Python 中字典格式完全一樣,實際上列表中元素的型別應該是 <class 'xlrd.sheet.Cell'>, 這是 xlrd 中的 cell 物件,即單元格物件。單元格物件有 value 屬性,因此我們可以通過遍歷列表獲得每一個 cell 物件,然後通過 value 屬性取出每一個 cell 的值。

改造後的程式碼如下所示:

import xlrd

# 開啟工作簿
workbook = xlrd.open_workbook(r'C:UsersDesktop工作簿1.xlsx')
# 獲取工作表
worksheet = workbook.sheet_by_name('Sheet1')

for i in worksheet.row(0):
    print(i.value)  # 獲取單元格資料
for i in worksheet.col(0):
    print(i.value)  # 獲取單元格資料

2.3 讀取所有單元格資料

在上一小節中,我們學習了獲取多個單元格資料,也就是整行或整列獲取資料,這樣獲取資料的粒度更大,效率自然也更高。那麼如果說,我想獲取 Sheet 表中所有的資料又該怎麼做呢?

要想獲取 Sheet 表中所有單元格資料,就得知道 Sheet 表有多少行以及多少列。這樣,我們根據行數和列數,才能獲取 Sheet 表所有資料啊。xlrd 中 worksheet 物件有兩個屬性 nrows 和 ncols, 它們分別表示當前的 Sheet 表的行數和列數。

獲取所有單元格資料的程式碼如下所示:

import xlrd

# 開啟工作簿
workbook = xlrd.open_workbook(r'C:UsersDesktop工作簿1.xlsx')
# 獲取工作表
worksheet = workbook.sheet_by_name('Sheet1')
# 根據行獲取所有單元格資料
for row in range(worksheet.nrows):
    for i in worksheet.row(row):
        print(i.value)
# 根據列獲取單元格資料  
for col in range(worksheet.ncols):
    for i in worksheet.col(col):
        print(i.value)

程式碼解析:

上面的程式碼中,輸出的結果應該都是所有單元格資料,只不過分別從行和列的角度出發獲取單元格資料。其實,還可以用 cell_value() 方法結合 nrows 和 ncols 屬性獲取所有單元格資料,這種方法留給大家自己去嘗試吧!

附:行、列操作

獲取全行資料、切片、全行型別、行的有效單元格數等

# # 獲取整行和整列的值(陣列)
k = 2
rows = sheet1_content1.row_values(k); # 獲取第3行內容  row_values(rowx=2, start_colx=0, end_colx=None)
cols = sheet1_content1.col_values(k); # 獲取第3列內容
 
###   行操作 對應列操作把 row 換成 col
print(sheet1Name,'第',k+1,'行內容為',rows) 
print(sheet1_content1.row_slice(rowx=k))#返回由該行中所有的單元格物件型別及物件組成的列表
print(sheet1_content1.row_types(rowx=k, start_colx=0, end_colx=None))#返回由該行中所有的單元格物件型別及物件組成的列表
print(sheet1_content1.row(rowx=k))#返回由該行中所有的單元格物件型別及物件組成的列表
print(sheet1_content1.row_len(rowx=k)) #返回該行的有效單元格長度
    # # 5. 獲取單元格內容(三種方式)
print(sheet1_content1.cell(0, 1).value)
print(sheet1_content1.cell_value(0, 1))
print(sheet1_content1.row(0)[1].value)
# print(sheet1_content1.row(10)[10].value) ## 超出索引長度會報錯

3. 總結

通過上面的學習,相信大家對 xlrd 第三方庫的安裝以及使用第三方庫讀取 Excel 中的資料的方法有了一定的掌握。學習了讀取操作之後,可以通過下一篇部落格《使用 Python 第三方庫 xlwt 寫入資料到 Excel 工作表》學習向 Excel 工作表寫入資料。

到此這篇關於利用Python第三方庫xlrd讀取Excel中資料的文章就介紹到這了,更多相關Python xlrd讀取Excel資料內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com