<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
本文以Python3.9.1讀取data.xlsx中包含的西瓜資料集3.0資料為例,資料集如下:
編號 | 色澤 | 根蒂 | 敲聲 | 紋理 | 臍部 | 觸感 | 密度 | 含糖率 | 好瓜 |
---|---|---|---|---|---|---|---|---|---|
1 | 青綠 | 蜷縮 | 濁響 | 清晰 | 凹陷 | 硬滑 | 0.697 | 0.46 | 是 |
2 | 烏黑 | 蜷縮 | 沉悶 | 清晰 | 凹陷 | 硬滑 | 0.774 | 0.376 | 是 |
3 | 烏黑 | 蜷縮 | 濁響 | 清晰 | 凹陷 | 硬滑 | 0.634 | 0.264 | 是 |
4 | 青綠 | 蜷縮 | 沉悶 | 清晰 | 凹陷 | 硬滑 | 0.608 | 0.318 | 是 |
5 | 淺白 | 蜷縮 | 濁響 | 清晰 | 凹陷 | 硬滑 | 0.556 | 0.215 | 是 |
6 | 青綠 | 稍蜷 | 濁響 | 清晰 | 稍凹 | 軟粘 | 0.403 | 0.237 | 是 |
7 | 烏黑 | 稍蜷 | 濁響 | 稍糊 | 稍凹 | 軟粘 | 0.481 | 0.149 | 是 |
8 | 烏黑 | 稍蜷 | 濁響 | 清晰 | 稍凹 | 硬滑 | 0.437 | 0.211 | 是 |
9 | 烏黑 | 稍蜷 | 沉悶 | 稍糊 | 稍凹 | 硬滑 | 0.666 | 0.091 | 否 |
10 | 青綠 | 硬挺 | 清脆 | 清晰 | 平坦 | 軟粘 | 0.243 | 0.267 | 否 |
11 | 淺白 | 硬挺 | 清脆 | 模糊 | 平坦 | 硬滑 | 0.245 | 0.057 | 否 |
12 | 淺白 | 蜷縮 | 濁響 | 模糊 | 平坦 | 軟粘 | 0.343 | 0.099 | 否 |
13 | 青綠 | 稍蜷 | 濁響 | 稍糊 | 凹陷 | 硬滑 | 0.639 | 0.161 | 否 |
14 | 淺白 | 稍蜷 | 沉悶 | 稍糊 | 凹陷 | 硬滑 | 0.657 | 0.198 | 否 |
15 | 烏黑 | 稍蜷 | 濁響 | 清晰 | 稍凹 | 軟粘 | 0.36 | 0.37 | 否 |
16 | 淺白 | 蜷縮 | 濁響 | 模糊 | 平坦 | 硬滑 | 0.593 | 0.042 | 否 |
17 | 青綠 | 蜷縮 | 沉悶 | 稍糊 | 稍凹 | 硬滑 | 0.719 | 0.103 | 否 |
程式碼段:
匯入pandas庫,讀取工作表資料
import pandas as pd df = pd.read_excel(r'E:Aownplandata.xlsx')#預設讀取工作簿中第一個工作表,預設第一行為表頭
備註:r是為了讀取檔案路徑中字元,防止跳脫。
此處利用pandas庫的 read_excel 函數讀取檔案,獲取到的函數返回值型別為DataFrame,後續所有的操作均是基於DataFrame的資料操作方法進行。
獲取整個工作表資料
data=df.values#獲取整個工作表資料 print("讀取整個工作表的資料:n{0}".format(data))
獲取某一行資料
data=df.iloc[0].values#0表示第一行,不包含表頭 print("讀取指定行的資料:n{0}".format(data))
獲取多行資料
data=df.head().values#head()預設讀取前5行資料(不包含表頭) print("獲取工作表前5行資料:n{0}".format(data)) data=df.iloc[[1,2]].values#讀取指定多行,在iloc[]裡面巢狀列表指定行數 print("讀取指定多行的資料:n{0}".format(data)) data=df.sample(3).values#讀取df中隨機3行資料(3個樣本) print("獲取隨機多行資料:n{0}".format(data))
獲取指定單元格資料
data=df.iloc[1,2]#讀取索引為[1, 2]的值,這裡不需要巢狀列表 print("讀取指定某行某列(單元格)的資料:n{0}".format(data))
獲取指定列資料
print("輸出值n",df['含糖率'].values)
獲取指定多列資料
data=df.loc[:,['敲聲','紋理']].values#讀所有行的敲聲以及紋理列的值,這裡需要巢狀列表 print("讀取指定列的資料:n{0}".format(data))
獲取指定多行多列資料
data=df.loc[[1,2],['密度','含糖率']].values#讀取第一行第二行的密度以及含糖率列的值,這裡需要巢狀列表 print("讀取指定多行多列的資料:n{0}".format(data))
獲取行號和列標題
print("輸出行號列表",df.index.values) print("輸出列標題",df.columns.values)
(1) 轉化為列表list
以上通過.values方法獲取到的data值,均為二維值陣列(numpy.ndarray)型別,在使用時如果需要轉換為列表型別,可使用.tolist()方法,如:
data=df.values.tolist()
此時的輸出為:
此時的data為list型別,其中每一行資料均為一個列表,多個列表合併為一個二維列表,此時要獲取指定行(m)的資料,使用 data[m],獲取指定單元格資料,使用data[m][n]。
(2) 轉化為集合set
在分析時,若想獲取某一列的資料集合,則可以先提取該列資料,然後使用set()函數將其轉化為集合即可,如當前為獲取敲聲的型別,進行如下操作:
data=df['敲聲'].values print(set(data))
此時的輸出:
{'清脆', '濁響', '沉悶'}
獲取除編號,密度,含糖率外所有列的集合:
titles = df.columns.values for title in titles: if title != '編號' and title != '密度' and title != '含糖率': key = df[title].values values = set(key) print(title,':',values)
輸出:
色澤 : {'烏黑', '青綠', '淺白'}
根蒂 : {'蜷縮', '稍蜷', '硬挺'}
敲聲 : {'清脆', '濁響', '沉悶'}
紋理 : {'清晰', '稍糊', '模糊'}
臍部 : {'平坦', '稍凹', '凹陷'}
觸感 : {'硬滑', '軟粘'}
好瓜 : {'是', '否'}
(3) 轉化為字典dict
如果需要讀取某一行的資料為字典,可進行如下操作:
data=df.iloc[0].values#獲取某行資料 title=df.columns.values#獲取列標題 a=zip(title,data)#將其壓縮為一個元組 print(dict(a))#轉化為字典
輸出:
{'編號': 1, '色澤': '青綠', '根蒂': '蜷縮', '敲聲': '濁響', '紋理': '清晰', '臍部': '凹陷', '觸感': '硬滑', '密度': 0.697,'含糖率': 0.46, '好瓜': '是'}
獲取除編號,密度,含糖率外所有列的字典:
titles = df.columns.values adict=dict() for title in titles: if title != '編號' and title != '密度' and title != '含糖率': key = df[title].values adict[title]=set(key) print(adict)
輸出:
{'色澤': {'烏黑', '青綠', '淺白'}, '根蒂': {'蜷縮', '稍蜷', '硬挺'}, '敲聲': {'清脆', '濁響', '沉悶'}, '紋理': {'清晰', '稍糊', '模糊'}, '臍部': {'平坦', '稍凹', '凹陷'}, '觸感': {'硬滑', '軟粘'}, '好瓜': {'是', '否'}}
[1]. Python利用pandas處理Excel資料的應用
到此這篇關於如何使用Python讀取.xlsx指定行列的文章就介紹到這了,更多相關Python讀取.xlsx指定行列內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45