首頁 > 軟體

Python解析JSON物件的全過程記錄

2021-03-25 10:01:16

前言

本章節我們將為大家介紹如何使用 Python 語言來編碼和解碼 JSON 物件。

json處理模組的主要任務,是將一個JSON物件,轉換成Python資料型別資料進行處理,或者反之,將Python資料型別資料,轉換成JSON物件(字串流),在不同的模組或者系統間傳輸。

1. JSON資料格式特點

  1. 物件表示為鍵值對
  2. 資料由逗號分隔
  3. 花括號儲存物件
  4. 方括號儲存陣列
{
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"張三" , "age":30 },
 { "name":"里斯" , "age":17 }
 ]
}
{'students': [{'name': '北山啦', 'age': 20},
 {'name': '張三', 'age': 30},
 {'name': '里斯', 'age': 17}]}

上面就是一個JSON格式資料。它開起來就像是在Python中的字典資料型別。我們可以通過json模組將它轉換成字串或者反過來將字串轉換成字典資料型別。

JSON也支援各種資料型別,它的資料型別和Python各種資料型別之間的對比如下:

  • object —— dict
  • array —— list
  • string —— str
  • number —— int/float
  • true/false —— True/False
  • null —— None

2. 常用方法總結

在json模組中,用於處理json的主要是四個函數,分別是:

  • loads():從JSON字串中讀取資料並轉換成Python資料型別
  • load():從JSON檔案中讀取資料並轉換成Python資料型別
  • dumps():將Python資料型別資料轉換成JSON字串
  • dump():將Python資料型別資料轉換成JSON字串寫入到檔案

3. 系列化和反系列化

從JSON資料轉換到Python資料,叫反系列化(deserialization)

從Python資料轉換到JSON資料,叫系列化(serialization)

3.1 系列化

系列化:將Python資料轉換成JSON字串的方法。

下面我們先來看一個簡單的例子。

import json

data = {
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"張三" , "age":30 },
 { "name":"里斯" , "age":17 }
 ]
}
print(type(data))
print(data)
json_str = json.dumps(data)
print(type(json_str))
<class 'dict'>
{'students': [{'name': '北山啦', 'age': 20}, {'name': '張三', 'age': 30}, {'name': '里斯', 'age': 17}]}
<class 'str'>

上面的例子中,雖然看起來資料沒有發生變化,但其實它們的資料型別已經發生了本質的改變:將字典資料型別的data,轉換成了str型別,然後我們就可以將這個str型別的資料轉換成流,在網路上進行傳輸或者寫入到檔案等。

import json

data = {
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"張三" , "age":30 },
 { "name":"里斯" , "age":17 }
 ]
}

print(type(data))
print(data)
json_str = json.dumps(data, separators=('>>','::'), indent=2)
print(json_str)
<class 'dict'>
{'students': [{'name': '北山啦', 'age': 20}, {'name': '張三', 'age': 30}, {'name': '里斯', 'age': 17}]}
{
 "students"::[
 {
 "name"::"u5317u5c71u5566">>
 "age"::20
 }>>
 {
 "name"::"u5f20u4e09">>
 "age"::30
 }>>
 {
 "name"::"u91ccu65af">>
 "age"::17
 }
 ]
}

將data寫入txt檔案中

import json

data = {
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"張三" , "age":30 },
 { "name":"里斯" , "age":17 }
 ]
}
with open("students.txt","w") as fp:
 json.dump(data, fp, ensure_ascii=False)
 print("finish")

finish

這樣就將data寫入了students.txt,看看是不是已經將資料寫進去了。

3.2 反系列化

從JSON資料轉換到Python型別資料,叫反系列化。可以通過loads()/load()這兩個方法來完成。

import json
with open("students.txt") as fp:
 data = json.load(fp)
 """取出字典key為students的資料,
 得到一個list,再從這個list中取第一個資料"""
 print(data['students'][0]) 

{'name': '北山啦', 'age': 20}

parse_int引數

預設值為None,如果指定了parse_int,用來對JSON int字串進行解碼,這可以用於為JSON整數使用另一種資料型別或解析器。

parse_int引數,這裡我們簡單將其指定為float型別。

import json
with open("students.txt") as fp:
 data = json.load(fp, parse_int = float)
 print(data)

{'students': [{'name': '北山啦', 'age': 20.0}, {'name': '張三', 'age': 30.0}, {'name': '里斯', 'age': 17.0}]}

可以看到,age原來是整數型別,通過parse_int已經被轉換成了float型別。

object_hook

預設值為None,object_hook是一個可選函數,此功能可用於實現自定義解碼器。指定一個函數,該函數負責把反序列化後的基本型別物件轉換成自定義型別的物件。

def fromJSON(dct): # 這裡會對所有的字典資料型別都進行遍歷
 if isinstance(dct, dict) and 'students' in dct:
 return dct['students']
 else:
 return Student(dct['name'], dct['age'])

import json

with open("students.txt") as fp:
 data = json.load(fp, object_hook=fromJSON)
 print(data)


[姓名: 北山啦, 年齡: 20, 姓名: 張三, 年齡: 30, 姓名: 里斯, 年齡: 17]

總結

到此這篇關於Python解析JSON物件的文章就介紹到這了,更多相關Python解析JSON物件內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com