首頁 > 軟體

Python CSV 檔案解析和生成方法範例

2022-07-15 10:01:13

思路

  • 簡單的生成和讀取 CSV
  • CSV 檔案格式
  • 使用 csv 庫

Python with CSV

先有個很樸素的生成和解析的方法。

生成:

data = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9],
]
for cow in data:
    print(','.join(map(str, cow)))

生成結果:

1,2,3
4,5,6
7,8,9

解析

s = """1,2,3
4,5,6
7,8,9
"""
cows = s.splitlines()
data = []
for cow in cows:
    items = cow.split(',')
    data.append(items)
# data
# [['1', '2', '3'], ['4', '5', '6'], ['7', '8', '9']]

但是顯示的資料可能不這麼理想,比如其中的某一項有 , 的時候就會有問題了。

CSV 格式

CSV 中有幾個概念需要先了解下。CSV 雖然是 Comma-separated values 但並不一定用逗號來分隔,也可以用其他的來分隔。同時 CSV 也沒有一個明確的規範。

從 Python 的 csv 的檔案中看到的一些關鍵術語:

delimiter,最基本的分隔符

quotechar,如果某個 item 中包含了分隔符,應該用 quotechar 把它包裹起來

doublequote,如果某個 item 中出現了 quotechar 那麼可以把整個內容用 quotechar 包裹,並把 quotechar double 一下用來做區分

escapechar,如果不用 doublequote 的方法還可以用 escapechar 來輔助

lineterminator,每一行的結束符,預設的是 rn

quoting,可以選擇任何時候都使用 quotechar 來包裹內容,或者是需要用到的時候再用,或者不用

skipinitialspace,是否忽略分隔符後面跟著的空格

strict,這個是 Python 自己的,是否拋要異常

(上面的可能沒有覆蓋所有的細節,但大概就是這樣的情況)

使用 Python 的 csv 庫

13.1. csv — CSV File Reading and Writing — Python 2.7.12 documentation

很簡單的例子就是

import csv
with open('some.csv', 'rb') as f:
    reader = csv.reader(f)
    for row in reader:
        print row
import csv
with open('some.csv', 'wb') as f:
    writer = csv.writer(f)
    writer.writerows(someiterable)

另外這裡面有個 dialect 的概念,就是用一個 dialect 來定義上面提到的那些解析規則。

可以自己註冊(csv.register_dialect )、列出所有的(csv.list_dialects)、獲取某個(csv.get_dialect)。

預設是用逗號分隔的 excel 的 dialect,所以如果沒有特殊情況應該直接使用預設值就夠了。

其他

這次先只把基本概念瞭解下,後面可能還有檔案編碼之類的坑,到時遇到了再回來更新。

參考

PEP 305 -- CSV File API | Python.org

13.1. csv — CSV File Reading and Writing — Python 2.7.12 documentation

以上就是Python CSV 檔案解析和生成方法範例的詳細內容,更多關於Python CSV檔案解析生成的資料請關注it145.com其它相關文章!


IT145.com E-mail:sddin#qq.com