首頁 > 軟體

Python實現連線FTP並下載資料夾

2022-03-09 10:00:21

第一章:連線 FTP 伺服器並實現資料夾下載

① 連線 FTP 伺服器

如果 FTP 不用使用者名稱密碼就直接可以存取,那就是用的預設使用者名稱 Anonymous,密碼為空。

# -*- coding: UTF8 -*-
# 2022-3-8
# 作者:小藍棗
# python連線ftp伺服器
from ftplib import FTP

def conn_ftp():
    '''
     作用:連線ftp伺服器
     引數:無
     返回:ftp伺服器連線的物件
    '''
    
    # FTP連線資訊
    ftp_ip = "xx.xx.xx.xx"
    # 預設埠21
    ftp_port = 21
    # 如果未指定,使用預設使用者名稱為Anonymous,密碼為空
    ftp_user = "Anonymous"
    ftp_password = ""

    ftp = FTP()
    # 連線ftp
    ftp.connect(ftp_ip, ftp_port)
    # ftp登入
    ftp.login(ftp_user, ftp_password)
    # 檢視歡迎資訊
    print(ftp.getwelcome())
    
    return ftp
    
ftp = conn_ftp()

② 進入指定目錄並顯示檔案資訊

方法 ftp.dir() 返回結果的結尾會預設帶個 None,目錄下沒有內容的話直接會返回個 None。

def display_dir(ftp, path):
    '''
     作用:進入並展示指定的目錄內容
     引數1:ftp連線物件
     引數2:要展示的目錄
     返回:無
    '''
    
    # 進入指定目錄
    ftp.cwd(path)
    # 顯示當前所在位置
    print("當前所在位置為:")
    print(ftp.pwd())
    # 展示目錄內容
    print("n顯示目錄內容:")
    print(ftp.dir())
    # 展示目錄下的檔名,*資料夾和檔案都會顯示
    print("n檔案和資料夾名為:")
    for i in ftp.nlst():
        print(i)

path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
display_dir(ftp, path)

這是原始目錄。

③ 區分檔案和資料夾名

從上面方法 ftp.dir() 返回結果可以看到包含 <DIR> 標識的為資料夾,我們根據這個特徵來進行資料夾區分。

def diff_dir(ftp, path):
    '''
     作用:區分檔案和資料夾
     引數1:ftp連線物件
     引數2:要展示的目錄
     返回:無
    '''
    
    # 進入指定目錄
    ftp.cwd(path)
    # 顯示當前所在位置
    print("當前所在位置為:")
    print(ftp.pwd())
    # 展示目錄內容
    print("n顯示目錄內容:")
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        # 區分檔案和資料夾
        if("<DIR>" in i):
            print("目錄為:" + i.split(" ")[-1])
        else:
            print("檔案為:" + i.split(" ")[-1])

path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
diff_dir(ftp, path)

④ 資料夾名包含空格處理

split(" ")[-1] 方法有個缺陷,如果檔案或資料夾名裡包含空格,得到到的資料夾名就不對了,下面的方法可以有效的解決這個問題

def get_dir_name(s):
    '''
     作用:需要檔案或資料夾名
     引數1:需要擷取的字串
     返回:檔案或資料夾名
    '''
    dir_name = ""
    k = 0
    record = ""
    for i in s:
        if(record == " " and i != " "):
            k = k + 1;
        if(k >= 3):
            dir_name = dir_name + i;
        record = i
        
    print(dir_name)
    return dir_name

# 測試兩條資料
get_dir_name("03-08-22  09:52AM       <DIR>          C2021.11_ZDHJC_004a")
get_dir_name("03-08-25  10:32AM                89098 hello .exe")

⑤ 使用遞迴實現:FTP伺服器裡的資料夾下載到本地

思路:

首先是看目錄或檔案裡是否包含關鍵詞,包含關鍵詞進行下載。

並判斷是否是目錄,如果是目錄的話,本地根據目錄結構進行遞迴,同時本地建立資料夾。

使用了 2 個方法,下面的方法用來判斷是否包含關鍵詞,上面的方法就是目錄結構下的遞迴。

注意:由於是一個 ftp 連線物件,遞迴過程中進去某個目錄下,遞迴結束要回到之前的目錄。

import pathlib

def download_dir(ftp, path, local_path):
    '''
     作用: 下載目錄
     引數1:ftp連線物件
     引數2:要展示的目錄
     引數3:本地存放路徑
     返回:無
    '''
    
    # 進入指定目錄
    ftp.cwd(path)
    # 區分檔案和資料夾
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        try:
            # 識別為目錄進行遞迴
            if("<DIR>" in i):
                dir_name = get_dir_name(i)
                local_path_new = local_path + "/" + dir_name
                # 本地建立資料夾
                pathlib.Path(local_path_new).mkdir(parents=True, exist_ok=True)
                # 呼叫下載目錄方法
                download_dir(ftp, dir_name, local_path_new)
            # 識別為檔案進行下載
            else:
                file_name = get_dir_name(i)
                local_filename = local_path + "/" + file_name
                f = open(local_filename, "wb")
                # 下載ftp檔案
                ftp.retrbinary('RETR ' + file_name, f.write)
                f.close()
        except Exception as e:
            print(e)
    
    # 退出當前目錄
    ftp.cwd("..")

def download_file(ftp, key, path, local_path):
    '''
     作用: 根據關鍵詞下載檔案
     引數1:ftp連線物件
     引數2:下載的關鍵詞
     引數3:要展示的目錄
     引數4:本地存放路徑
     返回:無
    '''
    
    # 進入指定目錄
    ftp.cwd(path)
    # 區分檔案和資料夾
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        if(key in i):
            try:
                # 識別為目錄進行遞迴
                if("<DIR>" in i):
                    dir_name = get_dir_name(i)
                    local_path_new = local_path + "/" + dir_name
                    # 本地建立資料夾
                    pathlib.Path(local_path_new).mkdir(parents=True, exist_ok=True)
                    # 呼叫下載目錄方法
                    download_dir(ftp, dir_name, local_path_new)
                else:
                    file_name = get_dir_name(i)
                    local_filename = local_path + "/" + file_name
                    f = open(local_filename, "wb")
                    # 下載ftp檔案
                    ftp.retrbinary('RETR ' + file_name, f.write)
                    f.close()
            except Exception as e:
                print(e)

# 設定編碼,解決上傳的檔案包含中文的問題
ftp.encoding = 'GBK'
key = "C2021.11_ZDHJC"
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
local_path = "D:/ftp下載"
download_file(ftp, key, path, local_path)

可以看到符合關鍵詞的目錄被下載到本地了。

並且裡面的巢狀目錄也同步被下載了。

第二章:問題解決

① 下載的檔名包含中文【‘utf-8’ codec can’t decode byte …】

設定下 FTP 物件的編碼為 GBK 即可。

ftp.encoding = 'GBK'

不然會報如下錯誤:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd7 in position 114: invalid continuation byte

② 指定的路徑存在問題【550 The system cannot find the file specified.】

開始我用 split(" ")[-1] 方法擷取檔名,由於有的檔案含有中文,擷取後的檔名稱不對了。

就報了 ftplib.error_perm: 550 The system cannot find the file specified. 的錯誤。

③ 下載檔案前未加RETR標識【500 Command not understood.】

下載檔案時 FTP 路徑前要加個 'RETR ',不然就會報 500 錯誤,注意後面還跟了個空格。

# 下載ftp檔案
ftp.retrbinary('RETR ' + file_name, f.write)

不然就報 ftplib.error_perm: 500 Command not understood. 錯誤了。

以上就是Python實現連線FTP並下載資料夾的詳細內容,更多關於Python FTP下載資料夾的資料請關注it145.com其它相關文章!


IT145.com E-mail:sddin#qq.com