首頁 > 軟體

Python selenium+cookie實現免密登陸的範例程式碼

2022-02-21 13:05:50

今天爬取airbnb的租房資料時,遇到了登陸問題。自己動手解決了一下。

我們知道,http是無狀態的,那麼網頁如何實現使用者登陸註冊功能呢?Session和Cookie就是為了滿足這種需求出現的技術。

首先介紹一下Session和Cookie的概念。

在Web中Session物件儲存特定使用者對談所需的屬性及設定資訊。這樣,當用戶在應用程式的Web頁之間跳轉時,儲存在Session物件中的變數將不會丟失,而是在整個使用者對談中一直存在下去。當用戶請求來自應用程式的 Web頁時,如果該使用者還沒有對談,則Web伺服器將自動建立一個 Session物件。當對談過期或被放棄後,伺服器將終止該對談。

Cookie,有時也用其複數形式 Cookies。型別為“小型文字檔案”,是某些網站為了辨別使用者身份,進行Session跟蹤而儲存在使用者本地終端上的資料(通常經過加密),由使用者使用者端計算機暫時或永久儲存的資訊。

當用戶第一次存取某個網頁時,伺服器會建立一個Session物件,用於儲存與該使用者對談的屬性以及設定資訊,並且返回一個帶有set-cookie欄位的響應頭給使用者端,使用者端瀏覽器會把cookie儲存到本地,下一次存取該網頁時,會加上cookie。伺服器通過cookie辨認是否有使用者的Session。這樣就實現了使用者的登陸註冊功能,但是Session和Cookie的應用遠不及此,這裡不再贅述。

那麼為了實現免密登陸,我們需要做如下幾件事情:

獲取登陸airbnb時使用者端瀏覽器儲存的cookies。

把cookies寫入本地。

下次用selenium登陸airbnb時,把cookies帶上。

獲取cookies:

使用selenium的get_cookies()函數來獲取cookies。

但是如何實現登陸呢?總得要先登陸了,才能有cookies吧?可以在程式碼中加一段休眠時間,在休眠時間我們手動完成登陸,休眠過後,再讓程式碼記錄cookies即可。

import time
 
from msedge.selenium_tools import Edge, EdgeOptions
import chardet
 
 
# 返回一個driver物件
def activate_selenium_driver():
    options = EdgeOptions()
    # options.use_chromium = True
    options.add_experimental_option('excludeSwitches', ['enable-automation'])
    options.binary_location = r"C:Program Files (x86)MicrosoftEdgeApplicationmsedge.exe"  # 瀏覽器的位置
    driver = Edge(options=options, executable_path=r"D:ERicWORKpythonSpidermsedgedriver.exe")  # 相應的瀏覽器的驅動位置
    return driver
 
 
def check_charset(file_path):
    with open(file_path, "rb") as f:
        data = f.read(4)
        charset = chardet.detect(data)['encoding']
    return charset
 
baseurl = 'https://www.airbnb.cn/s/%E6%B7%B1%E5%9C%B3/homes?refinement_paths%5B%5D=%2Fhomes&current_tab_id=home_tab&selected_tab_id=home_tab&screen_size=large&hide_dates_and_guests_filters=false&place_id=ChIJkVLh0Aj0AzQRyYCStw1V7v0&map_toggle=false'
driver = activate_selenium_driver()
driver.get(baseurl)
 
# 20秒的休眠時間以手動完成登陸
for i in range(0, 20):
    print(20 - i)
    time.sleep(1)
 
# 獲取cookies
cookies = driver.get_cookies()
 
# 儲存到本地
with open('cookies.txt', 'w', encoding=check_charset('cookies.txt')) as f:
    for i in cookies:
        f.write(str(i))
        f.write('n')

攜帶cookies實現免密登陸:

baseurl = 'https://www.airbnb.cn/s/%E6%B7%B1%E5%9C%B3/homes?refinement_paths%5B%5D=%2Fhomes&current_tab_id=home_tab&selected_tab_id=home_tab&screen_size=large&hide_dates_and_guests_filters=false&place_id=ChIJkVLh0Aj0AzQRyYCStw1V7v0&map_toggle=false'
driver.get(baseurl)
cookies = []
with open('cookies.txt', 'r', encoding=funcs.funcs.check_charset('cookies.txt')) as f:
    for i in f:
        cookies.append(eval(i.strip()))
 
for i in cookies:
    driver.add_cookie(i)
 
time.sleep(3)
driver.refresh()

再次開啟Airbnb時,發現已經是登陸狀態,大功告成辣。

 到此這篇關於Python selenium+cookie實現免密登陸的範例程式碼的文章就介紹到這了,更多相關selenium cookie免密登陸內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com