<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
Python 3.8
Pycharm
requests >>> pip install requests
parsel >>> pip install parsel
win + R 輸入 cmd 點選確定, 輸入安裝命令 pip install 模組名 (pip install requests) 回車
在pycharm中點選Terminal(終端) 輸入安裝命令
選擇file(檔案) >>> setting(設定) >>> Project(專案) >>> python interpreter(python直譯器)
點選齒輪, 選擇add
新增python安裝路徑
選擇file(檔案) >>> setting(設定) >>> Plugins(外掛)
點選 Marketplace 輸入想要安裝的外掛名字 比如:翻譯外掛 輸入 translation / 漢化外掛 輸入 Chinese
選擇相應的外掛點選 install(安裝) 即可
安裝成功之後 是會彈出 重啟pycharm的選項 點選確定, 重啟即可生效
proxies_dict = { "http": "http://" + ip:埠, "https": "http://" + ip:埠, }
找我們想要資料內容, 從哪裡來的
傳送請求, 對於目標網址傳送請求
獲取資料, 獲取伺服器返回響應資料(網頁原始碼)
解析資料, 提取我們想要的資料內容
儲存資料, 爬音樂 視訊 本地csv 資料庫… IP檢測, 檢測IP代理是否可用 可用用IP代理 儲存
# 匯入資料請求模組 import requests # 資料請求模組 第三方模組 pip install requests # 匯入 正規表示式模組 import re # 內建模組 # 匯入資料解析模組 import parsel # 資料解析模組 第三方模組 pip install parsel >>> 這個是scrapy框架核心元件 lis = [] lis_1 = [] # 1. 傳送請求, 對於目標網址傳送請求 https://www.kuaidaili.com/free/ for page in range(11, 21): url = f'https://www.kuaidaili.com/free/inha/{page}/' # 確定請求url地址 """ headers 請求頭 作用偽裝python程式碼 """ # 用requests模組裡面get 方法 對於url地址傳送請求, 最後用response變數接收返回資料 response = requests.get(url) # <Response [200]> 請求之後返回response響應物件, 200狀態碼錶示請求成功 # 2. 獲取資料, 獲取伺服器返回響應資料(網頁原始碼) response.text 獲取響應體文字資料 # print(response.text) # 3. 解析資料, 提取我們想要的資料內容 """ 解析資料方式方法: 正則: 可以直接提取字串資料內容 需要把獲取下來html字串資料 進行轉換 xpath: 根據標籤節點 提取資料內容 css選擇器: 根據標籤屬性提取資料內容 哪一種方面用那種, 那是喜歡用那種 """ # 正規表示式提取資料內容 """ # 正則提取資料 re.findall() 呼叫模組裡面的方法 # 正則 遇事不決 .*? 可以匹配任意字元(除了換行符n以外) re.S ip_list = re.findall('<td data-title="IP">(.*?)</td>', response.text, re.S) port_list = re.findall('<td data-title="PORT">(.*?)</td>', response.text, re.S) print(ip_list) print(port_list) """ # css選擇器: """ # css選擇器提取資料 需要把獲取下來html字串資料(response.text) 進行轉換 # 我不會css 或者 xpath 怎麼辦 # #list > table > tbody > tr > td:nth-child(1) # //*[@id="list"]/table/tbody/tr/td[1] selector = parsel.Selector(response.text) # 把html 字串資料轉成 selector 物件 ip_list = selector.css('#list tbody tr td:nth-child(1)::text').getall() port_list = selector.css('#list tbody tr td:nth-child(2)::text').getall() print(ip_list) print(port_list) """ # xpath 提取資料 selector = parsel.Selector(response.text) # 把html 字串資料轉成 selector 物件 ip_list = selector.xpath('//*[@id="list"]/table/tbody/tr/td[1]/text()').getall() port_list = selector.xpath('//*[@id="list"]/table/tbody/tr/td[2]/text()').getall() # print(ip_list) # print(port_list) for ip, port in zip(ip_list, port_list): # print(ip, port) proxy = ip + ':' + port proxies_dict = { "http": "http://" + proxy, "https": "http://" + proxy, } # print(proxies_dict) lis.append(proxies_dict) # 4.檢測IP質量 try: response = requests.get(url=url, proxies=proxies_dict, timeout=1) if response.status_code == 200: print('當前代理IP: ', proxies_dict, '可以使用') lis_1.append(proxies_dict) except: print('當前代理IP: ', proxies_dict, '請求超時, 檢測不合格') print('獲取的代理IP數量: ', len(lis)) print('獲取可用的IP代理數量: ', len(lis_1)) print('獲取可用的IP代理: ', lis_1) dit = { 'http': 'http://110.189.152.86:40698', 'https': 'http://110.189.152.86:40698' }
到此這篇關於一文教你Python如何建立屬於自己的IP池的文章就介紹到這了,更多相關Python建立IP池內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45