<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
有不少朋友在開發爬蟲的過程中喜歡使用Selenium + Chromedriver,以為這樣就能做到不被網站的反爬蟲機制發現。
先不說淘寶這種基於使用者行為的反爬蟲策略,僅僅是一個普通的小網站,使用一行Javascript程式碼,就能輕輕鬆鬆識別你是否使用了Selenium + Chromedriver模擬瀏覽器。
我們來看一個例子。
使用下面這一段程式碼啟動Chrome視窗:
現在,在這個視窗中開啟開發者工具,並定位到Console索引標籤,如下圖所示。
from selenium.webdriver import Chrome driver = Chrome()
現在,在這個視窗輸入如下的js程式碼並按下確認鍵:
window.navigator.webdriver
可以看到,開發者工具返回了 true。如下圖所示。
但是,如果你開啟一個普通的Chrome視窗,執行相同的命令,可以發現這行程式碼的返回值為 undefined,如下圖所示:
所以,如果網站通過js程式碼獲取這個引數,返回值為 undefined說明是正常的瀏覽器,返回 true說明用的是Selenium模擬瀏覽器。一抓一個準。這裡給出一個檢測Selenium的js程式碼例子:
webdriver = window.navigator.webdriver; if(webdriver){ console.log('你這個小可愛你以為使用Selenium模擬瀏覽器就可以了?') } else { console.log('正常瀏覽器') }
網站只要在頁面載入的時候執行這個js程式碼,就可以識別存取者是不是用的Selenium模擬瀏覽器。如果是,就禁止存取或者觸發其他反爬蟲的機制。
那麼對於這種情況,在爬蟲開發的過程中如何防止這個引數告訴網站你在模擬瀏覽器呢?
可能有一些會js的朋友覺得可以通過覆蓋這個引數從而隱藏自己,但實際上這個值是不能被覆蓋的:
對js更精通的朋友,可能會使用下面這一段程式碼來實現:
Object.defineProperties(navigator, {webdriver:{get:()=>undefined}});
執行效果如下圖所示:
確實修改成功了。這種寫法就萬無一失了嗎?並不是這樣的,如果此時你在模擬瀏覽器中通過點選連結、輸入網址進入另一個頁面,或者開啟新的視窗,你會發現, window.navigator.webdriver又變成了 true。
如下圖所示。
那麼是不是可以在每一個頁面都開啟以後,再次通過webdriver執行上面的js程式碼,從而實現在每個頁面都把 window.navigator.webdriver設定為 undefined呢?也不行。
因為當你執行: driver.get(網址)的時候,瀏覽器會開啟網站,載入頁面並執行網站自帶的js程式碼。
所以在你重設 window.navigator.webdriver之前,實際上網站早就已經知道你是模擬瀏覽器了。
接下來,又有朋友提出,可以通過編寫Chrome外掛來解決這個問題,讓外掛裡面的js程式碼在網站自帶的所有js程式碼之前執行。
這樣做當然可以,不過有更簡單的辦法,只需要設定Chromedriver的啟動引數即可解決問題。
在啟動Chromedriver之前,為Chrome開啟實驗性功能引數 excludeSwitches,它的值為 [‘enable-automation’],
完整程式碼如下:
from selenium.webdriver import Chrome from selenium.webdriver import ChromeOptions option = ChromeOptions() option.add_experimental_option('excludeSwitches', ['enable-automation']) driver = Chrome(options=option)
此時啟動的Chrome視窗,在右上角會彈出一個提示,不用管它,不要點選 停用按鈕。
再次在開發者工具的Console索引標籤中查詢 window.navigator.webdriver,可以發現這個值已經自動變成 undefined了。並且無論你開啟新的網頁,開啟新的視窗還是點選連結進入其他頁面,都不會讓它變成 true。執行效果如下圖所示。
以上就是移除Selenium中window.navigator.webdriver值的詳細內容,更多關於window.navigator.webdriver值移除的資料請關注it145.com其它相關文章!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45