首頁 > 軟體

python解析庫Beautiful Soup安裝的詳細步驟

2023-09-06 06:08:48

一、Beautiful Soup的安裝

Beautiful Soup是Python的一個HTML或XML的解析庫,使用它可以很方便地從網頁中提取資料。它的解析器是依賴於lxml庫的,所以在此之前,請確保已經成功安裝好了lxml庫。

本文環境是windows 10 64位元+ python3.11, 此處以windows安裝為例。

1.1 安裝lxml庫

lxml庫的安裝,首先嚐試使用pip進行安裝:

pip install lxml

如果pip安裝報錯,比如提示缺少libxml2庫等資訊,那麼可以採用wheel方式安裝

採用wheel方式安裝,首先需要安裝wheel

pip install wheel

然後去官網https://pypi.org/project/lxml/下載lxml對應的的wheel版本, 當前最新版本是lxml 4.9.1, 點選Download files

在列出的files裡面,選出和自己的版本相匹配的,例如你的python版本是3.10的,你的機器是windows系統,64位元版本,那麼就選lxml-4.9.1-cp310-cp310-win_amd64.whl

這裡比較坑的一點是,python版本最新的已經是3.11版本了,但是lxml沒有對應的官方windows 311版本,只有linux下的311版本。可以選擇對python版本降級,比如降到python3.10版。

或者在https://www.lfd.uci.edu/~gohlke/pythonlibs/裡,倒是可以找到311版本的windows wheel安裝包,可以自行嘗試。

安裝wheel包的話,到wheel安裝包所在目錄執行pip 命令即可,或者帶上全路徑也可以

pip install lxml-4.9.0-cp311-cp311-win_amd64.whl

1.2 安裝beautifulsoup4

推薦使用pip來安裝,執行下述安裝命令

pip install beautifulsoup4

1.3 驗證beautifulsoup4能否執行

執行以下程式碼,能成功輸出hello,就說明可以成功使用beautifulsoup4進行解析了。

如果只有beautifulsoup4安裝成功,lxml庫沒有正確安裝的話,下面程式碼不能成功執行。

from bs4 import BeautifulSoup as bs

soup = bs('<p>hello</p>', 'lxml')
print(soup.p.string)

補充:Python 安裝beautifulsoup4庫失敗或參照錯誤的解決辦法

1、首先下載官網BeautifulSoup4軟體包裡面的beautifulsoup4庫

2、然後解壓縮到G:pythonLibsite-packagesbs4目錄下,開啟cmd視窗,進入到解壓目錄下,進入 G:pythonLibsite-packagesbs4beautifulsoup4-4.3.2beautifulsoup4-4.3.2

3、在該目錄下執行cmd

python setup.py build
python setup.py install

可能會遇到的報錯 :error in pymmseg setup command: use_2to3 is invalid.

報錯的解決方案:需要把版本降低,小於58的最後一個版本是57.5.0,pip降一下就可以了:

pip install setuptools==57.5.0

就可以重新安裝庫了

沒遇到報錯,直接到這步驟即可

匯入模組(測試模組匯入是否成功)

進入cmd-python輸入:

from bs4 import BeautifulSoup

 注意:匯入這個庫是要大寫的,小寫不行。

問題解決成功!

ps:這是我碰到的問題,解決了很久也問了很多人,還是沒能夠解決是靠自己經過百度查詢了很多的資料才解決的,希望能幫助到你們。

總結

到此這篇關於python解析庫Beautiful Soup安裝的詳細步驟的文章就介紹到這了,更多相關解析庫Beautiful Soup安裝內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com