Python 入門第一天:安裝Beautifulsoup4遇到的問題
阿新 • • 發佈:2019-01-28
對於Beautifulsoup4,官方的解釋如下:
Beautiful Soup提供一些簡單的、python式的函式用來處理導航、搜尋、修改分析樹等功能。它是一個工具箱,通過解析文件為使用者提供需要抓取的資料,因為簡單,所以不需要多少程式碼就可以寫出一個完整的應用程式。Beautiful Soup自動將輸入文件轉換為Unicode編碼,輸出文件轉換為utf-8編碼。你不需要考慮編碼方式,除非文件沒有指定一個編碼方式,這時,Beautiful Soup就不能自動識別編碼方式了。然後,你僅僅需要說明一下原始編碼方式就可以了。Beautiful Soup已成為和lxml、html6lib一樣出色的python直譯器,為使用者靈活地提供不同的解析策略或強勁的速度。 如果我們想進行爬蟲開發的話,那麼這個庫肯定是必不可少的。
下面是用終端進行安裝:
注意這裡需要區分以下你的python版本,,如果你使用的是Mac自帶的python,那麼你需要這樣寫:
pip install beautifulsoup4
如果你安裝了新版的python,我的電腦裝的python版本是3.6.3,所以我需要這樣寫
pip3 install beautifulsoup4
等待安裝完成…
完成之後,在工程中可以使用
from bs4 import BeautifulSoup
進行匯入模組,如果執行不報錯,那麼你就成功了。如果報錯的話,類似這個 ‘‘ import name HTMLParseError’’,這個代表著你的python版本和beautifulsoup4的支援版本不符,所以你需要更新一下你的beautifulsoup4
還是老樣子,根據版本號:
pip3 install --upgrade beautifulsoup4
更新完成之後,執行沒問題的話,恭喜你就可以使用bs4了,如果還是報錯(我的今天就遇到了這樣的問題),你就需要進入資料夾瞅一瞅了,開啟finder,前往資料夾:
/usr/local/lib/python3.6/site-packages
在這個資料夾裡找一找,看有沒有兩個beautifuls4的檔案,如果有,刪掉那個舊版本的,我的是不知道什麼原因,site-packages裡多了個 ‘‘beautifulsoup4-4.1.0-py3.6.egg-info’’檔案,刪除掉就好了。
beautifulsoup4安裝完成之後,還需要一個叫 lxml 的依賴庫:
pip3 install lxml
安裝完成之後就大功告成了。