1. 程式人生 > >Python 入門第一天:安裝Beautifulsoup4遇到的問題

Python 入門第一天:安裝Beautifulsoup4遇到的問題

對於Beautifulsoup4,官方的解釋如下:

Beautiful Soup提供一些簡單的、python式的函式用來處理導航、搜尋、修改分析樹等功能。它是一個工具箱,通過解析文件為使用者提供需要抓取的資料,因為簡單,所以不需要多少程式碼就可以寫出一個完整的應用程式。Beautiful Soup自動將輸入文件轉換為Unicode編碼,輸出文件轉換為utf-8編碼。你不需要考慮編碼方式,除非文件沒有指定一個編碼方式,這時,Beautiful Soup就不能自動識別編碼方式了。然後,你僅僅需要說明一下原始編碼方式就可以了。Beautiful Soup已成為和lxml、html6lib一樣出色的python直譯器,為使用者靈活地提供不同的解析策略或強勁的速度。

 如果我們想進行爬蟲開發的話,那麼這個庫肯定是必不可少的。

下面是用終端進行安裝:

注意這裡需要區分以下你的python版本,,如果你使用的是Mac自帶的python,那麼你需要這樣寫:

pip install beautifulsoup4

如果你安裝了新版的python,我的電腦裝的python版本是3.6.3,所以我需要這樣寫

pip3 install beautifulsoup4

等待安裝完成…
完成之後,在工程中可以使用

from bs4 import BeautifulSoup

進行匯入模組,如果執行不報錯,那麼你就成功了。如果報錯的話,類似這個 ‘‘ import name HTMLParseError’’,這個代表著你的python版本和beautifulsoup4的支援版本不符,所以你需要更新一下你的beautifulsoup4

還是老樣子,根據版本號:

pip3 install --upgrade beautifulsoup4

更新完成之後,執行沒問題的話,恭喜你就可以使用bs4了,如果還是報錯(我的今天就遇到了這樣的問題),你就需要進入資料夾瞅一瞅了,開啟finder,前往資料夾:

/usr/local/lib/python3.6/site-packages

在這個資料夾裡找一找,看有沒有兩個beautifuls4的檔案,如果有,刪掉那個舊版本的,我的是不知道什麼原因,site-packages裡多了個 ‘‘beautifulsoup4-4.1.0-py3.6.egg-info’’檔案,刪除掉就好了。

beautifulsoup4安裝完成之後,還需要一個叫 lxml 的依賴庫:

pip3 install lxml

安裝完成之後就大功告成了。