1. 程式人生 > >Python:第三方模組BeautifulSoup的安裝及簡單用法

Python:第三方模組BeautifulSoup的安裝及簡單用法

BeautifulSoup簡介

BeautifulSoup是python的一個第三方庫,在爬蟲中,起著網頁解析器的作用,可以對下載好的網頁進行頁面元素分析,提取出有價值的資料,相比較Lxml,BeautifulSoup的效能會差一些,畢竟是純python,但是BeautifulSoup解析網頁的支援度貌似會好一些。

安裝

附上bs4官網(https://www.crummy.com/software/BeautifulSoup/)

  windows

首先進入pip的安裝目錄,位於Scripts資料夾中

 

 然後執行pip install beautifulsoup4  
等待安裝完成 Linux $ sudo apt-get python-bs4(python2)
$ sudo apt-get python3-bs4(python3)   等待安裝完成 簡單用法 舉個例子
可以通過find_all()方法 找到相關區域,然後通過get_text()訪問標籤下面的內容,也可以讀取href屬性中的內容
更多的方法使用在官方說明文件上都有,官網上也有示例 小白髮帖,歡迎批評指正!!