1. 程式人生 > >鑑於崔慶才大大的對於 beautifulsoup 的再理解

鑑於崔慶才大大的對於 beautifulsoup 的再理解

源地址

soups  = BeautifulSoup(html)
soup = BeautifulSoup(open('index.html'))

 

print soup.prettify()

 

Tag通俗點講就是 HTML 中的一個個標籤
print (soup.title)
print (soup.head)
print (soup.a)
print (soup.p)
查詢的是在所有內容中的第一個符合要求的標籤
對於 Tag,它有兩個重要的屬性,是 name 和 attrs,下面我們分別來感受一下

name
print
soup.name print soup.head.name #[document] #head

attrs

print soup.p.attrs
如果我們想要單獨獲取某個屬性,可以這樣,例如我們獲取它的 class 叫什麼
print soup.p['class']
#['title']

還可以這樣,利用get方法,傳入屬性的名稱,二者是等價的