1. 程式人生 > >爬蟲:html網頁原始碼標籤

爬蟲:html網頁原始碼標籤

瞭解HTML網頁標籤的分類至關重要。

網站:http://www.w3school.com.cn/tags/tag_hr.asp 詳細描述了html網頁標籤的分類。

常見的html標籤:

<div></div> 表示模組,某個區域的框架

<p></p> 表示字元資訊,寫文字內容

<li></li> 表示列表

<img> 可插入圖片

<h1></h1> 表示不同字號的標題

<a href = " "> 表示連結

 

Xpath標籤路徑