1. 程式人生 > >抓取網頁資料 A標籤的HREF 值

抓取網頁資料 A標籤的HREF 值

在工作中,我們有時候需要從特定的網頁中抓取我們想要的資料,由於工作的需要,我給大家推薦一個專門的抓取類:Winista.HtmlParser.dll

當我們需要從有規律的網頁中提取資料時,如table tr td; ul li之類的,如果用正則表示式,或者做字串的處理,會非常頭痛。

上面的這個類可以解決此類問題。

首先,在工程檔案的BIN目錄裡新增引用這個類,然後在頁面中新增一些名稱空間,

using Winista.Text.HtmlParser.Visitors;
using Winista.Text.HtmlParser;
using Winista.Text.HtmlParser.Util;

using Winista.Text.HtmlParser.Filters;

using Winista.Text.HtmlParser.Tags;

先上傳一個類,包含了二個經常用到的方法

下面是具體的呼叫

有時間再把抓取table,ul的也整理一下,希望對大家有用,網上關於這方面的資料也有,但不是很全,主要還是靠自己摸索,