1. 程式人生 > >php 根據標籤的屬性值來爬取內容的正則表示式

php 根據標籤的屬性值來爬取內容的正則表示式

最近在學著做資料爬蟲,經常遇到的一個問題是,經常要根據某個標籤的屬性值來獲取該表下面的內容,

後來找到了一個封裝的方法,挺好用的,下面看程式碼:

/**
	 * $html-需要爬取的頁面內容
	 * $tag-要查詢的標籤
	 * $attr-要查詢的屬性名
	 * $value-屬性名對應的值
	 */
	public function get_tag_data($html,$tag,$attr,$value){
		$regex = "/<$tag.*?$attr=\".*?$value.*?\".*?>(.*?)<\/$tag>/is";
		preg_match_all($regex,$html,$matches,PREG_PATTERN_ORDER);
		return $matches[1];
	}

DONE!!!!!