1. 程式人生 > >php 抓取div內容

php 抓取div內容

1. 取得指定網頁內的所有圖片測試

開新視窗複製程式碼列印?
  1. <?php   
  2. //取得指定位址的內容,並儲存至text
  3. $text=file_get_contents('http://andy.diimii.com/');    
  4. //取得所有img標籤,並儲存至二維陣列match
  5. preg_match_all('#<img[^>]*>#i'$text$match);   
  6. //印出match
  7. print_r($match);   
  8. ?>  
<?php
//取得指定位址的內容,並儲存至text
$text=file_get_contents('http://andy.diimii.com/'); 

//取得所有img標籤,並儲存至二維陣列match
preg_match_all('#<img[^>]*>#i', $text, $match);

//印出match
print_r($match);
?>

2. 取得指定網頁內的第一張圖片測試

開新視窗複製程式碼列印?
  1. <?php   
  2. //取得指定位址的內容,並儲存至text
  3. $text=file_get_contents('http://andy.diimii.com/');   
  4. //取得第一個img標籤,並儲存至陣列match(regex語法與上述同義)
  5. preg_match('/<img[^>]*>/Ui'$text$match);   
  6. //印出match
  7. print_r($match);   
  8. ?>  
<?php
//取得指定位址的內容,並儲存至text
$text=file_get_contents('http://andy.diimii.com/');

//取得第一個img標籤,並儲存至陣列match(regex語法與上述同義)
preg_match('/<img[^>]*>/Ui', $text, $match);

//印出match
print_r($match);
?>

3. 取得指定網頁內的特定div區塊(藉由id判斷)測試

開新視窗複製程式碼列印?
  1. <?php   
  2. //取得指定位址的內容,並儲存至text
  3. $text=file_get_contents('http://andy.diimii.com/2009/01/seo%e5%8c%96%e7%9a%84%e9%97%9c%e9%8d%b5%e5%ad%97%e5%bb%a3%e5%91%8a%e9%80%a3%e7%b5%90/');    
  4. //去除換行及空白字元(序列化內容才需使用)
  5. //$text=str_replace(array("/r","/n","/t","/s"), '', $text);   
  6. //取出div標籤且id為PostContent的內容,並儲存至陣列match
  7. preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) <//div>/si',$text,$match);   
  8. //印出match[0]
  9. print($match[0]);   
  10. ?>  
<?php
//取得指定位址的內容,並儲存至text
$text=file_get_contents('http://andy.diimii.com/2009/01/seo%e5%8c%96%e7%9a%84%e9%97%9c%e9%8d%b5%e5%ad%97%e5%bb%a3%e5%91%8a%e9%80%a3%e7%b5%90/'); 

//去除換行及空白字元(序列化內容才需使用)
//$text=str_replace(array("/r","/n","/t","/s"), '', $text);   

//取出div標籤且id為PostContent的內容,並儲存至陣列match
preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) <//div>/si',$text,$match);

//印出match[0]
print($match[0]);
?>

4. 上述2及3的結合測試

開新視窗複製程式碼列印?
  1. <?php   
  2. //取得指定位址的內容,並儲存至text
  3. $text=file_get_contents('http://andy.diimii.com/2009/01/seo%e5%8c%96%e7%9a%84%e9%97%9c%e9%8d%b5%e5%ad%97%e5%bb%a3%e5%91%8a%e9%80%a3%e7%b5%90/');       
  4. //取出div標籤且id為PostContent的內容,並儲存至陣列match
  5. preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) <//div>/si',$text,$match);      
  6. //取得第一個img標籤,並儲存至陣列match2
  7. preg_match('/<img[^>]*>/Ui'$match[0], $match2);    
  8. //印出match2[0]
  9. print_r($match2[0]);   
  10. ?>