1. 程式人生 > >外貿建站之數據采集常用PHP代碼分享

外貿建站之數據采集常用PHP代碼分享

all pre 新網站 arr fun 圖片 一起學 rim color

相信很多人有過網站升級的經驗,那就一定會想到怎樣將舊網站數據搬遷采集到新網站。也有很多搞外貿建站站群推廣的,也會有數據采集的需要。

不同網站系統中的數據只能通過采集才能獲得了,除非編程搞一個數據接口,兩個站數據可以相互交換。

這裏分享一下我們開發中用到的代碼:

function get_pic($cont,$path){ 
    $pattern_src = ‘/<[img|IMG].*?src=[\‘|\"](.*?(?:[\.gif|\.jpg|\.png]))[\‘|\"].*?[\/]?>/‘; 
    $num = preg_match_all($pattern_src, $cont
, $match_src); $pic_arr = $match_src[1]; //獲得圖片數組 $spider = new Spider(); foreach ($pic_arr as $pic_item) { //循環取出每幅圖的地址 $pic_item=ltrim($pic_item," "); if(is_int(strpos($pic_item, ‘http‘))){ $arcurl = $pic_item; } else { $arcurl = "http://www.chinaobd2.com".$pic_item
; } $saveimgfile=$spider->downloadImage($arcurl,$path); $saveimgfile="/upload/".$saveimgfile; $cont=str_replace($pic_item,$saveimgfile,$cont); } $cont=ereg_replace("<a [^>]*>|<\/a>","",$cont); return $cont; }

這段代碼可以從采集的內容裏面批量提取圖片,然後保存到服務器上。非常實用,以上代碼是愛的外貿建站親測,可用。

Function replace_chinaobd2_com_script($cont){
$preg = "/<script[\s\S]*?<\/script>/i";

$newstr = preg_replace($preg,"",$cont,-1);    //第四個參數中-1 是全部替換,如果是3,則表示替換3次

return $newstr;
}

這段代碼可以過濾掉采集內容部分的腳本代碼

以上代碼進愛的外貿建站程序員親測,如有問題,歡迎留言。會持續分享有用采集代碼給大家,共大家一起學習進步

外貿建站之數據采集常用PHP代碼分享