這幾天研究了一下php中的curl類庫,做了一個簡單的百度搜索,先上程式碼

 <div style="width:200px;height:100px;">
<div>百度搜索</div>
<form action="" method="get">
<input type="text" name="key">
<input type="submit" value="搜尋">
</form>
</div>
<?php
$k = '';
$k = !empty($_GET['key'])?$_GET['key']:'';
session_start();
$_SESSION['key'] = $k; $curl = curl_init();
// 設定你需要抓取的URL for($i = 0;$i<2;$i++){
curl_setopt($curl, CURLOPT_URL, "http://www.baidu.com/s?wd={$_SESSION['key']}&pn={$i}");
// 設定header
curl_setopt($curl, CURLOPT_HEADER, 1);
// 設定cURL 引數,要求結果儲存到字串中還是輸出到螢幕上。
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
// 執行cURL,請求網頁
$data = curl_exec($curl); $pre = '/<h3 class="t"><a.*?href = "(.*?)".*?target="_blank".*?>(.*?)<\/a><\/h3>/s';
preg_match_all($pre,$data,$match); foreach ($match[1] as $k => $v) {
?>
<div style="font-size:20px;color:red;">
<a href="<?php echo $v;?>" target="_blank"><?php echo strip_tags($match[2][$k]);?></a>
</div>
<?php
}
} curl_close($curl); ?>

經過分析百度的搜尋時的url發現有一個規律

https://www.baidu.com/s?wd=搜尋的關鍵字

但是我發現使用https協議後不能夠獲得百度上的資料於是改為http://www.baidu.com?wd=搜尋的關鍵字就可以啦!!

效果圖如下: