1. 程式人生 > >如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

本文主要介紹如何使用后羿採集器的 智慧模式 ,免費採集大眾點評商家的地址、人均、評價、電話等資訊。

採集工具簡介:

后羿採集器是一款基於人工智慧技術的網頁採集器,只需要輸入網址就能夠自動識別網頁資料,無需配置即可完成資料採集,是業內首家支援三種作業系統(包括Windows、Mac和Linux)的 網路爬蟲軟體 。

該軟體是一款真正免費的資料採集軟體,對採集結果匯出沒有任何限制,沒有程式設計基礎的小白使用者也可輕鬆實現資料採集要求。

官方網址:http://www.houyicaiji.com/

採集物件簡介:

大眾點評是中國領先的本地生活資訊及交易平臺,也是全球最早建立的獨立第三方消費點評網站。大眾點評不僅為使用者提供商戶資訊、消費點評及消費優惠等資訊服務,同時亦提供團購、餐廳預訂、外賣及電子會員卡等O2O(OnlineTo Offline)交易服務。

採集欄位:

商家名、商家連結、地址、點評數、人均、口味、環境、服務、團購數、展示圖片、電話

功能點目錄 :

如何採集列表+詳情頁型別網頁

如何採集手機版網頁的資料

如何下載圖片

採集結果預覽:

匯出到Excel表格:

私信小編01 02 03 04 即可獲取大量的學習教程以及大量的PDF哦!

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

匯出到本地的圖片:

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

下面我們來詳細介紹一下如何免費採集大眾點評網商家資料,我們以杭州自助餐的商家資料為例,具體步驟如下:

步驟一:下載安裝后羿採集器,並註冊登入

1、 點此 開啟后羿採集器官網,下載並安裝爬蟲軟體工具—后羿採集器軟體

2、點選註冊登入,註冊新賬號,登入后羿採集器

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

【溫馨提示】 您可以直接使用此款爬蟲軟體,不需要進行註冊,但是匿名賬戶下的任務在切換到註冊使用者時會丟失,因此建議您註冊後使用。

后羿採集器為神箭手雲旗下產品,如果您是神箭手使用者,可直接登入。

步驟二:新建採集任務

1、複製 大眾點評網自助餐 商家的網頁(需要搜尋結果頁的網址,而不是首頁的網址)

點此 瞭解關於如何正確地輸入網址。

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

進群:548377875 即可獲取數十套PDF以及大量的教學視訊哦!

2、新建智慧模式採集任務

您可以在軟體上直接新建採集任務,也可以通過匯入規則來建立任務。

點此 瞭解如何匯入和匯出採集規則。

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

步驟三:配置採集規則

1、設定提取資料欄位

在智慧模式下,我們輸入網址後軟體即可自動識別出頁面上的資料並生成採集結果,每一類資料對應一個採集欄位,我們可以右擊欄位進行相關設定,包括修改欄位名稱、增減欄位、處理資料等。

點此 瞭解如何對採集欄位進行配置。

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

在列表頁上,我們需要採集大眾點評網商家的商家名、商家連結、地址、點評數、人均、口味、環境、服務、團購數及展示圖片等內容,由於星級評價元素比較特殊,后羿V2.1.22版本暫不支援採集此欄位,後續版本中會實現這一功能,欄位設定效果如下:

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

2、使用深入採集功能提取詳情頁資料

在列表頁上只展示出了自助餐商家的部分資訊,如果需要採集商家電話,我們需要右擊商家連結使用“深入採集”功能,跳轉到詳情頁進行採集。

點此 深入瞭解如何採集列表+詳情頁型別網頁。

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

在詳情頁面我們可以看到商家電話,我們點選“新增欄位”按鈕,然後在頁面中點選商家電話。

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

我們可以看到新增的欄位採集出來的是字元而不是實際上的商家電話,這是由於在PC瀏覽器模式下,大眾點評對商家電話元素進行了設定,當我們複製這個電話號碼是並不是實際上的電話號碼而是字元。

由於不同網頁在不同瀏覽器模式下呈現的內容可能不同,大眾點評網的商家電話在手機瀏覽器模式下能展示出實際的內容,因此我們可以通過切換瀏覽器模式的方式來抽取商家號碼的欄位。

點此 瞭解更多切換瀏覽器模式的內容。

點此 瞭解如何採集手機版網頁的內容。

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

步驟四:設定並啟動採集任務

1、設定採集任務

完成了採集資料新增,我們可以開始啟動採集任務了。在啟動之前我們需要對採集任務進行一些設定,從而提高採集的穩定性和成功率。

點選“設定”按鈕,在彈出的執行設定頁面中我們可以進行執行設定和防遮蔽設定,這裡我們勾選“跳過繼續採集”,設定“2”秒請求等待時間,勾選“不載入網頁圖片”,防遮蔽設定就按照系統預設設定,然後點選儲存。

點此 深入瞭解如何對採集任務進行配置。

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

2、啟動採集任務

點選“儲存並啟動”按鈕,可在彈出的頁面中進行一些高階設定,包括定時啟動、自動入庫和下載圖片,本次示例中未使用到定時採集及自動入庫功能,勾選下載圖片到本地的功能後,點選“啟動”執行爬蟲工具。

點此 深入瞭解什麼是定時採集。

點此 深入瞭解什麼是自動入庫。

點此 深入瞭解如何下載圖片。

【溫馨提示】 免費版本可以使用非週期性定時採集功能,下載圖片功能是免費的。個人專業版及以上版本可以使用高階定時功能和自動入庫功能。

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

3、執行任務提取資料

任務啟動之後便開始自動採集資料,我們從介面上可以直觀的看到程式執行過程和採集結果,採集結束之後會有提醒。

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!

 

步驟五:匯出並檢視資料

資料採集完成後,我們可以檢視和匯出資料,后羿採集器支援多種匯出方式(手動匯出到本地、手動匯出到資料庫、自動釋出到資料庫、自動釋出到網站)和匯出檔案的格式(EXCEL、CSV、HTML和TXT),我們選擇自己需要方式和檔案型別,點選“確認匯出”。

點此 深入瞭解如何檢視和清空採集資料。

點此 深入瞭解如何匯出採集結果。

【溫馨提示】: 所有手動匯出功能都是免費的。個人專業版及以上版本可以使用釋出到網站功能。

如何使用免費爬蟲軟體抓取大眾點評商家電話資訊!請勿洩露資訊!