前嗅ForeSpider教程:配置關鍵詞
對於通過關鍵詞,在網頁的搜尋欄檢索的情況,可以在軟體中,通過配置關鍵詞實現。那麼,今天小編來為大家介紹:如何在前嗅ForeSpider中,配置關鍵詞。
一,關鍵詞配置的步驟
第一步:開啟關鍵詞采集設定
點選關鍵詞采集按鈕, “關鍵詞采集”功能啟動。
第二步:進行關鍵詞采集配置
開啟關鍵詞配置後,在介面右下角會出現關鍵詞配置嚮導,按照“關鍵詞配置步驟”後面的提示進行操作。
在搜尋關鍵詞時,分為有驗證碼搜尋和無驗證碼搜尋兩種方式。
(1) 無驗證碼
逐個單擊關鍵詞配置步驟中的按鈕,根據提示一步步進行關鍵詞配置。對於無驗證碼的情況,可以跳過“驗證碼”、“驗證域”兩步。
以鳳凰網( http://news.ifeng.com/listpag... )為例:
① 按Ctrl+滑鼠左鍵單擊搜尋欄,儲存後關閉。
單擊搜尋欄:
②點選“完成”
③按Ctrl+滑鼠左鍵單擊“搜尋按鈕”。
單擊搜尋按鈕
④配置關鍵詞列表
在關鍵詞列表區域新增關鍵詞,可以用於關鍵詞搜尋。
關鍵詞列表
(2) 有驗證碼
逐個單擊關鍵詞配置步驟中的按鈕,根據提示一步步進行關鍵詞配置:
①按Ctrl+滑鼠左鍵單擊搜尋欄,儲存後關閉。
②按Ctrl+滑鼠左鍵單擊“驗證碼輸入框”。
③按Ctrl+滑鼠左鍵單擊“驗證碼圖片”。
④點選“完成”。
⑤按Ctrl+滑鼠左鍵單擊“搜尋按鈕”。
二,關鍵詞書寫規則
1.書寫規則
①關鍵詞之間用英文“;”或回車換行隔開。
②支援組內有兩個關鍵詞,組內關鍵詞用英文“,”隔開。
③各組的關鍵詞排列順序必須保持一致。
2.填寫方法
①儲存:填寫關鍵詞後,儲存生效。
②匯入:支援匯入txt格式的批量關鍵詞文件,文件不超過5M大小。
③去重:自動去除重複的關鍵詞。
④清空:清空關鍵詞列表。
三,關鍵詞的高階配置方法
- 需要“高階配置”的情況
使用視覺化配置之後,依舊無法正確採集時,說明關鍵詞視覺化配置獲取到的引數資訊,缺失或有誤。
需要通過點選“高階配置”按鈕,在彈框中手動配置關鍵詞引數。對比表單中的引數名稱,手動新增各項引數。
- 高階配置介紹
引數是指網頁請求資料時,返回的引數資訊。
關鍵詞配置-引數編輯
(1)請求地址
①一般情況下,完成“關鍵詞設定”後,請求地址會自動填充上。
②如果沒有或者有誤,可以手動進行新增。簡單的請求地址可以通過觀察,找到各項引數。複雜的請求地址需要藉助瀏覽器的開發者工具。
(2)POST請求
使用者根據目標網址不同,是否為POST請求,來決定是否選擇POST。
(3)Cookie重新整理方式
是指每採集每一條資料時,是否重新整理採集地址入口頁,以獲取Cookie資訊,可以參考開發者工具裡面的Cookie看一下是哪種重新整理方式。
①不重新整理:無需重新整理入口地址。
②首次重新整理:資料採集時,只重新整理一次入口地址。
③重複重新整理:採集每個關鍵詞時,都重新整理一次入口地址。
(4)請求引數表
一般情況下,完成“關鍵詞配置”後,請求引數表裡的引數資訊會自動填充上。如果沒有填充或有誤,則按照下文進行手動配置。
3.高階配置示例
以該網址為例,介紹如何手動新增引數表。 http://www.soqi.cn/search.xht...
第一步:觀察網址規律。
①請求地址:“?”前的地址是頁面的請求地址。
②檢索關鍵詞:keywords。
③其他引數:“=”前是引數名稱,“=”後是引數值。(如有驗證碼,引數型別中需要有“驗證碼”)
第二步:新增引數表。
點選新增按鈕,新增引數。
新增引數表
第三步:修改引數表。
修改引數表