python3 學習2（分頁翻看百度搜索結果）

阿新 • • 發佈：2018-11-03

# -*- coding: utf-8 -*-
from selenium import webdriver
import time
if __name__ == "__main__":
driver = webdriver.Chrome()
driver.maximize_window()
driver.get('http://www.baidu.com')

#通過ID找網頁的標籤，找到搜尋框的標籤
seek_input = driver.find_element_by_id("kw")
#設定搜尋的內容
seek_input.send_keys("2018財稅新政策")
#找到搜尋文件按鈕
seek_but = driver.find_element_by_id("su")
#並點選搜尋按鈕
seek_but.click()
#並點選搜尋按鈕

js = 'document.documentElement.scrollTop=10000'#拖動滾動條到底部
time.sleep(1)
driver.execute_script(js)
time.sleep(1)
total = 0 #頁面數
is_next_page = True #存在下一頁
page_num = 1 #要點選的頁面號
#往後翻頁
while is_next_page:
try:
total=total+1
if total == 1 :
result = driver.find_element_by_xpath("//a[@class='n']")
text=result.get_attribute('text')
if text.find('下一頁')>=0 :
result.click()
time.sleep(2)
driver.execute_script(js)
#print('第'+total+'頁')
else :
#result = driver.find_element_by_xpath("//a[@class='n']")
result = driver.find_element_by_link_text("下一頁>")
result.click()
time.sleep(2)
driver.execute_script(js)
print(result)
#for each_result in result:
# text=each_result.get_attribute('text')
# if text.find('下一頁')>=0 :
# each_result.click()
# time.sleep(2)
# driver.execute_script(js)
#print('第'+total+'頁')


except:
print("到最後一頁了")
break
#思路很簡單，不斷獲取下一頁標籤，觸發點選事件，不斷翻頁，我測的是翻到70頁，文章僅作小白學習筆記，想要獲取每 #頁的連結地址下載內容可以參考我的上一篇博文

python3 學習2（分頁翻看百度搜索結果）

python3 學習2（分頁翻看百度搜索結果）

HttpClient 實現爬取百度搜索結果（自動翻頁）

selenium-webdriver循環點擊百度搜索結果以及獲取新頁面的handler

JQ模糊匹配（類似百度搜索等）

C# 百度搜索結果xpath分析

python爬取百度搜索結果ur匯總

利用百度搜索結果爬取郵箱

百度搜索結果HTML分析

如何讓百度搜索結果顯示網站 logo

百度搜索結果爬蟲

PHP多程序抓取百度搜索結果

pyhon3爬取百度搜索結果

如何刪除百度搜索結果_如何刪除百度快照

百度搜索結果屏蔽百家號方法

Python+selenium+PhantomJS獲取百度搜索結果真實連結地址

百度搜索結果如何屏蔽百家號內容

python采集百度搜索結果帶有特定URL的鏈接

PHP網路爬蟲實踐：抓取百度搜索結果，並分析資料結構

網站關鍵詞排名怎麼優化到百度搜索引擎首頁（思維與技巧的結合）

Web自動化框架LazyUI使用手冊（2）--先跑起來再說（第一個測試用例-百度搜索）

python3 學習2（分頁翻看百度搜索結果）

相關推薦