1. 程式人生 > >爬蟲爬取csdn登陸頁面持續載入,selenium模擬無法進行的解決方案

爬蟲爬取csdn登陸頁面持續載入,selenium模擬無法進行的解決方案

1.近日在爬取csdn時發現csdn突然需要登陸了,登陸沒關係,用selenium模擬填寫個登陸表單也就行了,但實際操作中發現,模擬進行到登陸頁面時頁面持續載入,後續步驟無法進行,自然無法登陸和爬取,如下圖: csdn登陸頁面 只要在一定時間後終止瀏覽器繼續載入就行,嘗試了下面的解決方案可以解決這個問題

 1.browser.set_page_load_timeout(10)   #設定頁面載入時間
 2.try:
 3.browser.get('https://blog.csdn.net/pygodnet')
 4.except TimeoutException:
 5.	print('超時啦')
 6.	browser.execute_script('window.stop()')  #終止頁面載入
 7.button = browser.find_element_by_css_selector('body > div.main > div > div > div:nth-child(2) > div > h3 > a')     #獲取登陸選項
 8. button.click()