1. 程式人生 > >第十二章避開採集的陷阱 使用selenium庫處理cookie

第十二章避開採集的陷阱 使用selenium庫處理cookie

#!/usr/bin/env python
# _*_ coding:utf-8 _*_
#根據cookie訪問網站
#思路:第一個webdriver獲取網站和cookie,然後第二個web網站載入同一個網站(必須先載入,這樣selenium才知道cookie屬於哪個網站)
#刪除所有的cookie,替換成第一個的cookie,當再次載入頁面的額時候應該兩組的cookie時間戳、原始碼、和其他資訊應該完全一致
from selenium import webdriver

driver=webdriver.phantomjs(executable_path='D:/pycharm/phantomjs-2.1.1-windows/bin/phantomjs')
driver.get("http://pythonscraping.com")
driver.implicitly_wait(1)
print(driver.get_cookies())

saveCookies=driver.get_cookies()

driver2=webdriver.phantomjs(executable_path='D:/pycharm/phantomjs-2.1.1-windows/bin/phantomjs')
driver2.get("http://pythonscraping.com")
driver2.delete_all_cookies()
for cookie in saveCookies:
    driver2.add_cookie(cookie)

driver2.get("http://pythonscraping.com")
driver2.implicitly_wait(1)
print(driver2.get_cookies())