1. 程式人生 > >Python 爬取網頁中JavaScript動態新增的內容(二)

Python 爬取網頁中JavaScript動態新增的內容(二)

使用 selenium + phantomjs 實現

1、準備環境

selenium(一個用於web應用程測試的工具)安裝:pip install selenium phantomjs(是一種無介面的瀏覽器,用於完成網頁的渲染)下載:http://phantomjs.org/download.html

2、使用

from selenium import webdriver

url = 'http://jandan.net/ooxx'
driver = webdriver.PhantomJS(
    executable_path='D:/Software/phantomjs-2.1.1-windows/bin/phantomjs.exe')  # 如果沒有配置phantomjs的環境變數,需要手動指定路徑
driver.get(url)
print(driver.page_source)