selenium+python爬取資料跳轉網頁

阿新 • • 發佈：2018-11-10

專案要做一個四個層級欄的資料抓取，而且點選查詢後資料會在新跳出的網頁。

原始碼如下註釋解釋

from selenium import webdriver
import selenium
#from time import sleep as sp

url='http://202.127.42.157/moazzys/nongqing.aspx'
site=webdriver.Chrome()
site.get(url)

#data={}
mainhandle=site.current_window_handle#主頁面控制代碼  每個瀏覽器標籤頁都有一個控制代碼
years=site.find_elements_by_xpath(' 
//select[@id="ContentPlaceHolder1_year"]/option')
co_year=len(years)
for d in range(co_year):
        years[d].click()
        provs=site.find_elements_by_xpath('//select[@id="ContentPlaceHolder1_prov"]/option')
        co_prov=len(provs)
        for c in range(co_prov):
            provs[c].click()
            items 
=site.find_elements_by_xpath('//select[@id="ContentPlaceHolder1_item"]/option')
            co_item=len(items)
            for b in range(co_item):
                items[b].click()
                types=site.find_elements_by_xpath('//select[@id="ContentPlaceHolder1_type"]/option')
                co_type=len(types)
                 
for a in range(co_type):
                    types[a].click()
                    #點選進入新視窗
                    site.find_element_by_id('ContentPlaceHolder1_btnsearch').click()
                    handles = site.window_handles
                    for handle in handles:# 輪流得出標籤頁的控制代碼 切換視窗 因為只有兩個標籤頁實際是假for迴圈 
                        if handle!=mainhandle:
                            site.switch_to_window(handle)
                            #獲得資料
                            try:
                                raw=site.find_element_by_xpath('//tr/td[@align="right"]')
                                print (raw.text)
                                #data.append(raw.text)
                            except Exception as e:
                                print("無該資料")
                            #獲得資料
                            site.close() #關閉當前標籤頁
                    site.switch_to_window(mainhandle)#回到原來標籤頁
                    types=site.find_elements_by_xpath('//select[@id="ContentPlaceHolder1_type"]/option')
                    types[a].click()
                items=site.find_elements_by_xpath('//select[@id="ContentPlaceHolder1_item"]/option')
                items[b].click()
            provs=types=site.find_elements_by_xpath('//select[@id="ContentPlaceHolder1_prov"]/option')
            provs[c].click()
        year=types=site.find_elements_by_xpath('//select[@id="ContentPlaceHolder1_year"]/option')
        years[d].click()
site.quit()

selenium+python爬取資料跳轉網頁

專案要做一個四個層級欄的資料抓取，而且點選查詢後資料會在新跳出的網頁。原始碼如下註釋解釋 from selenium import webdriver import selenium #from time import sleep as sp url='http://202.127.42.15

selenium+python爬取數據跳轉網頁

tns pen 得出 items search ems find option http 項目要做一個四個層級欄的數據抓取，而且點擊查詢後數據會在新跳出的網頁。源碼如下註釋解釋 from selenium import webdriver import seleniu

Selenium+Python爬取房天下二手房資料

注意！注意！注意！本文中大圖較多，建議使用PC檢視，手機端效果較差！在上篇“Selenuim+Python網路爬蟲基礎講解”博文中講了一些Selenium的基礎知識，接下來就要開始實戰了。其實使用Selenium爬取網頁的思路很簡單，首先梳理一下爬取流程。開啟二手房珠海地區首頁

Python爬蟲scrapy框架爬取動態網站——scrapy與selenium結合爬取資料

scrapy框架只能爬取靜態網站。如需爬取動態網站，需要結合著selenium進行js的渲染，才能獲取到動態載入的資料。如何通過selenium請求url，而不再通過下載器Downloader去請求這個url?方法：在request物件通過中介軟體的時候，在中介軟體內部開始

如何使用Python爬取資料？看完這篇文章你就懂了！

前段時間小編髮了一篇有關於Python資料型別的文章，由於只是介紹了資料型別，我覺得遠遠不夠，所以呢我現在寫一篇用Python爬取資料的文章來補充。首先我會介紹如何使用scrapy抓取二手房資料，然後我會將抓下來的資料進行了一些簡單的分析和視覺化。最後奉上資料，感興趣的朋友可

python爬取資料熱點詞生成詞雲

這是當時在中國mooc學用python玩轉資料時，寫的一個小demo. 程式實現步驟 1.從某一網站爬取資料，比如我是在豆瓣爬取的書評利用Requests庫的get()爬取網頁使用BeatifulSoup庫對爬取網頁進行解析。寫入

python爬取資料並將其存入mongodb

其實很早就想知道如何將爬取到的資料存入資料庫，並且實現前後臺的互動功能，昨天剛剛看了一集關於爬資料並存資料的視訊，今天，在這裡總結一下~ 以下為最終所需要爬取的資訊：由於需要爬取所有的二手商品資訊，所以以下內容也要爬取到： 1.先寫一個py檔案，用於爬取上述圖片類目導

python爬取資料儲存為Excel格式

#encoding:'utf-8' import urllib.request from bs4 import BeautifulSoup import os import time import xlrd import xlwt from xlutils.copy impo

python爬取資料hesder設定cookie

#encoding:'utf-8' import urllib.request from bs4 import BeautifulSoup import os import time import pymysql import xlwt import requests imp

selenium+python 爬取網路圖片(2) -- 百度

上一篇博文《selenium+python 爬取網路圖片(1) -- soso、谷歌、好搜》介紹瞭如何用selenium+python在諸如soso、谷歌、好搜等搜尋引擎上爬取圖片的方法，但是卻沒用提到百度，因為百度的情況比較特殊。首先，百度圖片的資料更好，因為每幅圖片都有

xpath的使用方法以及python爬取資料的儲存

前面寫了幾篇關於自己爬蟲時的進度以及遇到的問題，今天系統的爬取了一個網站之後又對爬蟲方法有了更好的認識，所以今天我會盡量用明晰的語言來給大家介紹這些方法。首先說明下我要爬取的內容：http://www.zbj.com/appdingzhikaifa/sq10054601.

python爬取資料（豆瓣上TOP250的電影資訊）初學者必看！！！

python爬取豆瓣上TOP250電影初學python爬蟲。我這裡用的 lxml提取xpath的方式來爬取資料 lxml爬取的速度會比bs4快，所以這裡我選用的lxml 話不多上，趕緊上教程。爬取的思路： 1.獲取網頁解析（有些網頁需要代理） 2.解析完成之

Selenium學習三——利用Python爬取網頁表格資料並存到excel

利用Python爬取網頁表格資料並存到excel 1、具體要求：讀取教務系統上自己的成績單，並儲存到本地的excel中 2、技術要求：利用Selenium+Python獲取網頁，自動登陸並操作到成績單頁面通過xlwt模組，將表格儲存到本地excel （其中xlwt

Selenium學習四——利用Python爬取網頁多個頁面的表格資料並存到已有的excel中

利用Python爬取網頁多個頁面的表格資料並存到已有的excel中 1、具體要求獲取牛客網->題庫->線上程式設計->劍指Offer網頁，獲取表格中的全部題目，儲存到本地excel中 2、技術要求利用Selenium+Python獲取網頁，操

python+selenium+PhantomJS爬取網頁動態加載內容

use for ive comm 自動化測試 mac os x page 影響 blank 一般我們使用python的第三方庫requests及框架scrapy來爬取網上的資源，但是設計javascript渲染的頁面卻不能抓取，此時，我們使用web自動化測試化工具Selen

Python爬取網頁的圖片資料

本案例是基於PyCharm開發的，也可以使用idea。在專案內新建一個python檔案TestCrawlers.py TestCrawlers.py # 匯入urllib下的request模組 import urllib.request # 匯入正則匹配包 import re

python使用selenium爬取js加密的網頁

python使用selenium爬取js加密的網頁我們經常使用Python從網站上爬取我們喜歡的圖片，比如從煎蛋網爬取妹子圖。現在雖然煎蛋網取消了“OOXX”欄目，但是至少把名字換成了隨手拍，我今天想從該網站爬取妹子圖，去發現沒有辦法從爬取的程式碼中找到 ‘.jpg’ 關鍵詞，這就尷尬了

Python爬取網頁資料並匯入表格

import requests import time import random import socket import http.client from bs4 import BeautifulSoup import csv def getContent(url

python爬取JS動態網頁完整指南（selenium+chrome headless）

11.23：更新，每次還要開啟瀏覽器多影響執行效率，看到蟲師講了chrome headless，非常好用引用新增： from selenium.webdriver.chrome.options import Options 程式碼新增： chrome_options =

【爬蟲】python selenium 爬取資料

最近公司有一項爬取資料的工作，借鑑以往的程式碼將爬蟲重新更新並整理將現有爬蟲分成幾部分 0.檔案讀取器其實檔案讀取和4中的檔案儲存是在一個部分的這裡簡單介紹下xls的讀取def deal_xl

selenium+python爬取資料跳轉網頁

相關推薦