（2-2）python+selenium第二個自動化指令碼：用函式實現獲取貓眼電影中排名前100的

阿新 • • 發佈：2019-02-06

用函式實現：從貓眼電影的排行中，選出排名在前十頁的電影資訊，包括：
排名：1
URL：//ms0.meituan.net/mywww/image/loading_2.e3d934bf.png
片名：霸王別姬
主演：張國榮,張豐毅,鞏俐
上映時間：1993-01-01(中國香港)
得分：9.6

'''

import json
import requests
from requests.exceptions import RequestException
import re,time
#獲取網頁原始碼
def get_one_page(url):
      try:
            response=requests.get(url)
            if response.status_code==200:
                  return response.text
            return None
      except RequestException:
            return None
#利用正則表示式得到資料，以字典形式表示出來
def parse_one_page(html):
      pattern = re.compile('<dd>.*?board-index.*?>(.*?)</i>.*?src="(.*?)".*?<p class="name"><a.*?>(.*?)</a>.*?star.*?>(.*?)</p>.*?releasetime.*?>(.*?)</p>.*?integer.*?>(.*?)</i>.*?fraction.*?>(.*?)</i>.*?</dd>',re.S)
      items = re.findall(pattern,html)
      for item in items:
            yield{        #yield字典，必須放在函式裡使用
                  'index':item[0],
                  'image': item[1],
                  'title': item[2],
                  'actor': item[3].strip()[3:],
                  'time': item[4].strip()[5:],

                  'score': item[5] + item[6]
                  }
#寫入檔案
def write_to_file(content):
      with open('maoyandy+def.txt','a',encoding='utf-8')as f:
            f.write(json.dumps(content,ensure_ascii=False)+'\n')
#
def main(offset):
      url='http://maoyan.com/board/4?offset='+str(offset)
      html=get_one_page(url)
      for item in parse_one_page(html):
            print(item)
            write_to_file(item)
if __name__=='__main__':
      for i in range(10):
            main(offset=i*10)
            time.sleep(1)

（2-2）python+selenium第二個自動化指令碼：用函式實現獲取貓眼電影中排名前100的

用函式實現：從貓眼電影的排行中，選出排名在前十頁的電影資訊，包括：排名：1URL：//ms0.meituan.net/mywww/image/loading_2.e3d934bf.png片名：霸王別姬

（1）python+selenium第一個自動化指令碼：實現開啟百度首頁並搜尋selenium

一、第一個自動化指令碼：實現開啟百度首頁並搜尋”selenium”#coding=utf-8 #為防止亂碼，編碼為utf-8 from selenium import webdriver #匯入selenum的webdriver包 driver.find_

基於硬體的C（C++）語言程式設計教程12：用函式實現2數之和

本系列文章希望探討以硬體為平臺講述C（C++）知識的一個新的途徑，改變目前大多數C語言教程僅注重C語言本身的語法規則，而脫離其應用環境的現狀。希望讀者通過本教程的學習，能夠立刻學以致用，真正將所學知識應用到專案實踐中。開發環境：Atmel Studio 7.0 硬體平臺：Microch

（六）Python函數語言程式設計1：高階函式 Higher-order-function

# 高階函式 Higher-order-function # 變數可以指向函式 # 以Python內建的求絕對值的函式abs()為例，呼叫該函式用以下程式碼： print(abs(-10)) # 10 print(abs) # <built-in f

（四）我的第二個GUI程式，實現Python程式的介面與邏輯分離

1. 在Pycharm中，新建專案SecondGUI。2. 呼叫Qt設計師（Designer.exe），新設計一個視窗的ui檔案（myComboBox.ui)3. 呼叫PyUIC5，將myComboBox.ui檔案轉為myComboBox.py檔案。4. 新建my_Comb

Python 爬蟲實例（12）—— python selenium 爬蟲

bsp ide doc wid environ att fig exc title # coding:utf-8 from common.contest import * def spider():　　url = "http://www.salamoyua.

【Java+Selenium（5）】---- 編寫第一個自動化測試指令碼

前面介紹了環境搭建和三大瀏覽器的啟動方法，這篇文章將正式介紹自動化測試指令碼的編寫。寫了一個簡單的百度自動搜尋，先體會一下，後續的文章會詳細的介紹 Web Driver API 中的元素定位、瀏覽器控制、多視窗切換、多表單切換等等。直接看下程式

（轉）python selenium-webdriver 元素操作之滑鼠和鍵盤事件

參考資料：https://blog.csdn.net/zh175578809/article/details/76767748 參考資料2：https://blog.csdn.net/qq_41817302/article/details/79618654 　　selenium 提供了比較完整的鍵盤操作，

第二章（1.4）Python基礎知識（流程控制）

Python流程控制一、條件判斷語句基本形式（注意不要少寫了冒號:） if <條件判斷1>: <執行1> elif <條件判斷2>: <執行2> elif <條件判斷3>

第二章（1.5）Python基礎知識（資料型別）

Pyhton 四種常用資料型別一、list（列表）list是一種有序的集合，可以隨時新增和刪除其中的元素用len()函式可以獲得list元素的個數列表操作包含以下函式:cmp(list1, list2)

第二章（1.6）Python基礎知識（高階函式）

Python函式一、定義函式定義一個函式要使用def語句，依次寫出函式名、括號、括號中的引數和冒號:，然後，在縮排塊中編寫函式體，函式的返回值用return語句返回。示例： def my_abs(x): if x >= 0:

支持中文的基於詞為基本粒度的前綴樹（prefix trie）python實現

情況 key -s path join ret int blank ref Trie樹，也叫字典樹、前綴樹。可用於”predictive text”和”autocompletion”。亦可用於統計詞頻（邊插入Trie樹邊更新或加入詞頻）。在計算機科學中。

Python爬蟲從入門到放棄（十八）之 Scrapy爬取所有知乎用戶信息(上)

user 說過 -c convert 方式 bsp 配置文件 https 爬蟲爬取的思路首先我們應該找到一個賬號，這個賬號被關註的人和關註的人都相對比較多的，就是下圖中金字塔頂端的人，然後通過爬取這個賬號的信息後，再爬取他關註的人和被關註的人的賬號信息，然後爬取被關註人

Python學習（十一） Python 類

count sym == AC val setter 輸入 com ttr Python 類面向對象編程是有效的軟件編寫方法之一。 python程序編寫方法 1、函數編程，使用函數方式 2、面向對象編程，使用類方式創建類創建方法構造方法，__ini

python（十二）python操作redis

mysq 配置文件遊標 edi 參數字典 PE 增值 pass 1、python要操作redis 首先需要安裝redis模塊，然後導入才能使用安裝：pip install redis 導入：import redis 2、連接redis

在手機端安裝簡易QQ機器人（需要ROOT）Python版

更新 qq機器人重新 UC span 格式 out __main__ 教程最簡單的QQ機器人，不用的安卓手機可以完美的設置一個QQ機器人24小時在線。實現自動回復功能，問答等等。例如：你：你好機器人：你好，我是QQ機器人。還可以自己設置對應的回復！還有好多功能可以

《機器學習》周志華學習筆記第四章決策樹（課後習題）python 實現

一、基本內容 1.基本流程決策樹的生成過程是一個遞迴過程，有三種情形會導致遞迴返回（1）當前節點包含的yangben全屬於同一類別，無需劃分；（2）當前屬性集為空，或是所有yangben在所有屬性上的取值相同，無法劃分；（3）當前結點包含的yangben集合為空，不能

《機器學習》周志華學習筆記第三章線性模型（課後習題）python 實現

線性模型一、內容 1.基本形式 2.線性迴歸：均方誤差是迴歸任務中最常用的效能度量 3.對數機率迴歸：對數機率函式（logistic function）對率函式是任意階可導的凸函式，這是非常重要的性質。 4.線性判別分析（LDA 是一種降維的方法） 5.多分類學習：

《機器學習》周志華學習筆記第八章整合學習（課後習題）python實現

1.個體與整合 1.1同質整合 1.2異質整合 2.boosting:代表AdaBoost演算法 3.Bagging與隨機森林 3.1Bagging 是並行式整合學習方法最著名的代表（基於自主取樣法bootstrap sampling）自己學習時編寫了

《機器學習》周志華學習筆記第六章支援向量機（課後習題）python 實現

一、 1.間隔與支援向量 2.對偶問題 3.核函式 xi與xj在特徵空間的內積等於他們在原始yangben空間中通過函式k(.,.)計算的結果。核矩陣K總是半正定的。 4.軟間隔與正則化軟間隔允許某些samples不滿足約束鬆弛變數 5.支援

（2-2）python+selenium第二個自動化指令碼：用函式實現獲取貓眼電影中排名前100的

相關推薦