Selenium利用Python影象識別解決驗證碼問題

阿新 • • 發佈：2018-12-31

Python影象識別參考：http://www.th7.cn/Program/Python/201602/768304.shtml

指令碼思路：瀏覽器頁面到達驗證碼輸入頁面，針對驗證碼圖片進行另存為儲存到本地，然後將圖片複製到pytesser資料夾下（只有指令碼和圖片都在該資料夾下才能完成識別），然後呼叫Python圖片識別處理驗證碼圖片函式並返回驗證碼，然後就可以完成驗證碼輸入操作！

運用到的模組：python圖片識別、Python模擬鍵盤、Selenium滑鼠事件

第一步：在C:\Python27\Lib\site-packages\pytesser路徑下建立該Python檔案，用作圖片識別的方法

#coding=utf-8
'''
Created on 2018年4月22日

@author: Administrator
'''
from selenium import webdriver
import time,shutil,random,os
from selenium.webdriver.common.action_chains import ActionChains
import win32api,win32con
from PIL import Image
from io import BytesIO
from pytesser import *


def identifyImage(driver,element,imageName,browserPath='C:\\Users\\Administrator\\Downloads',pytesserPath='C:\\Python27\\Lib\\site-packages\\pytesser'):
    '''
    element:圖片驗證碼元素;
    imageName:儲存的驗證碼圖片名稱;
    browserPath:瀏覽器預設下載路徑;
    pytesserPath:pytesser資料夾路徑;
    DownloadPath:圖片驗證碼另存為完成的檔案路徑（包含檔名）;
    savePath:圖片驗證碼儲存在pytesser中的路徑（包含檔名）;
    '''
    DownloadPath = browserPath + '\\' + imageName
    savePath = pytesserPath + '\\' + imageName
    try:
        os.remove(DownloadPath)
    except WindowsError:
        pass
    try:
        os.remove(savePath)
    except WindowsError:
        pass
    action = ActionChains(driver)
    action.context_click(element).perform()
    win32api.keybd_event(86,0,0,0)
    win32api.keybd_event(86,0,win32con.KEYEVENTF_KEYUP,0)
    time.sleep(2)
    win32api.keybd_event(13,0,0,0)
    win32api.keybd_event(13,0,win32con.KEYEVENTF_KEYUP,0)
    time.sleep(2)
    shutil.copy(DownloadPath,pytesserPath)
    im = Image.open(savePath)
    imagetext = image_to_string(im).strip()
    return imagetext

第二步：實際場景呼叫圖片識別

#coding=utf-8
'''
Created on 2018年4月22日

@author: Administrator
'''
from selenium import webdriver
import time,shutil,random,os
from selenium.webdriver.common.action_chains import ActionChains
import win32api,win32con
from pytesser.IdentifyImage import identifyImage
from PIL import Image
from io import BytesIO
from pytesser import *


def login(username=u'XXXXXX',password=u'XXXXXX'):   #登入函式
    driver= webdriver.Chrome()
    driver.maximize_window()
    driver.get('XXXXXX') 
    driver.implicitly_wait(30)
    driver.find_element_by_id('j_username').clear()
    driver.find_element_by_id('j_username').send_keys(username)
    driver.find_element_by_id('j_password').clear()
    driver.find_element_by_id('j_password').send_keys(password)
    driver.find_element_by_class_name('bigFont').click()
    time.sleep(2)
    try:
        driver.find_element_by_xpath('//span[contains(text(),"XXXXXX")]').click()
        driver.find_element_by_class_name('bigFont').click()
    except:
        pass
    return driver

def editpw(driver):    #用例函式
    driver.implicitly_wait(20)
    time.sleep(3)
    driver.find_element_by_class_name('icon-dept').click()
    try:
        driver.find_element_by_xpath('//div[@id="guide_buttons"]/img[2]').click()
    except Exception as e:
        print e
    elems = driver.find_elements_by_class_name('clientsearch-grid-text')
    random.choice(elems).click()
    driver.find_element_by_class_name('reSetPassword').click()
    time.sleep(2)
    elem = driver.find_element_by_class_name('verification-code-img')    #定位驗證碼圖片
    value = identifyImage(driver,elem,'vCode.jpg')                        #呼叫Python圖片識別方法
    driver.find_element_by_class_name('verification-code-text').send_keys(value)    #輸入驗證碼
    time.sleep(2)
    driver.find_element_by_xpath('//span[contains(text(),"確認")]').click()
    try:
        message = driver.find_element_by_class_name('crm_prompt_text').text
        if message == u'密碼已重置，請接收簡訊和郵件通知!':
            return True
        return False
    except:
        return False
    
driver = login()
Boole = editpw(driver)
print Boole
driver.quit()

PS：登入驗證碼無需通過該方法處理，可以直接通過新增Cookie來繞過登入驗證碼，然後該方法只能識別一些簡單的圖片驗證碼！

Selenium利用Python影象識別解決驗證碼問題

Python影象識別參考：http://www.th7.cn/Program/Python/201602/768304.shtml指令碼思路：瀏覽器頁面到達驗證碼輸入頁面，針對驗證碼圖片進行另存為儲存到本地，然後將圖片複製到pytesser資料夾下（只有指令碼和圖片都在該資料

[Python][爬蟲]利用OCR技術識別圖形驗證碼

releases 查找表方法 jpg threshold tex ima 輸出 sim ocr圖片識別通常可以利用tesserocr模塊，將圖片中內容識別出來並轉換為text並輸出 Tesserocr是python的一個OCR識別庫，是對tesseract做的一層pyth

Python OCR識別圖片驗證碼（一）

歡迎加入學習交流QQ群：657341423 對於某些網站登入的時候，往往需要輸入驗證碼才能實現登入。如果要爬蟲這類網站，往往總會比這個驗證碼導致無法爬取資料。以下介紹一種比較折中的方法，也是比較可行的方法：實現思想： 1、通過截圖獲取驗證碼圖片，為什麼要截圖

利用Python識別圖形驗證碼！實現自動登入！室友驚訝的合不攏嘴！

驗證碼有圖形驗證碼、極驗滑動驗證碼、點觸驗證碼、宮格驗證碼。這回重點講講圖形驗證碼的識別。雖說圖形驗證碼最簡單，但是對於我這等新手，還是要苦學一番。首先尋找測試網站，網站選的是如雲閣小說網，小網站不怕被封。他們的驗證碼一般如下：

python tesseract-ocr 基礎驗證碼識別功能（Windows）

please 沒有 pan eas pin mage 需要 utf 文件夾一、環境　　windows 7 x64 　　Python 3 + 二、安裝　　1、tesseract-ocr安裝　　http://digi.bib.uni-mannheim.

Python爬蟲基礎：驗證碼的爬取和識別詳解

今天要給大家介紹的是驗證碼的爬取和識別，不過只涉及到最簡單的圖形驗證碼，也是現在比較常見的一種型別。執行平臺：Windows Python版本：Python3.6 IDE: Sublime Text 其他：Chrome瀏覽器簡述流程：步驟1：簡單介紹驗證碼步驟2：

python爬蟲時圖形驗證碼識別( tesserocr)

window環境下：第一步：安裝tesseract：教程如下：https://www.cnblogs.com/jianqingwang/p/6978724.html 第二步：安裝 tesserocr ：到這裡下載whl版本 &

爬蟲驗證碼解決思路 Python爬蟲四種驗證碼的解決思路

參考崔慶才python網路爬蟲開發實戰 Python爬蟲四種驗證碼的解決思路 2018年06月07日 10:17:13 小卒曹阿瞞閱讀數：5584

Python爬蟲四種驗證碼的解決思路

1.輸入式驗證碼這種驗證碼主要是通過使用者輸入圖片中的字母、數字、漢字等進行驗證。如下圖圖1 圖2 解決思路：這種是最簡單的一種，只要識別出裡面的內容，然後填入到輸入框中即可。這種識別技術叫OCR，這裡我們

Python識別圖形驗證碼，實現自動登陸（附視訊教程）

驗證碼有圖形驗證碼、極驗滑動驗證碼、點觸驗證碼、宮格驗證碼。這回重點講講圖形驗證碼的識別。雖說圖形驗證碼最簡單，但是對於我這等新手，還是要苦學一番。首先尋找測試網站，網站選的是如雲閣小說網，小網站不怕被封。他們的驗證碼一般如下：視訊教程： &n

利用pytesser識別圖形驗證碼

簡單識別 1.一般思路驗證碼識別的一般思路為：圖片降噪圖片切割影象文字輸出 1.1 圖片降噪所謂降噪就是把不需要的資訊通通去除，比如背景，干擾線，干擾畫素等等，只剩下需要識別的文字，讓圖片變成2進位制點陣最好。對於彩色背景

使用python的OpenCV模組識別滑動驗證碼的缺口

前面寫過一篇使用selenium模擬登入解決滑塊驗證問題，在該篇文章裡，使用selenium滑動模組找缺口主要靠“蒙”，最近終於找到一個好的方法，可以將滑動驗證碼中的缺口識別出來了，主要是學習了點選開啟

利用百度OCR實現驗證碼自動識別

/** * 獲取識別驗證碼 * @param imageUrl * @return */ public static String OCRVCode(String imageUrl){ String VCode = "";

Java應用OpenvCV指南其六：利用OpenCV實現的數字識別（驗證碼識別）

之前介紹了很多概念上的東西，這次讓我們來進行一次實際的應用。數字識別可以應用在許多領域，如數字型驗證碼的識別，車牌識別等領域。下面借我之前完成的一個數字驗證碼識別的小專案來簡單認識一下圖象識別領域的知識。如果在閱讀這篇文章時有什麼疑問，可以參考一下之

Python應用（一）識別網站驗證碼以及識別演算法

00 識別涉及技術驗證碼識別涉及很多方面的內容。入手難度大,但是入手後,可拓展性又非常廣泛,可玩性極強,成就感也很足。驗證碼影象處理驗證碼影象識別技術主要是操作圖片內的畫素點,通過對圖片的畫素點進行一系列的操作,最後輸出驗證碼影象內的每個字元的文字矩

python引入PIL做驗證碼,發現字型不支援的解決辦法

from PIL import Image, ImageDraw, ImageFont, ImageFilter import random # 隨機字母: def rndChar():

Windows下Python+OpenCV+zbar影象識別二維碼識別編譯環境安裝

一、準備檔案二、安裝 1、python庫的安裝點選下載下的python-2.7.14.amd64.msi，一路next下去，安裝完成後，配置環境變數，在path裡面加入安裝的python的根目錄，例如本人安裝目錄d:\Python27。

JAVA + Selenium + 易源識別圖片驗證碼模擬註冊

“易源資料”圖片識別API說明文件地址：https://www.showapi.com/api/lookPoint/184程式碼模擬的也是“易源資料”的賬號註冊，主要程式碼如下：模擬註冊入口-YiYuanUtil.javapackage com.vps.api.util;

mac使用python識別圖形驗證碼

前言最近在研究驗證碼相關的操作，所以準備記錄下安裝以及使用的過程。雖然之前對驗證碼的破解有所瞭解的，但是之前都是簡單使用之後就不用了，沒有記錄一個詳細的過程，所以後面再用起來也要重新從網上查詢資料比較麻煩，所以這裡準備對研究過程的關鍵點做一個記錄。首先這篇文章，主要是研究圖形驗證碼，後期會不定時拓展內

Python 實現簡單圖片驗證碼登錄

需要 spa tps dem 圖片背景 round alt word exc 朋友說公司要在測試環境做接口測試，登錄時需要傳入正確的圖片的驗證碼，本著懶省事的原則，推薦他把測試環境的圖片驗證碼寫死，我們公司也是這麽做的^_^。勸說無果/(ㄒoㄒ)/~~，只能通過 OCR 技

Selenium利用Python影象識別解決驗證碼問題

相關推薦