Python實現自動登入，強行突破圖形驗證碼！

阿新 • • 發佈：2018-11-22

驗證碼有圖形驗證碼、極驗滑動驗證碼、點觸驗證碼、宮格驗證碼。這回重點講講圖形驗證碼的識別。

學習Python中有不明白推薦加入交流群
號：516107834
群裡有志同道合的小夥伴，互幫互助，
群裡有不錯的學習教程！

雖說圖形驗證碼最簡單，但是對於我這等新手，還是要苦學一番。首先尋找測試網站，網站選的是如雲閣小說網，小網站不怕被封。他們的驗證碼一般如下：

Python實現自動登入，強行突破圖形驗證碼！

可以看出有微弱的干擾線和較強的干擾點，驗證碼是沒有邊框的，這裡為了排版好看，我加上去的...

灰度處理

把彩色驗證碼圖片轉為灰色的圖片。

Python實現自動登入，強行突破圖形驗證碼！

import cv2
image = cv2.imread('1.jpeg', 0)
cv2.imwrite('1.jpg', image)

二值化處理

將圖片處理為只有黑白兩色的圖片，這裡發現干擾線沒有了，這就意味著我們只需要處理干擾點即可。

Python實現自動登入，強行突破圖形驗證碼！

import cv2
image = cv2.imread('1.jpeg', 0)
ret, image = cv2.threshold(image, 100, 255, 1)
height, width = image.shape
new_image = image[0:height, 0:150]
cv2.imwrite('1.jpg', new_image)

降噪處理

去除小黑點，也就是孤立的黑色畫素點。

Python實現自動登入，強行突破圖形驗證碼！

點降噪原理就是檢測黑色點相鄰的8個點，判斷8個點的顏色情況。如果全是白點，那麼就認為這個點是白色的，做黑點變白點處理。如⑤點處，以田字格來看，相鄰共有8個區域。

Python實現自動登入，強行突破圖形驗證碼！

①②③點座標如下圖，同理可知④⑤⑥⑦⑧⑨點座標情況

Python實現自動登入，強行突破圖形驗證碼！

降噪程式碼如下：

import cv2
import numpy as np
from PIL import Image
def inverse_color(image, col_range):
 # 讀取圖片，0意味著圖片變為灰度圖
 image = cv2.imread(image, 0)
 # 圖片二值化，100為設定閥值，255為最大閥值，1為閥值型別，當前點值大於閥值，設定為0，否則設定為255。ret是return value縮寫，代表當前的閥值
 ret, image = cv2.threshold(image, 110, 255, 1)
 # 圖片的高度和寬度
 height, width = image.shape
 # 圖片反色處理，原因：上面的處理只能生成白字黑底的圖片，而我們需要的是黑字白底的圖片
 img2 = image.copy()
 for i in range(height):
 for j in range(width):
 img2[i, j] = (255 - image[i, j])
 img = np.array(img2)
 # 對處理後的圖片做擷取
 height, width = img.shape
 new_image = img[0:height, col_range[0]:col_range[1]]
 cv2.imwrite('handle_one.png', new_image)
 image = Image.open('handle_one.png')
 return image
def clear_noise(img):
 # 圖片降噪處理
 x, y = img.width, img.height
 for i in range(x):
 for j in range(y):
 if sum_9_region(img, i, j) < 2:
 # 改變畫素點顏色，白色
 img.putpixel((i, j), 255)
 img = np.array(img)
 cv2.imwrite('handle_two.png', img)
 img = Image.open('handle_two.png')
 return img
def sum_9_region(img, x, y):
 """
 田字格
 """
 # 獲取當前畫素點的顏色值
 cur_pixel = img.getpixel((x, y))
 width = img.width
 height = img.height
 if cur_pixel == 255: # 如果當前點為白色區域,則不統計鄰域值
 return 10
 if y == 0: # 第一行
 if x == 0: # 左上頂點,4鄰域
 # 中心點旁邊3個點
 sum_1 = cur_pixel + img.getpixel((x, y + 1)) + img.getpixel((x + 1, y)) + img.getpixel((x + 1, y + 1))
 return 4 - sum_1 / 255
 elif x == width - 1: # 右上頂點
 sum_2 = cur_pixel + img.getpixel((x, y + 1)) + img.getpixel((x - 1, y)) + img.getpixel((x - 1, y + 1))
 return 4 - sum_2 / 255
 else: # 最上非頂點,6鄰域
 sum_3 = img.getpixel((x - 1, y)) + img.getpixel((x - 1, y + 1)) + cur_pixel + img.getpixel((x, y + 1)) + img.getpixel((x + 1, y)) + img.getpixel((x + 1, y + 1))
 return 6 - sum_3 / 255
 elif y == height - 1: # 最下面一行
 if x == 0: # 左下頂點
 # 中心點旁邊3個點
 sum_4 = cur_pixel + img.getpixel((x + 1, y)) + img.getpixel((x + 1, y - 1)) + img.getpixel((x, y - 1))
 return 4 - sum_4 / 255
 elif x == width - 1: # 右下頂點
 sum_5 = cur_pixel + img.getpixel((x, y - 1)) + img.getpixel((x - 1, y)) + img.getpixel((x - 1, y - 1))
 return 4 - sum_5 / 255
 else: # 最下非頂點,6鄰域
 sum_6 = cur_pixel + img.getpixel((x - 1, y)) + img.getpixel((x + 1, y)) + img.getpixel((x, y - 1)) + img.getpixel((x - 1, y - 1)) + img.getpixel((x + 1, y - 1))
 return 6 - sum_6 / 255
 else: # y不在邊界
 if x == 0: # 左邊非頂點
 sum_7 = img.getpixel((x, y - 1)) + cur_pixel + img.getpixel((x, y + 1)) + img.getpixel((x + 1, y - 1)) + img.getpixel((x + 1, y)) + img.getpixel((x + 1, y + 1))
 return 6 - sum_7 / 255
 elif x == width - 1: # 右邊非頂點
 sum_8 = img.getpixel((x, y - 1)) + cur_pixel + img.getpixel((x, y + 1)) + img.getpixel((x - 1, y - 1)) + img.getpixel((x - 1, y)) + img.getpixel((x - 1, y + 1))
 return 6 - sum_8 / 255
 else: # 具備9領域條件的
 sum_9 = img.getpixel((x - 1, y - 1)) + img.getpixel((x - 1, y)) + img.getpixel((x - 1, y + 1)) + img.getpixel((x, y - 1)) + cur_pixel + img.getpixel((x, y + 1)) + img.getpixel((x + 1, y - 1)) + img.getpixel((x + 1, y)) + img.getpixel((x + 1, y + 1))
 return 9 - sum_9 / 255
def main():
 img = '1.jpeg'
 img = inverse_color(img, (0, 160))
 clear_noise(img)
if __name__ == '__main__':
 main()

解決最大的問題後，接下來就是實現自動登陸。首先使用selenium自動點選登陸按鈕。

Python實現自動登入，強行突破圖形驗證碼！

到登陸介面後，利用selenium自動輸入使用者名稱，密碼，對驗證碼區域進行截圖。而後對驗證碼截圖進行處理，最後成功獲取驗證碼。

這裡為什麼是截圖呢，原因是驗證碼圖片一直在變化。比如說我現在複製這個8863驗證碼的圖片連結，在新的標籤頁開啟，會發現驗證碼改變了，不是8863，而是另外一張驗證碼圖片。那麼我們通過獲取當前頁面的驗證碼連結，從而來獲取驗證碼圖片，這種方法肯定是不可行的。

通過查閱相關資料，知道了帶cookies訪問驗證碼連結頁面，能夠成功解決這個問題。不過由於相關的庫沒匯入成功，也就放棄了。等下回做驗證碼機器學習的時候，再給予解決。

Python實現自動登入，強行突破圖形驗證碼！

登陸成功

Python實現自動登入，強行突破圖形驗證碼！

自動登陸程式碼如下：

import re
import cv2
import time
import numpy as np
import pytesseract
from PIL import Image
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
USER = '你的使用者名稱'
PASSWORD = '你的密碼'
browser = webdriver.Chrome()
wait = WebDriverWait(browser, 20)
def inverse_color(image, col_range):...
def clear_noise(img):...
def sum_9_region(img, x, y):...
def auto_login():
 """
 實現網頁自動登陸
 """
 url = 'http://www.quanben9.com/'
 browser.get(url)
 # 查詢登陸按鈕並點選
 button = browser.find_element_by_css_selector('#top1 > div > a:nth-child(3)')
 button.click()
 # 查詢使用者名稱輸入框並輸入使用者名稱
 input_first = browser.find_element_by_name('username')
 input_first.send_keys(USER)
 # 查詢密碼輸入框並輸入密碼
 input_second = browser.find_element_by_name('password')
 input_second.send_keys(PASSWORD)
 # 獲取瀏覽器截圖後，手動定位驗證碼位置，獲得驗證碼截圖
 browser.save_screenshot('Login_page.png')
 photo = Image.open('login_page.png')
 box = (1210, 710, 1360, 755)
 photo.crop(box).save('Verification.png')
 # 對驗證碼進行灰度，二值化處理，而後降噪處理
 handle_verification_code('Verification.png')
 # 對處理後的驗證碼圖片進行識別
 image = Image.open('handle_two.png')
 image.show()
 result = pytesseract.image_to_string(image)
 # 畢竟提供的庫識別能力有限，不一定能完整得到結果，需要對結果進行篩選
 result = re.sub('[a-zA-Z’!"#$%&'()*+,-./:;<=>[email protected]，。?★、…【】《》？“”‘’！[\]^_`{|}~]+', '', result.replace(' ', ''), re.S)
 print(result)
 # 判斷識別是否成功
 if len(result) == 4:
 # 獲得驗證碼輸入框並輸入驗證碼資訊
 input_third = browser.find_element_by_name('code')
 input_third.send_keys(result)
 time.sleep(2)
 # 獲得登陸按鈕並點選
 button_2 = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, 'body > div.main > div > form > ul > li:nth-child(5) > input[type="submit"]')))
 button_2.click()
 time.sleep(5)
 else:
 return auto_login()
def handle_verification_code(img):
 img = inverse_color(img, (0, 160))
 img = clear_noise(img)
 return img
def main():
 auto_login()
if __name__ == '__main__':
 main()
 # 結束程式
 exit()

Python實現自動登入，強行突破圖形驗證碼！

驗證碼有圖形驗證碼、極驗滑動驗證碼、點觸驗證碼、宮格驗證碼。這回重點講講圖形驗證碼的識別。學習Python中有不明白推薦加入交流群號：516107834 &

利用Python識別圖形驗證碼！實現自動登入！室友驚訝的合不攏嘴！

驗證碼有圖形驗證碼、極驗滑動驗證碼、點觸驗證碼、宮格驗證碼。這回重點講講圖形驗證碼的識別。雖說圖形驗證碼最簡單，但是對於我這等新手，還是要苦學一番。首先尋找測試網站，網站選的是如雲閣小說網，小網站不怕被封。他們的驗證碼一般如下：

Python實現京東登入，類封裝

直接執行輸入自己賬戶密碼即可登入，獲取資料 # 引入包 import time import requests from bs4 import BeautifulSoup class JD_crawl: def __init__(self, username, passw

linux shell ssh實現自動登入，並且執行一些操作並返回到當前主機

#!/usr/bin/expect -f #-------------------------------------------------- about us # product: monitorone # Author:matthew # Last Modified:

python 爬蟲如何通過scrapy簡單模擬登陸豆瓣網，手動進行圖形驗證碼的驗證

1.建立scrapy爬蟲程式，在terminal命令列輸入’scrapy startproject douban_login’ 2.建立爬蟲主程式，主要步驟都在這裡實現，以douban_login.py命名程式程式碼如下： import scrapy from

Python爬蟲模擬登入(三)：手動輸入驗證碼，登入

拿到了引數password，還差一個驗證碼；imgurl表示驗證碼圖片地址；接收圖片並顯示；等待輸入驗證碼後提交post； imgbuf = s.get(imgurl).content #

python+selenium十三：破解簡單的圖形驗證碼 python+selenium十三：破解簡單的圖形驗證碼

python+selenium十三：破解簡單的圖形驗證碼此方法可破解簡單的驗證碼，如：注：中文識別正在尋找辦法安裝： 1、python3 2、Pillow 3、pytesseract 4、tesseract-o

解決 python中使用tesserocr，Imag模組處理驗證碼的問題

python程式： from PIL import Image import tesserocr imag=Image.open(r"path") print(tesserocr.image_to_text(imag)) 會報以下錯誤： Traceback (most recent cal

Selenium+Python 自動化操控登入介面（有簡單驗證碼圖片校驗）

從最簡單的Web瀏覽器的登入介面開始，登入介面如下：進行Web頁面自動化測試，對頁面上的元素進行定位和操作是核心。而操作又是以定位為前提的，因此，對頁面元素的定位是進行自動化測試的基礎。頁面上的元素就像人一樣，有各種屬性，比如元素名字，元素i

Python識別圖形驗證碼，實現自動登陸（附視訊教程）

驗證碼有圖形驗證碼、極驗滑動驗證碼、點觸驗證碼、宮格驗證碼。這回重點講講圖形驗證碼的識別。雖說圖形驗證碼最簡單，但是對於我這等新手，還是要苦學一番。首先尋找測試網站，網站選的是如雲閣小說網，小網站不怕被封。他們的驗證碼一般如下：視訊教程： &n

Python 實現全自動登入(真正的全自動，自動識別驗證碼)

你沒有看錯，全自動驗證~~~ 黑科技？還是黑程式碼？我感覺這個看在你用啥，對不對？反正我用來（* * * * ）你懂得好了，先說一下用到的東西 selenium (本意是用來全自動測試) Ph

python實現自動定時給女朋友發手機簡訊，每天一個笑話！

Python 的概念加群：865597862即可自動獲取大量Python視訊教程以及各類PDF！大四的生活就是這麼無聊，我琢磨著也學了這麼多東西了，為啥不能用自己的知識來給生活找點樂子呢？我想反正每天都要給Ta問候一聲早安，為何不同時講個笑話呢？如果能寫個程

【Android】【功能設計】儲存帳號密碼，自動登入，離線登入實現方案

勾選【記住密碼】【自動登入】複選框時：什麼也不做，所有操作放在點選【登入】按鈕時執行點選【登入】按鈕時：為了簡化程式碼和實現邏輯，不管密碼對錯，登入資訊統一儲存到【上次登入帳號】【上次登入密碼】【是否儲存密碼】【是否自動登入】配置登入成功

mstsc儲存使用者名稱和密碼，實現自動登入遠端桌面

MSTSC引數說明首先可以使用mstsc /?來檢視關於mstsc的引數說明根據上述的命令說明，我這裡實現的bat檔案為 mstsc C:/a.rdp /console /v: xxx.xxx.xxx.xxx:3389 rdp檔案生成方法最近由

利用python實現自動捕獲程序netstat資訊和自動捕獲telnet資訊，儲存log檔案

#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ AUTH: [email protected] tag: telnet ,then execute all of the API,and capture the p

厲害了，用Python實現自動掃雷！（附帶原始碼）

自動掃雷一般分為兩種，一種是讀取記憶體資料，而另一種是通過分析圖片獲得資料，並通過模擬滑鼠操作，這裡我用的是第二種方式。學習Python中有不明白推薦加入交流群

用python實現自動搜尋答題，上網課輕鬆不掛科！

自從同學用Python開發出了自動搜尋答案後，每次網課（選修）他都在玩遊戲，而我們作死的在百度搜答案！學習Python中有不明白推薦加入交流裙號：73593

【2018.05.09】python3.6 + selenium 實現GitHub自動登入，自動退出

#coding = utf-8 ''' python + selenium 實現GitHub自動登入，自動退出 login() logout() ''' import time from selenium import webdriver driver = webdriver.Chrome

【2018.05.07】python3.6+selenium 實現自動登入126/163郵箱，然後傳送郵件

# coding:utf-8 ''' 說明：這個自動化指令碼要實現的是：自動登入126/163郵箱，傳送郵件遇到的問題：什麼時候切控制代碼，有些總是定位不到的屬性如何定位（css）值得擁有 ''' from selenium import webdriver impor

[Python爬蟲] Selenium實現自動登入163郵箱和Locating Elements介紹

前三篇文章介紹了安裝過程和通過Selenium實現訪問Firefox瀏覽器並自動搜尋"Eastmount"關鍵字及截圖的功能。而這篇文章主要簡單介紹如何實現自動登入163郵箱，同時繼續介紹Selenium+Python官網Locating Elements部

Python實現自動登入，強行突破圖形驗證碼！

相關推薦