令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

阿新 • • 發佈：2018-12-16

實驗背景

驗證碼是反爬蟲的利器，傳統的方法需要字元切割，字元識別，但是對於字元重疊的，字元扭曲的情況，識別效果差。本實驗本著實驗精神，利用深度學習進行端對端的驗證碼識別。

學習Python中有不明白推薦加入交流群
號：960410445
群裡有志同道合的小夥伴，互幫互助，
群裡有不錯的視訊學習教程和PDF！

令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

實驗器材

● alexnet

● tensorflow

● captcha

實驗內容

資料集生成

驗證碼識別訓練資料集採用captcha python外掛來生成，驗證碼圖片生成的同時，標籤也生成了。

pip install captcha

令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

ps：同一個驗證碼生成訓練集存在樣式單一的問題，可以通過爬蟲的方式，下載不同樣式的驗證嗎，唯一的耗時的需要人工的進行標籤識別。所以說ImageNet資料集才顯得那麼重要。

本實驗生成數字和小寫字母的4個隨機的驗證碼，供20W張圖片（160*60）。

令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

將資料集轉換成tfrecord檔案，這裡配合網路模型，4個輸出標籤對應4個驗證字元。

令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

深度學習網路結構

本實驗利用alexnet（5個conv+3個全連線，輸入影象大小為224*224）來訓練驗證碼的識別器。直接採用slim裡的網路模型。

本實驗為了識別驗證碼中的4個字元，採用多目標標籤的方式，即一個輸入，有多個輸出標籤，實現中對alexnet的輸出和損失函式做了調整，在原來的第8個全連線一個輸出，改成4個輸出。如下：

令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

損失函式為4個輸出的損失的均值

令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

網路結構：

令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

訓練

訓練超引數說明

epoch：200000學習率：0.0001

訓練過程中有一個比較奇特的現象，在9k次迭代之前，loss損失似乎徘徊不定（看不到要收斂的趨勢）和精確度也很低（只有8%不到）（差點失去信心了）。在9k次迭代之後，loss損失慢慢降低，逐步收斂。訓練精確度也達到92%以上。訓練時間大概在30分鐘

令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

識別結果

usage: test_one.py [-h] [--image_num IMAGE_NUM] [--image_dir IMAGE_DIR]
 [--tf_data_dir TF_DATA_DIR]
 [--check_point_dir CHECK_POINT_DIR] [--gpu GPU]
 [--learning_rate LEARNING_RATE] [--batch_size BATCH_SIZE]
 [--epoch_size EPOCH_SIZE] [--img_file IMG_FILE]
python test_one.py --img_file ./images/001y.jpg --batch_size 1
2018-12-13 23:10:00.440321: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: SSE4.1 SSE4.2 AVX
2018-12-13 23:10:00.788711: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1392] Found device 0 with properties: 
name: GeForce GTX 1080 Ti major: 6 minor: 1 memoryClockRate(GHz): 1.582
pciBusID: 0000:02:00.0
totalMemory: 10.91GiB freeMemory: 10.45GiB
2018-12-13 23:10:00.788784: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1471] Adding visible gpu devices: 0
2018-12-13 23:10:01.133237: I tensorflow/core/common_runtime/gpu/gpu_device.cc:952] Device interconnect StreamExecutor with strength 1 edge matrix:
2018-12-13 23:10:01.133304: I tensorflow/core/common_runtime/gpu/gpu_device.cc:958] 0 
2018-12-13 23:10:01.133333: I tensorflow/core/common_runtime/gpu/gpu_device.cc:971] 0: N 
2018-12-13 23:10:01.133780: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1084] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 5586 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1080 Ti, pci bus id: 0000:02:00.0, compute capability: 6.1)
./checkpoint/crack_captcha.model-141300
predict: 0 0 1 y

令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

0和o 有時候識別的不是很好。人眼無法分清的模型有時候能分的清楚。

實驗結語

本實驗WedO創客實驗和大家一個訓練了一個識別驗證碼的模型，對於生成的同樣樣式的驗證碼識別效果還是不錯的。

目前還存在幾個問題：

對於其他樣式的驗證碼識別效果不好，優化的思路：增加其他驗證碼的訓練資料（一種方法是利用爬蟲方式爬取各種不同的驗證碼，就是要耗費時間來人工標註）。目前來看，不同的驗證碼系統需要單獨訓練一個解碼器。
驗證碼的字元個數，實驗中定為4個。要是其他長度的驗證碼無法使用。

令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

實驗背景驗證碼是反爬蟲的利器，傳統的方法需要字元切割，字元識別，但是對於字元重疊的，字元扭曲的情況，識別效果差。本實驗本著實驗精神，利用深度學習進行端對端的驗證碼識別。學習Python中有不明白推薦加入交流群

學生利用python破解驗證碼，模擬登入教務處檢視成績、搶課！

Python 的概念正式進入主題，每學期末都要搶課，學校的伺服器還賊渣。先說一個簡單的的方法，抓包，不斷地發起選課請求，但有一個明顯的缺點，那就是cookies容易過期。還得重新登陸替換cookies。於是，就有了今天要分享的內容。其大概分為兩個部分：1.自動登入

Python破解驗證碼，只要15分鐘就夠了！

在我們進一步討論之前，讓我們說一下為了解決這個問題我們將會用到的工具：Python3Python是一種非常有趣的程式語言，它有很好的機器學習和計算機視覺庫。OpenCVOpenCV是一種流行的計算機視覺和影象處理框架。我們將使用OpenCV來處理驗證碼影象。它有一個Python應用介面，因此我們可以直接從Py

Python｜教你用 Python 來朗讀網頁，上班聽新聞就是爽！

是不是有的時候懶得自己看新聞？那麼不妨試試用 Python 來朗讀給你聽吧。網頁轉換成語音，步驟無外乎：學習Python中有不明白推薦加入交流群 &nbs

10行程式碼教你用Python掃描Excel表格，自動生成條形碼！

一、需求分析條形碼應用廣泛，尤其是人事、財務和庫管等等崗位，常需根據excel檔案成批生成條碼，如果是經常性天天做，用excel的自己控制元件還是很枯燥煩人的。當然在學習Python的道路上肯定會困難，沒有好的學習資料，怎麼去學習呢？學習Python

教你用Python爬蟲股票評論，簡單分析股民使用者情緒

一、背景股民是網路使用者的一大群體，他們的網路情緒在一定程度上反映了該股票的情況，也反映了股市市場的波動情況。作為一隻時間充裕的研究僧，我課餘時間準備寫個小程式碼get一下股民的評論資料，分析使用者情緒的走勢。程式碼還會修改，因為結果不準確，哈哈！二、資料來源

15分鐘，教你用Python爬網站資料，並用BI視覺化分析！

作為一名在資料行業打拼了兩年多的資料分析師，雖然目前收入還算ok，但每每想起房價，男兒三十還未立，內心就不免彷徨不已~ 兩年時間裡曾經換過一份工作，一直都是從事大資料相關的行業。目前是一家企業的BI工程師，主要工作就是給業務部門出報表和業務分析報告。回想自己過去的工作成績也還算是不錯的，多

這個人好囂張，python破解驗證碼就算了，然後還批量註冊、登入！

近期在跟進新專案的時候，整體的業務線非常之長，會一直重複登入退出不同賬號的這個流程，所以想從登入開始實現部分的自動化。因為是B/S的架構，所以採用的是selenium的框架來實現。大致實現步驟如下：學習Python中有不明白推薦加入交流群 &n

Python繞過驗證碼，直接登入爬資料

小編今天準備爬取一個網站的資料，但是被登入的驗證碼擋住了小編很不服於是小編就想著怎麼繞過驗證碼去爬取網站的資料。雖說圖形驗證碼最簡單，但是對於我這等新手，還是要苦學一番。首先尋找測試網站，網站選的是如雲閣小說網，小網站不怕被封。他們的驗證碼一般如下：

老司機程序員教你用Python獲取種子，源源不絕的那種！營養跟不上

想要方式種子 class 發現效果不兼容進行道理種子/DHT 通過磁力就可以獲取種子文件從而進行下載，這跟直接使用種子下載時一個道理的，只是少了從磁力到種子文件的一個過程而已。 peer: 一個 TCP 端口上監聽的客戶端/服

爬蟲高玩教你用Python每秒鐘下載一張高清大圖，快不快？

on() print async tpc 多說 xxx ima 所有 mkdir 如果爬蟲需要展現速度，我覺得就是去下載圖片吧，原本是想選擇去煎蛋那裏下載圖片的，那裏的美女圖片都是高質量的，我稿子都是差不多寫好了的，無奈今天重新看下，妹子圖的入口給關了。至於

程式設計師想跳槽阿里，又怕自己過去因學歷低而被冷落，該不該去呢？

現在說起國內的網際網路企業，大家首先想到的便是阿里、騰訊這種大型企業，這些企業也是很多畢業生所向往的公司，其中吸引人的不僅僅是薪資待遇，另外阿里的大廠光環哪怕你想要跳槽也是個好簡歷，但是這種大廠也不是一般人能夠進的，就有一位大專學歷的p7，想進去但是又怕自己學歷不夠。原貼如下：

教你用python爬取喜馬拉雅FM音訊，乾貨分享~

前前言喜馬拉雅已經更換標籤，我重新更新了下程式碼，文章暫時未改，因為思路還是如此，需要的可以掃一下文末公眾號二維碼（本人會在上面發表爬蟲以及java的文章還有送書等資源福利哦），也可以直接搜尋公眾號“ 猿獅的單身日常”，好了廣告結束... 前言之前寫過爬取圖片的一篇文章，這回來看看如

10年經驗的老前輩，教你如何用Python 快速的破解驗證碼

我相信有很多的小夥伴跟小編一樣為驗證碼而煩惱。小編為自學的同學，準備了全套的學習資料。自學需要一個學習好氛圍，小編建立一個群，時不時的小編會在群裡發一些學習資料。歡迎小夥伴的加入。QQ群883444106 專案簡介：本實驗通過一個簡單的例子來實現破解驗證碼，非常適合Python新手練手

手把手教你用一個二維碼搞定微信防封，親測有效

今天要分享的是用一個二維碼成功實現微信防封的經驗，別不信，已經有不少人都用過了。適合人群：擔心自己的微訊號、微信群被封的人群，比如做微商、代理、淘寶客的群主。目標：幫助這部分人群避免被封號封群。其實，這個防封的原理和過程很簡單，就是把風險轉移出去，不在微信裡涉及敏感話題內容。

教你用Python訪問一零二四網站，拒絕伸手黨

學習Python中有不明白推薦加入交流裙

快回家過年了，還沒有找到物件嗎？教你用Python僅需三步，有老婆

快回家過年了,還沒有找到物件嗎？教你用Python僅需三步,找個老婆回家過年。怎麼做找小編。看下文。小夥伴們加油，新的一年快快樂樂，開開心心，寫程式碼沒有BUG。沒錯，這不是教你去爬幾張美照，而是很嚴肅認真正經的教你如何追女孩？喜歡上一個女孩，怎麼追到手當老婆？身為程式設計師，只

七夕快到了，教你用python去表白！

# -*- coding: utf-8 -*- import sys from PyQt5 import QtWidgets from PyQt5.QtGui import QFont,QIcon#QtWidgets不包含QFont必須呼叫QtGui from PyQt5 i

榮工又解決問題了：用ORACLE的sys_connect_by_path函式，獲得遞迴查詢路徑上各個節點的運算值

語句示例如下 Select JgId,JgType,OrgCode,Orgname,DepCode,DepName,ClsCode,ClsName,EtpCode,EtpName sys_connect_by_path(PlanRate,'*') from

沒有Console線，又不知道自己通過哪個IP連線到路由器，怎麼辦？

如果你想配置你的家用無線路由器，請另行百度吧，這裡說的是配置CISCO、華為、銳捷等路由器。實際上一般的人配置路由器都是在192.168.*.*，預設閘道器是192.168.*.1，所以只要確定了網路地址，也就是確定第一個*，剩下的一個*是節點部分，隨便填一個2~254的

令人感到過分，又跑出來教人用python破解驗證碼，還是可訓練模型

相關推薦