1. 程式人生 > >英語學習自測神器——用python爬蟲打造專屬英文詞匯量測試腳本!

英語學習自測神器——用python爬蟲打造專屬英文詞匯量測試腳本!

ref http 自測 clas db4 演示 ima 十大 最重要的

英語是現在傳播很廣的一門語言,它是由26個字母組成,像小編這種小時候不喜歡學英語的人,一直都是看見英語就頭大。後來發現這東西不學不行,還是咬著牙學了。大家應該都知道學習英語,最重要的是詞匯量,所以今天我們就用python做一個小的爬蟲,然後自己寫一個腳本來實現這個功能吧!

技術分享圖片

目標:打造一個英文詞匯量測試腳本

url:

扇貝網

工具:

python3.6、pycharm、requests庫

思路:

和網頁一樣,總共分三步:

技術分享圖片

先來看看網頁中數據,用F12開發者工具抓包就可以

為了更好的演示,這裏網頁縮小了。

技術分享圖片

點擊開始,在來看看出現了什麽

技術分享圖片

這裏我們抓到了一個包,這個json數據中包含了所有的類別或者說是級別,一共十大類,我們點擊”響應”驗證下

技術分享圖片

可以看到,顯示內容在我們抓到的json數據中,但是0和1中的內容有的一樣,有的不一樣是什麽鬼?不要急,我們先選擇‘高考’,在抓下包看看

技術分享圖片

選擇高考後,網頁直接給出了第二步,50個單詞選擇,註意,先看下抓到的json數據的真實地址

技術分享圖片

還記得我們在第一步抓到的包嗎?0裏面就是這個真實地址最後的category的值,1裏面是對應的顯示在網頁中的內容,好了,第二步的真實url也被我們找到規律了,那下來就是分析單詞了,看看有什麽規律,我們點開一個看看

技術分享圖片

有幾個值非常重要,也是我們的目標:

Content的值是顯示的單詞

Definition_choices是需要我們判斷的多個詞義,中間包含有正確的詞義,每個詞義中的rank值應該是該詞義的標識

rank值是正確的詞義,也由此判斷上述多個詞義中的正確詞義

ok,到這裏我們就可以開始寫代碼了,具體過程就不一一說明了,沒有反爬,全部是json數據的讀取和判斷,先放上我的代碼和運行效果

技術分享圖片

文章到此就告一段落了,喜歡本文的小夥伴歡迎轉發或點波關註喔!

如果大家在學習Python的路上,或者打算學習Python需要學習資料,可以加群571799375,群裏學習資料免費贈送大家喔!

本文來自網絡,如有侵權,請聯系小編刪除!

英語學習自測神器——用python爬蟲打造專屬英文詞匯量測試腳本!