使用Selenium+POI實現Excel自動化批量查單詞
相信大家都對爬蟲非常熟悉,一般來說,利用HttpClient傳送請求並獲取響應以獲得想要提取的資料應該是最常用的方法。最近工作中頻繁使用了Selenium,在本文中,我們將使用Selenium和POI(讀寫Excel)來完成一個入門級的自動化程式。
步驟一覽
使用Maven建立工程,引入Selenium和POI依賴
下載ChromeDriver並配置環境變數
編寫Selenium查詞指令碼
讀寫Excel並儲存
編寫main方法,執行程式
現在開始
1.使用Maven建立工程,引入Selenium和POI依賴
1.1 下載Maven,配置環境變數
Windows和Mac將Maven目錄地址寫入path即可,具體步驟可百度,Google,十分常見。
1.2 在IDEA中配置Maven
IDEA自帶Maven可能版本非最新,建議自行引入本地最新版本。
1.3 建立工程
建立工程時只要使用最基礎的模板,也就是直接點選next。

1.4 在mvnrepository.com搜尋Selenium,POI和POI-ooxml依賴,將其引入pom.xml,並在右下角點選import change,最終pom.xml加入內容如下:

2.下載ChromeDriver並配置環境變數(三選一)
2.1 在映象站下載ChromeDriver,配置環境變數
自行手動下載ChromeDriver後如不配置環境變數,需在程式碼中加上System.setProperty("webdriver.chrome.driver",path); 其中path是你的driver路徑。
2.2 Windows使用choco install直接安裝
2.3 Mac使用brew install cask直接安裝
3.編寫Selenium查詞指令碼
3.1 建立Search類,編寫setUp方法 在setUp中,首先需要初始化WebDriver,然後訪問到有道首頁,搜尋test點選確定並跳轉至搜尋頁,注意在driver訪問此頁面時會彈出廣告,需要一行程式碼來抓取關閉連結關掉廣告,程式碼如下:

3.2 編寫searchWord指令碼方法
searchWord方法需要傳入你要搜尋的單詞,然後抓取搜尋框,輸入後點擊確認。這時你將獲得搜尋詳情的頁面,其中你需要抓取中文翻譯的div並且獲取其中文字,程式碼如下:

4.讀寫Excel並儲存
4.1 建立Excel檔案並寫入單詞
新建一個Excel,然後在最左邊第一列填入一些單詞,注意,不要有空行,本文程式碼中沒有帶異常處理,空行會報錯。

4.2 編寫Excelio類,編寫read方法
利用poi框架,與普通檔案讀寫異曲同工,程式碼如下:

4.3 編寫searchWord方法
呼叫Search類的searchWord進行搜尋,然後將獲取到的String寫入Excel,程式碼如下:

4.4 編寫save方法
使用FileOutputStream,儲存Excel,程式碼如下:

5.編寫main方法,執行程式
編寫入口方法,程式碼如下:

後記
成為技術大牛夢想雖然很美好,但是要付出很多,這個過程中可能很苦逼,也可能很枯燥,這裡我想特別強調一下:前面我講的都是一些基礎的東西,但真正起決定作用的,其實還是我們對技術的熱情和興趣!
[測試技術答疑]QQ群:903217991