1. 程式人生 > >讀書隨筆——Python3網路爬蟲開發實戰

讀書隨筆——Python3網路爬蟲開發實戰

說是說讀書隨筆,其實是採坑經驗了 大笑

不管了,我還是隨手記一下吧。我不會說我配置書中要求的環境配置了一天的。

我一開始是在一個微信公眾號上看到這本書的,之後在學校圖書館找書的時候突然想起來了,就順手一查,沒想到圖書館裡還有就想借過來玩玩。具體好不好玩看法可能不一樣吧。

OK。前面比較囉嗦,還是回到正題吧。我還是先放上作者的部落格吧,這樣下載很多軟體和運書上的程式碼就方便多了。作者崔慶才的部落格。因為我是先看到書的,所以不知道還有部落格,,,,,

書中有兩種python的安裝,這裡還是推薦Anaconda了,下載了它各種庫都安裝好了,並且Anaconda裡的元件還可以做資料分析(當然我還不會了安靜),並且還可以一下安裝VScode。

Anaconda官方連結奉上

之後就是我踩的第一個坑了,發現之前電腦裡有python了趕緊刪掉。。。然後我按照書中的吧python改名為python3了,但是我在cmd中輸入pip3 -v時出錯了,在檔案中也沒找到pip3。這時不要著急,可以試試在cmd中輸入pip -v,可能只是你的pip與作者的名字不一樣罷了。。。。

反正有pip了,之後就可以安裝各種庫了。記得自己的pip叫pip的話就 pip install xxxx。當然還是可以whl安裝的,書上也寫了,但是除了tesserocr我都用pip安裝好了。

之後要說讓我頭痛的tesseract和tesserocr了這兩個東西讓我安裝了半天。先是要安裝tesseract的在

https://digi.bib.uni-mannheim.de/tesseract/下就行了,選最新版本,alpha是內測版,beta是公測版。之後在安裝的時候可能會彈出很多框告訴你什麼版本太老了,不要管他直接繼續。

之後安裝tesserocr,裝這個的時候,我先用pip安裝但是一直告訴我缺少VC++14,拜託這個在網上都沒有行不行,只有VC++13,VC++15......之後果斷轉入whl安裝但是我一直把它放在Anaconda的scripts裡面裝不了,但是直接放在C盤就行了,為什麼。。。。不管了之後再研究吧。