1. 程式人生 > >Python爬蟲系列(一):從零開始,安裝環境

Python爬蟲系列(一):從零開始,安裝環境

tar 公司 pip nal 網頁 解析 目標 http caption

在上一個系列,我們學會使用rabbitmq。本來接著是把公司的celery分享出來,但是定睛一看,celery4.0已經不再支持Windows。公司也逐步放棄了服役多年的celery項目。恰好,公司找人進來新人也要給他們培訓爬蟲。接下來,我們就從零開始,學習爬蟲,目標是能掌握到執行js,反爬蟲這個水平,做一般的商業爬蟲沒問題。牛小妹,接下來要仔細看了哦。

軟件環境:

python 3.6.3:不必說

beautifulsoup4:pip install beautifulsoup4 用來解析HTML

requests2.18:pip install requests 用來請求網頁

網上,還大量有urllib,urllib2等玩意,我一一嘗試。最後信了這個:

技術分享

事實卻是如此。

接下來,我們將用request獲取網頁。。。。。。

Python爬蟲系列(一):從零開始,安裝環境