1. 程式人生 > >python新人小白學爬蟲,學習筆記(二)——前期的環境準備

python新人小白學爬蟲,學習筆記(二)——前期的環境準備

前幾天,我剛剛進行了爬蟲基本知識和學習背景的總結和筆記,今天記錄的是Python的爬蟲入門實踐須知。 首先,是環境的配置 學習python網路爬蟲技術當然需要在Python的環境下,對此,我們可以直接使用Python官網提供的各種不同版本的Python3,當然可以使使用一些通用的程式設計軟體(可以執行Python的環境),例如vs,jupyter 等。(這個依照個人喜好就可以了。在這裡推薦如果使用通用的程式設計軟體的話,可以採用jupyter。) jupyter notebook是一個web應用程式,它不僅可以支援實時程式碼,還有數學方程,視覺化和markdown等功能,支援40多種程式語言。具體使用教程可自行百度,這裡只寫出安裝過程。 其次,我們還需要安裝一些有關於網路爬蟲中需要用到的套件如BeautifulSoup4等

所以建議大家先安裝python3,再選擇自己喜歡的編譯軟體。**

然後,作為網路爬蟲,我們的資料來源是網頁資訊,所以我們當然還需要一個瀏覽器,推薦使用知名的大型瀏覽器,如chrome、Firefox、IE、360等。

(一)通過官網安裝python 1.開啟瀏覽器輸入網址:www.python.org 2.點選downloads選項卡,進入下載介面 3.按照電腦配置,選擇你所要安裝的python版本 4.按照步驟完成安裝

(二)安裝套件和 jupyter(可選)

通過python的套件安裝工具pip,安裝套件(需連網) 首先,開啟cmd命令列介面,輸入:

pip install requests

回車 等待下載和安裝完成

pip install BeautifulSoup4 回車 等待下載和安裝完成

pip install jupyter 回車 等待下載和安裝完成

注:在整個下載和過程中不需要進行任何操作。 如要使用jupyter,安裝完成後,在cmd中輸入jupyter notebook ,回車,會自動開啟jupyter notebook的工作網頁視窗。在右側的NEW下面選擇python3即可。