1. 程式人生 > >Python網路爬蟲學習筆記——第一個爬蟲程式

Python網路爬蟲學習筆記——第一個爬蟲程式

執行環境

語言

  • Python3

第三方庫

pip install reqeusts
pip install BeautifulSoup4
pip install jupyter

線上編輯器

安裝 jupyter 模組後,在cmd視窗中執行命令jupyter notebook 就會自動在瀏覽器中開啟一個線上編輯器。如下:在這裡插入圖片描述
開啟右上角的 new 列表,選中python3,就會開啟編輯介面,就可以在裡面編輯Python程式碼啦。在這裡插入圖片描述

第一個爬蟲

import requestes
# 爬取頁面的路徑
url = 'https://www.sina.com.cn/'
# 傳送get請求並得到相應 res = requests.get(url) # 設定頁面編碼為utf-8 否則得到的頁面會出現亂碼 res.encoding = 'utf-8' # 輸出頁面內容 print(res.text)

編寫了上面程式碼後再按頁面熱鍵 ctrl+enter 執行程式碼就能得到新浪網頁的內容了。
爬取效果
這樣就是一個簡單的爬取新浪網頁的爬蟲了。當然,網路爬蟲不可能只是那麼簡單,持續學習中。!!!