1. 程式人生 > >爬蟲--資料解析方式

爬蟲--資料解析方式

引言:回顧requests實現資料爬取的流程

  1. 指定url
  2. 基於requests模組發起請求
  3. 獲取響應物件中的資料
  4. 進行持久化儲存

其實,在上述流程中還需要較為重要的一步,就是在持久化儲存之前需要進行指定資料解析。因為大多數情況下的需求,我們都會指定去使用聚焦爬蟲,也就是爬取頁面中指定部分的資料值,而不是整個頁面的資料。因此,本次課程中會給大家詳細介紹講解三種聚焦爬蟲中的資料解析方式。至此,我們的資料爬取的流程可以修改為:

  1. 指定url
  2. 基於requests模組發起請求
  3. 獲取響應中的資料
  4. 資料解析
  5. 進行持久化儲存