1. 程式人生 > >實戰 Python 網路爬蟲:美團美食商家資訊和使用者評論

實戰 Python 網路爬蟲:美團美食商家資訊和使用者評論

實戰 Python 網路爬蟲

美團美食商家資訊和使用者評論

作者簡介:

Hyx,多年系統研發經驗,主要從事機器人流程系統研發、大資料系統研發、網路爬蟲研發以及自動化運維繫統開發。

擅長使用 Python 編寫高質量程式碼,對Python有深入研究,現為 CSDN 部落格專家和簽約講師,發表多篇原創博文,熱愛分享和新技術的探索。個人圖書出版:《玩轉 Python 網路爬蟲》、《玩轉 Django2.0》

Chat 簡介:

在開發爬蟲的時候,我們很容易分析 HTTP 請求、實現資料爬取和儲存,當專案真正執行起來的時候,卻發現數據沒爬到幾條就出現異常。

“程式開發正常,上線出異常”是因為網站的反爬蟲機制,這也是爬蟲工程師常見的問題之一。

本 Chat 主要講述如何爬取美團美食商家的評論資訊,通過實際的例子來進一步講述如何解決一些常見的反爬蟲策略。主要內容如下:

  1. 網站分析及專案設計;

  2. 爬取所有商家的資訊;

  3. 分別爬取每個商家的資訊和使用者評論資訊;

  4. ORM 框架實現資料持久化儲存;

  5. 設定配置檔案,動態控制爬取方向;

  6. 基於請求頭的反爬蟲機制:根據商家資訊動態設定請求頭;

  7. 基於 Cookies 的發爬蟲機制:利用瀏覽器構建 Cookies 池;

  8. 分散式爬蟲的擴充套件說明。

長按掃碼報名

640?wx_fmt=png