1. 程式人生 > >個人爬蟲入門記錄20171026

個人爬蟲入門記錄20171026

python 爬蟲 文本處理

網易NBA對每個隊都有一個對應的編號,每個編號對應一個數據頁面。想要進入馬刺的數據頁面,首先要知道馬刺的編號。編號與球隊名字的對應關系可以從總體的NBA統計頁面源代碼中看到。所以,我的思路是:

1.獲得NBA統計頁面的源代碼;

2.將源代碼轉換成字符串;

3.通過查找球隊名字獲得球隊名在字符串中的位置,對應的編碼的位置也在球隊名字附近,把球隊 編碼返回出來;

4.通過球隊的編碼去查找馬刺的數據統計頁面

昨晚上按照上面的思路寫了幾行代碼,結果不對。問題出在,在字符串中用find()方法查找球隊名字,返回結果為空,問題出在哪裏沒想出來。正好到點睡覺就睡了。

本文出自 “8097414” 博客,請務必保留此出處http://8107414.blog.51cto.com/8097414/1976321

個人爬蟲入門記錄20171026