1. 程式人生 > >python抓取新浪新聞的分頁連結

python抓取新浪新聞的分頁連結

第一步:

先找到新聞資訊存在的那個非同步存取的連結,該連結一般位在js那個分類下。


然後把這個連結給requests 讓它存取內部的資料。

取到之後你會發現,這個內容前後兩邊有保護層,即一個“(”和 “);”,這個時候可以用lstrip和rstrip去截掉這些多餘的字串。

最後返回的就是一個json資料,通過json.loads將它賦給一個字典。

早在之前就已經發現,這個字典是分層次的,首先是['result'],然後才是['data'],而我們需要的連結就在data下的['url']裡面