1. 程式人生 > >百度無法爬取Github Pages靜態網站解決方案

百度無法爬取Github Pages靜態網站解決方案

在Github Pages上面託管了自己的靜態部落格,經過一段時間的執行發現自己網站的流量基本都是來自與谷歌、必應、搜狗等等搜尋引擎,確沒有百度的搜尋引擎的流量,最後谷歌一下發現原因是:

百度爬取GitHub太頻繁了,甚至引起了GitHub的服務不穩
定,最後GitHub直接把百度遮蔽了,也就是說,所有託管
到GitHub Pages上的靜態部落格都是無法被百度搜索到。

可以用如下的方法進行驗證:
開啟百度站長平臺—>網頁抓取—->抓取診斷。然後點選抓取。完成之後發現抓取狀態是失敗。這時候點選進入詳情發現,返回的HTPP狀態是HTTP/1.0 403 Forbidden(403表示連結被拒絕)。如下: