1. 程式人生 > >讓百度刪除不想收錄的域名或快照的最快方法

讓百度刪除不想收錄的域名或快照的最快方法

個別網站可能會出現以下類似困擾:

①、百度收錄了自己不想收錄的域名,造成內容重複,比如張戈部落格,百度近一半的收錄是www的域名,而且收錄的內容還是重複的!實際上張戈部落格的首選域名是不帶www,就算一開始就做了301,也被百度無視了;

②、網站中途才設定的偽靜態,收錄正常後發現依然存在舊的動態連結,想刪除之;

③、百度收錄了虛擬主機自帶的三級域名,想刪除之;

④、網站改版,如精簡分類數量、修改分類名稱,造成了url死鏈,想刪除之;

      先具體說一下張戈部落格是如何解決第①個困擾的:

前些天分享的《徹底禁止搜尋引擎收錄非首選域名的方法》,實際上僅適合新站設定,而我這種中途做禁止設定的網站,只會收到來自百度的robots禁封提醒,而不會刪除之前的收錄:

那我該如何徹底刪除這些重複收錄呢?

方法很簡單,利用百度站長平臺的閉站保護功能即可。經多次嘗試,張戈部落格www域名重複收錄終於全部清空了!

下面說下具體方法:

       一、去掉robots限制

如果之前對該域名做過robots禁封的話,需要先解除限制,刪除robots即可。因為,你都不讓百度抓取了,百度當然不知道你這些連結還能不能用,該不該刪?他只會認為你是粗心誤操作了robots而已。

      二、設定404狀態

經測試,百度的閉站功能申請通過的前提條件是,所有連結必須是404死鏈狀態,否則無法通過:

所以,我們先對那些已收錄的非首選域名,設定404返回碼,即死鏈狀態,如果之前設定了301,記得要取消掉

①、Nginx

如下修改之前非首選域名的監聽設定:

server
         {
                server_name www.zhangge.net;
                root  /home/wwwroot/zhangge.net;
                location / {
                        #全部返回404
                        return 404;
                        }
}

 ②、PHP通用

將以下程式碼新增到網站的head部分

<?php if($_SERVER['HTTP_HOST'] == 'www.zhangge.net') { ?>
header('HTTP/1.1 404 Not Found');
header("status: 404 Not Found");
<?php } ?>

 ③、ASP通用

同樣的將以下程式碼新增到網站head部分(注意是動態模板,而不是靜態頁)

<%  
   Response.Status = "404 Not Found"  
%>

設定完成後,記得手動訪問測試下效果。

       三、閉站申請

404確認無誤之後,開啟百度站長平臺的抓取頻率,選擇閉站保護

然後,選擇你要關閉的非首選域名,比如www.zhangge.net,最後在下方繼續勾選www.zhangge.net,提交即可!切記不要提交帶星號(*)的選項,那是指所有相關域名!

大概2天左右,就收到了閉站申請通過的通知:

可以看到,張戈前後測試了3次,前2次測試提交時,採用的是403或者是僅針對搜尋引擎的404設定,結果都沒通過!看來,閉站保護是採用人工稽核的,而非機器!

Ps:閉站是對整個域名刪除的最快方法,但如果是刪除部分收錄,那就得使用百度站長平臺的死鏈提交功能。

      四、補刀設定

現在再去site非首選域名,發現已全部刪除乾淨:

我的目的已經達到!為了保持使用者體驗,現在需要恢復之前的301跳轉和robots禁封設定:

參考之前寫的的《徹底禁止搜尋引擎收錄非首選域名的方法》,重新設定了robots禁止收錄和301跳轉。現在,只要我不去申請閉站恢復,我相信百度再也不會收錄www域名了!

      五、寫在最後

看完針對困擾①的解決辦法,相信其他困擾也可以依葫蘆畫瓢的做好相應處理。

原理很簡單,你想要刪除哪個快照或域名,只需要將這些物件設定為404死鏈狀態,然後去百度站長平臺做死鏈提交即可,一般2~3天就能立竿見影。至於,如何設定404死鏈狀態,則需要對症下藥,方法不盡相同,張戈就不贅述了。當然,你有任何需要都可以去留言板留言告知。

      原文地址:http://zhangge.net/4506.html