1. 程式人生 > >網頁取消快照、禁止抓取等meta標簽功能

網頁取消快照、禁止抓取等meta標簽功能

clas a標簽 noi 內容 一次 組合 pos 但是 重要

<meta name="robots" content="noarchive">

  以上的一段代碼限制了所有的搜索引擎建立你的網頁快照。如果我們需要僅僅限制一個搜索引擎建立快照的話,就可以像如下這樣去寫

  <meta name="Baiduspider" content="noarchive">

  需要註意的是,這樣的標記僅僅是禁止搜索引擎為你的網站建立快照,如果你要禁止搜索引擎索引你的這個頁面的話,請參照後面的辦法。

  第二種情況:禁止搜索引擎抓取本頁面。

  在SEO中,禁止搜索引擎抓取本頁面或者是允許搜索引擎抓取本頁面是經常會用到的。因此我們需要對這一部分重點做一次討論。

  為了讓搜索引擎禁止抓取本頁面,我們一般的做法是在頁面的元標記中加入如下的代碼:

  <META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">

  在這裏,META NAME="ROBOTS"是泛指所有的搜索引擎的,在這裏我們也可以特指某個搜索引擎,例如META NAME="Googlebot"、META NAME="Baiduspide"等。content部分有四個命令:index、noindex、follow、nofollow,命令間以英文的“,”分隔。

  INDEX命令:告訴搜索引擎抓取這個頁面

  FOLLOW命令:告訴搜索引擎可以從這個頁面上找到鏈接,然後繼續訪問抓取下去。

  NOINDEX命令:告訴搜索引擎不允許抓取這個頁面

  NOFOLLOW命令:告訴搜索引擎不允許從此頁找到鏈接、拒絕其繼續訪問。

  根據以上的命令,我們就有了一下的四種組合

  <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本頁,而且可以順著本頁繼續索引別的鏈接

  <META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不許抓取本頁,但是可以順著本頁抓取索引別的鏈接

  <META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本頁,但是不許順著本頁抓取索引別的鏈接

  <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不許抓取本頁,也不許順著本頁抓取索引別的鏈接。

  這裏需要註意的是,不可把兩個對立的反義詞寫到一起,例如

  <META NAME="ROBOTS" CONTENT="INDEX,NOINDEX">

  或者直接同時寫上兩句

  <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">

  <META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">

  這裏有一個簡便的寫法,如果是

  <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">的形式的話,可以寫成:

  <META NAME="ROBOTS" CONTENT="ALL">

  如果是

  <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">的形式的話,可以寫成:

  <META NAME="ROBOTS" CONTENT="NONE">

  當然,我們也可以把禁止建立快照和對於搜索引擎的命令寫到一個命令元標記中。從上面的文章中我們得知,禁止建立網頁快照的命令是noarchive,那麽我們就可以寫成如下的形式:<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW,noarchive">

  如果是對於單獨的某個搜索引擎不允許建立快照,例如百度,我們就可以寫成:

  <META NAME=" Baiduspider" CONTENT="INDEX,FOLLOW,noarchive">

  如果在元標記中不屑關於蜘蛛的命令,那麽默認的命令即為如下

  <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW, archive">

  因此,如果我們對於這一部分把握不準的話,可以直接寫上上面的這一行命令,或者是直接留空。

  在SEO中,對於蜘蛛的控制是非常重要的一部分內容,所以希望各位看官準確把握這部分的內容。

網頁取消快照、禁止抓取等meta標簽功能