1. 程式人生 > >怎麽設置不讓搜索引擎收錄某些頁面

怎麽設置不讓搜索引擎收錄某些頁面

設置 需要 gen 頁面 顯示 con 最簡 ont 抓取

一、關於robots文件

1. 搜索引擎蜘蛛訪問網站時,會先查看網站根目錄下有沒有robots.txt文件,該文件用於指令搜索引擎禁止抓取網站某些內容或 允許抓取某些內容。註意:就算允許抓取所有內容,也要建一個空的robots.txt文件放在根目錄下。

2. 只有在需要禁止抓取某些內容時,robots.txt才有意義,如果該文件為空,就意味著允許搜索引擎抓取所有內容。

3. 語法解釋:

最簡單的robots文件:禁止搜所有搜索引擎抓取任何內容,寫法為:

User-agent:*

Disallow:/

其中,User-agent用於指定規則適用於哪個蜘蛛。通配符*代表所有搜索引擎。如只適用於百度蜘蛛,則寫為:User-agent:Baiduspider。谷歌蜘蛛:Googlebot.

Disallow告訴蜘蛛不要抓取某些文件。如 Disallow:/post/index.html,告訴蜘蛛禁止抓取Post文件夾下index.html文件。 Disallow後什麽都不寫,代表允許抓取一切頁面。

二、關於meta robots標簽

1. 用於指令搜索引擎禁止索引本頁內容。

2. 語法解釋:<meta name="robots" content="noindex,nofollow"> 意思是 禁止所有搜索引擎索引本頁面,禁止跟蹤本頁面上的鏈接。

noindex:告訴蜘蛛不要索引本頁面。

nofollow:告訴蜘蛛不要跟蹤本頁面上的鏈接。

nosnippet:告訴蜘蛛怒要在搜索結果中顯示說明文字。

noarchive:告訴搜索引擎不要顯示快照。

noodp:告訴搜索引擎不要使用開放目錄中的標題和說明。

怎麽設置不讓搜索引擎收錄某些頁面