1. 程式人生 > >百度中關於site命令和inurl命令之我見

百度中關於site命令和inurl命令之我見

    上次文章大概談了一下我對搜尋的初步理解,隨著對搜尋的興趣的增加和接觸的增多,漸漸的看了9238前輩的很多文章,特別是他的《關鍵詞 等同詞 同義詞 上位詞 下位詞》的文章,呵呵,多年前的文章現在還是指導著我啊。接著又看到了《拋磚引玉之六:搜尋基礎site篇》,呵呵,認真的精神鞭策著我,這次我說說自己關於site 命令 和 inurl 命令的一點看法。以下的例項基本上是發生在百度。

    1、百度幫助中關於site命令講的不夠詳細,site命令後面既可以跟網站的一級域名又可以跟網站的二級域名。在百度裡輸入:site:e23.cn和site:

www.e23.cn(百度對中文標點的支援和英文標點的支援是一樣的), 前者找到相關網頁約47,700篇,後者找到相關網頁約1,740篇,收錄的數量為什麼會不一樣呢?根據對site的意義和兩個命令不同結果的仔細觀察,我們不難發現前者命令中有sms.e23.cn/sms/, bbs.e23.cn 中的內容;而後者的結果中只有www. e23.cn的內容;因此當你輸入site:www.e23.cn時候,百度只會把url為www.e23.cn,也就是e23的一級域名在百度中被收錄上的相關資訊呈現給你;而當你輸入site:e23.cn的時候,百度不僅會把url為www.e23.cn上的資訊還有bbs.e23.cn的資訊等其他一切關於e23.cn的一級域名的資訊和二級域名的資訊呈現給你,這就是兩者的區別。當用site 命令時,在前幾步中,最好是用site:e23.cn而不是site:
www.e23.cn
因為前者的獲得的範圍比後者廣,避免在一開始的時候遺漏掉想要的資訊,除非你有什麼特殊的要求。當site命令前是空白的話就會預設查詢 site後網站所有的一級域名和二級域名資訊在搜尋引擎中收錄的情況,google,百度,一搜,中搜,新浪都支援site前是空白的搜尋;sohu不支援;

    2、在清楚site:e23.cn和site:www.e23.cn的區別之後,我就想用site:e23.cn搜尋得到的結果,能不能用inurl命令來替代找出同樣的結果呢?如果能,那有site命令了,又出現inurl命令,兩個命令之間在結果上又有什麼區別了?我們一起來解決這個疑問。我們用inurl:e23.cn搜尋,呵呵,發現百度好像短路了,在google上搜,35,600 項符合inurl:e23.cn的查詢結果;共有 35,700 項符合的查詢結果site:e23.cn ,理論上前者的結果應該比多啊,至少不能少才對,因為site:e23.cn -inurl:e23.cn 是互相矛盾的命令,所以我就只能一頁一頁翻,試圖找出相差的100頁到底是怎麼回事,當看到101頁時,情況發生了變化,結果也只有35,600 項符合site:e23.cn結果,差點沒把我氣昏,唉,我想可能是google伺服器不問題吧,別的我實在不知道如何解釋。我再試一下,把搜尋頁面選為“搜尋所有中文簡體網頁”,結果inurl的結果比site的要多。其實inurl:e23.cn 理論上結果應該比site:e23.cn 多!因為還有像 chat.e23.cn:8900 、enabler.systemsoft.co.jp/ root?fp_mode=body&fp_url=sms.e23.cn 之類的網頁存在。(另外,選取e23.cn做搜尋試驗物件不很恰當,因為還有e23.com.cn存在,這個例子有點特殊)這樣就能很清晰的看出他們的區別。Inurl命令找到的結果較為全面些,site命令結果較為正式些,像別人引用的網頁不會出現。

    3、這兩個命令在特定的範圍內再次縮小搜尋範圍都非常有用,使搜尋的結果更準確,搜尋的過程更快速。
    例如我想找在百度中找些中文的俄羅斯網站,當輸入命令inurl:ru 分析結果中兩個項 www.glasscontec.ru/client/ru/www.white-collar.net/01-author/r/02-ru_zj發現無論“ru”出現在url中的什麼位置,都被計算進進去了,甚至根本不是我想要的結果:svn.clkao.org/svnweb/freebsd/log/cvs/trun這個結果最讓人啼笑皆非,就是因為結果中的“trun”有“ru”呵呵,電腦是不是太蠢了。當使用site:ru命令時,再分析結果中的兩項 http://pikkunipsu.newmail.ru/ 、electronics.car-electronics.weststore.com.ru 都是域名為ru 的結果,從某種意義上說這才是我們真正想要的結果。

    4、inurl:<ru> 、 inurl:“ru”和inurl:(ru) 等同於inurl:ru;而inurl:.ru ; inurl:_ru;inurl:-ru都是錯誤的命令,百度不支援。site:/ru命令與site:ru命令等同,在百度中加不加“/”無所謂,google就不行。這兩個命令可以連用,例如我想知道sina門戶的新聞,輸入site:sina.com.cn inurl:news 但發現有很多留言版中無用的資訊,於是就用命令site:sina.com.cn inurl:news -inurl:cgi 就能很好的達到目的。兩個命令是通過布林語法連線起來的,由此可見,最簡單的布林語法其實很重要很有用,是高階語法的基礎。

   小結:第一步選好代表自己想要資訊的關鍵詞,範圍可以大點,避免遺漏,接下來慢慢的縮小搜尋的範圍,力圖使不斷縮小範圍的結果與自己想要的有效資訊重合,上面的兩個命令非常有用,多多練習。學搜尋愛搜尋用搜索改變生活。