你真的會使用搜索引擎嗎?
本篇文章介紹了一些使用 搜尋引擎的 實用技巧(以Google為例),幫助大家快速找到期望的資料,提升效率。
回顧上篇文章: ofollow,noindex"> Linux 核心 BPF 簡介
資訊化時代,搜尋引擎輔助搜尋已成為生活中不可分割的一個組成部分。有了搜尋引擎,就不必勞心費力的考慮在哪裡找到某個資訊,自己想要的資料,只要一搜索,馬上就會出現。我們可能會覺得使用搜索引擎是再簡單不過的事情。不過,搜尋實際上是一種技能,掌握越多的技巧,在除去次要資訊、抓住關鍵問題方面做的就越好。有助於最快的速度找到自己需要的資訊。
Google 搜尋和大多數搜尋引擎使用的是一種稱為 “爬蟲” 的技術,爬蟲程式會頻繁地訪問各個網路站點,讀取並捕獲網頁上的大部分文字資訊,同時也會跟蹤進入該網站的其他頁面。爬蟲程式在一個網站上搜集到的資訊會新增到搜尋引擎的網頁索引中。當我們搜尋的時候,搜尋引擎會快速分析網頁索引中的相關資訊,以便找出匹配內容。搜尋結果按照相關性排序,相關程度最高的網頁排在最前面(主要指搜尋的自然結果,而非付費結果)。搜尋結果的相關性和排序有著極其複雜的演算法,搜尋引擎使用很多不同的相關因子來決定查詢要求相關性最高的結果是什麼。Google 使用的相關因子有近 300 個。複雜的演算法不在本文討論範圍內,本文以 Google 搜尋引擎為主,介紹一些實用技巧,幫助大家快速找到期望的資料,提升效率。
舉個例子
首先舉一個例子,我們在搜尋引擎中檢索關鍵字 “蘋果”,檢索結果 7900 萬條。無論是在 Google 還是 Baidu,絕大部分結果都是和蘋果公司有關的。但我們可能想要的結果只是 “水果”。
事實上,我們可以給搜尋的關鍵字限制很多條件或分類,將檢索結果控制在我們期望的範圍內。例如我們將搜尋關鍵字由 “蘋果” 換為“蘋果 ~ 水果”
可以看到,檢索結果 200 萬條,比起 7900 萬條,少了很多。而且排在前面的檢索結果完全是我們期望的。
波浪號是一個萬用字元,意思是告訴搜尋引擎去檢索與水果有關的頁面。利用 “~” 給檢索關鍵字限定分類或形容詞的方法同樣也可以用在 baidu 或 taobao 中。
下面會針對多種技巧舉例說明,大家可以根據實際情況舉一反三。特別注意,本文出現在檢索中用的標點符號,特殊字元,均為英文格式符號,中文格式的符號無效。
1
排除不想要的結果
例如搜尋 “運動相機”,但只想看 GoPro 品牌以外的產品
運動相機 -GoPro
減號 “-“可以排除我們不想要的結果
排除特定條件的格式是,關鍵字 - 排查條件
2
搜尋特定網站的內容
例如我們想搜尋清華大學發表的和關鍵字 “load balance“有關的論文
load balance site:lib.tsinghua.edu.cn
site: 網址,可以搜尋特定網站的內容。
搜尋特定網站的內容格式是,關鍵字 site: 網址
3
搜尋特定型別的檔案
例如搜尋 “人類簡史”pdf 格式的電子書
人類簡史 filetype:pdf
filetype 可以搜尋特定型別的檔案,指定檔案的副檔名,有助於我們快速找到想要的結果
採用這種方法可以輕鬆找到 word,ppt,excel 檔案,甚至指定 mkv,mp4,用來快速找到想要的視訊
搜尋特定型別檔案的格式是,關鍵字 filetype: 副檔名
4
限制搜尋的關鍵字出現在網頁標題中
例如搜尋 “反向代理 “,期望結果是網頁標題中包含關鍵字
intitle: 反向代理
類似的方法,可以用 intext: 關鍵字 搜尋關鍵字出現在網頁內容中的結果,還可以使用 allintitle 或 allintext 指定多個關鍵字。
例如檢索網頁標題中包含華為和小米 2 個關鍵字的頁面
allintitle: 小米 華為
5
雙引號的用處
搜尋引擎為了提升檢索速度,會將包括 “and”、“the,”、“where”、“how”、“what”、“or”,或一些單獨的字母,數字忽略掉。如果想讓搜尋結果包含這些被忽略的部分,需要將關鍵字字串放到雙引號內
例如:"how to write a code" 如果沒有引號,搜尋的大部分結果是以 write code 為關鍵字。包含引號後,會確保將完整的字串做為期望的檢索結果提交給搜尋引擎。
類似的技巧還有很多,大家有興趣可以自行擴充套件,本文介紹的是幾個非常常用且核心的技巧,熟練掌握可以幫助我們除去次要資訊,快速找到期望的資訊,節省時間和精力。