1. 程式人生 > >搜索引擎架構

搜索引擎架構

nbsp log pdf png pos 直接 圖片 需要 搜索

技術分享圖片

  搜索引擎獲取並存儲海量的網頁相關信息,不需要實時計算,可看做搜索引擎的後臺計算系統。搜索引擎的最重要目的是為用戶提供準確全面的搜索結果。

  當搜索引擎接收到用戶的查詢詞後,首先需要對查詢詞進行分析,希望能夠結合查詢詞和用戶信息來正確推導用戶的真正搜索結果,如果能夠在緩存系統找到滿足用戶需求的信息,則可以直接將搜索結果返回給用戶,如果緩存信息無法滿足用戶需求,搜索引擎需要調用“網頁排序”模塊功能,根據用戶的查詢實時計算哪些網頁是滿足用戶信息需求的,並排序輸出作為搜索結果。而網頁排序最重要的兩個參考因素中,一個是內容相似性因素,即哪些網頁是和用戶查詢密切相關的;另一個是網頁的重要性因素,即哪些網頁是質量較好或者相對重要的,這點往往可以從鏈接分析的結果獲取。結合以上兩個考慮因素,就可以對網頁進行排序,作為用戶查詢的搜索結果。

參考:《這就是搜索引擎:核心技術詳解》.張俊林.pdf 第一章

搜索引擎架構