搜尋引擎技術的三個核心問題
雖然,搜尋引擎的技術並不是我們SEOer應該考慮的事情,但我們還是應該瞭解一下,他們到底在研究哪些問題。今天,小小課堂SEO自學網帶來的是《搜尋引擎技術的三個核心問題》。希望對大家有所幫助。
一、搜尋引擎相關性技術
① 相關性概念
搜尋引擎要準確地判斷使用者查詢詞與頁面的相關性,按相關性強弱完成頁面集合的初步篩選和排序。
② 相關性分類
1)查詢詞相關性
搜尋引擎首先要判斷使用者查詢詞的語義,因為同一個詞在不同的場景下,可以代表不同的意思,只有正確判斷語義後,才能更好地去匹配相關性強的頁面。如果判斷錯誤,那麼就可能造成搜尋結果頁面全完不是使用者所需的內容,這樣會大大降低使用者的搜尋體驗。
例如,使用者搜尋“蘋果”,搜尋引擎給出的都是iPhone的結果,但那個使用者可能真的只想搜尋普通的蘋果。
當然,搜尋引擎結果中大部分都顯示iPhone是正常的,因為大部分使用者去搜索“蘋果”這個詞的時候,其語義也是iPhone。當然,也會顯示一些真正的蘋果的結果頁面。
2)使用者相關性
某個使用者看到過哪篇文章,哪個網站,則這個使用者在此搜尋某個詞時,這篇文章和這個網站會有不一樣的排名。
某個使用者是某個領域的專家,或者說經常關注這方面的愛好者,當他搜尋這個領域的某些詞時,他可能會對多次進入的網站的排名產生積極的作用。
當然,這些使用者相關性可能就是SEO中常說的個性化搜尋或個人化搜尋。
③ 檢索模型
為了檢索頁面與使用者搜尋詞的相關性,搜尋引擎研究人員提出了各種檢索模式,其中最為廣泛使用的為“TF-IDF”。
TF-IDF的核心概念是一定程度上增加TF(關鍵詞頻率或密度)和IDF(關鍵詞的反文件頻率)的值,最終得到的兩者成績就是判斷頁面相關性的值。
簡單來講,增加關鍵詞頻率或密度,同時尋找一些百度相關搜尋結果數小的詞。
二、搜尋引擎評價技術
搜尋引擎評價體系非常重要,相關性的研究僅僅是最初的篩選和排序,但是否是使用者真正期望的,還需要通過評價體系來完成。
① 使用者點選生成的日誌資料
搜尋引擎可以將使用者點選的資料在後臺記錄下來,生成大量的日誌資料,再利用這些資料對搜尋引擎進行評價。
② 搜尋引擎評價方法
其中一種為Cyril Cleverdon的評價方法。
評價中有兩種指標:
1)準確率
準確率,是指檢索出來的文件中相關文件所佔比例。
2)召回率
召回率,是指全部文件中中被檢測出來的文件比例。
三、搜尋引擎使用者搜尋體驗技術
搜尋引擎是面向使用者的,使用者搜尋體驗是評價搜尋引擎好壞的最重要因素之一,這也是目前搜尋引擎為什麼非常重視使用者搜尋體驗的因素。
搜尋引擎通過資料可以分析出哪些頁面或網站的使用者搜尋體驗好,則將提升其排名或整站權重,對於哪些不好的,則會降低排名或整站權重。
這就好比,我們優化網站,點展比高、PV遠大於UV等資料,證明了我們網站的使用者體驗度比較好,搜尋引擎也會給予這樣的網站更好的排名。以上就是小小課堂SEO自學網帶來的《搜尋引擎技術的三個核心問題》。感謝您的觀看。SEO培訓認準小小課堂!更多seo教程搜尋小小課堂。原創文章歡迎轉載並保留版權:https://www.xxkt.org/