SEOer應善用索引建立過程中的加權方法
搜尋引擎會給予每一個頁面一定的權重值,這個值也會隨著頁面的更新和時間地流逝而改變。
今天,小小課堂SEO自學網為大家帶來的是《SEOer應善用索引建立過程中的加權方法》。希望對大家有所幫助。

一、索引建立中的權值
搜尋引擎蜘蛛的爬行與抓取,頁面的收錄與索引,是一個頁面能夠在使用者搜尋關鍵詞時能夠獲得展現的幾個基本步驟,其中索引建立中包含著對頁面內容本身的加權因素。
① 索引項權值概念
索引項的權值,在一定程度上反應了文件中詞的相對重要性,這個值通常用於索引排序過程中計算分值,也就是影響搜尋引擎排序的重要因素之一。
② 索引項權值怎麼得來的?
索引項權值,是由檢索模式中的加權元件利用文件統計結果來計算得出的。
③ 索引項加權方法
傳統的檢索模式中最常見的加權方法:TF-IDF演算法。
二、TF-IDF演算法
① TF-IDF演算法定義
TF-IDF演算法,基於索引項出現在一個文件中的次數或頻率,以及索引項在整個文件集合中出現的頻率,兩者的組合(或者說兩者的乘積)。
② TF-IDF演算法中詞的解析
1)TF
次數和頻率稱之為詞頻,英文簡稱為tf。
2)IDF
索引項在整個文件集合中出現的頻率,稱之為範文檔頻率,英文簡稱為idf。
③ TF-IDF演算法的簡單說明
TFIDF的核心思想,是指某個詞或某個短語在一篇文件中出現的頻率高,並且在索引庫的其他文件中出現較少,就認為這個詞或短句有很好的類別區分能力,可以用來進行分類。
簡單來講,某個詞或某個短語就是索引詞,對於這篇文章而言,該詞項將被賦予較高的權值。
打個比方說,“TWNM-SEO”這個短語完全是小小課堂網提出的,在《全網營銷SEO【TWNM-SEO】這就是屬於我的網站優化》一文中,這個短語出現的頻率非常高,同時,在此之前也沒有其他人提到過這個短語,那麼對於這篇文件來講,該詞項“TWNM-SEO”就被賦予了很高的權值。

三、理解並使用TF-IDF演算法
對於SEOer來講,瞭解上面的知識已經足夠了,沒必要非得知道是用哪個函式,哪個公式算出來的結果。
其實,通過TF-IDF演算法的學習,我們可以更好理解一些常識性的SEO知識。
① 品牌詞容易優化
品牌詞一般是自己創造的,滿足TF值大,同時IDF值大,頁面加權高,自然排名很容易。
② 行業核心詞難優化
無數網站都在優化這同一個詞,然而首頁的位置卻是有限的,大家都滿足TF大,但同樣IDF越小,證明這個詞越難優化。
這也就是平時在判斷關鍵詞優化難度時,為什麼將百度搜尋的相關結果數作為優化難度之一的原因。
③ 多挖掘沒有百度指數的關鍵詞-降低優化難度
行業中有百度指數的詞,大家都在做優化與排名,這樣的詞不光是競爭壓力大,可能還帶不來多少點選。因為百度指數可能是100,真實使用者也許只有2個,另外的98個都是企業的競爭者們。
我們應該挖掘一些沒有百度指數的詞,但是需要這次保持一定的搜尋量,這樣可以保證降低優化難度的同時,帶來更多真實流量。
④ TF並不是萬能!過度堆積害處大!
根據TF-IDF演算法,很多人會想,增加關鍵詞密度或頻率,以增加TF值,從而獲得更好的排名。然而,這種做法可以適當做,但超過一定度的話,沒什麼好處,反而可能會因為過度堆積被搜尋引擎降權!
所謂的2%~8%的關鍵詞密度只是個大概範圍,很多排名好的頁面很多都在2%一下,當然也有在8%以上的,只要密度不是過小,不必過度在乎這個。
舉個例子,已經是5%的密度了,非要故意堆積到8%,甚至百分之20%,就會變得非常沒有意義。這是對TF高的一種誤解。
也就是我們能夠根據TF-IDF演算法中得到的啟發是不應該讓關鍵詞的密度或頻率(TF)過低,然而對於IDF來說,我們只能通過尋找IDF值高的關鍵詞來優化,如果我們優化的關鍵詞的IDF值本來就很低,我們也不能對其改變這個現狀,IDF值越低,證明這個詞在一定程度上就越難優化。
所以,在網站優化過程中,除了要做好頁面外,還需要關注內鏈與外鏈優化。
四、TF-IDF演算法公式
① TF公式

TF(i,j):關鍵詞j在文件i中的出現頻率。
n(i,j):關鍵詞j在文件i中出現的次數。

舉例來講:
一篇文章總共100個詞,其中“SEO培訓”一共出現了10詞,那麼TF就是10/100,結果就是0.1。
然而,由於文章中會出現大量的“的”、“得”、“嗎”、“地”,不能正常反應文章的詞,所以,就得用IDF來做一個限制了。
② IDF公式

IDF(i):詞語i的反文件頻率
|D|:語料庫中的檔案總數
|j:t(i)屬於d(j)|出現詞語i的文件總數
+1是為了防止分母變0。

IDF就可以防止常用詞的干擾了。
還是剛才的例子:
一篇文章總共100個詞,其中“SEO培訓”一共出現了10詞,那麼TF就是10/100,結果就是0.1。
另外“我們”一共出現了10詞,其TF結果也是0.1。
假設語料庫總共有1000篇文章,其中“SEO培訓”文章有10篇,“我們”文章有1000篇。
“SEO培訓”的IDF=log(1000/10)= 2
“我們”的IDF=log(1000/1000)= 0
③ TF-IDF公式
TF-IDF = TF*IDF

“SEO培訓”的TF*IDF=0.1*0=0
“我們”的TF*IDF=0.1*2=0.2
那麼很顯然,對於這篇文章而言,“SEO培訓”比“我們”更加重要。
以上就是小小課堂SEO自學網為大家帶來的是《SEOer應善用索引建立過程中的加權方法》。感謝您的觀看。SEO培訓認準小小課堂!更多seo教程搜尋小小課堂。原創文章歡迎轉載並保留版權:https://www.xxkt.org/