1. 程式人生 > >elasticsearch 筆記十九:倒排索引

elasticsearch 筆記十九:倒排索引

倒排索引的結構

(1)包含這個關鍵詞的document list
(2)包含這個關鍵詞的所有document的數量:IDF(inverse document frequency)
(3)這個關鍵詞在每個document中出現的次數:TF(term frequency)
(4)這個關鍵詞在這個document中的次序
(5)每個document的長度:length norm
(6)包含這個關鍵詞的所有document的平均長度


倒排索引不可變的優點

(1)不需要鎖,提升併發能力,避免鎖的問題
(2)資料不變,一直儲存在os cache中,只要cache記憶體足夠
(3)filter cache一直駐留在記憶體,因為資料不變
(4)可以壓縮,節省cpu和io開銷

倒排索引不可變的缺點

(1)每次都要重新構建整個索引