elasticsearch 筆記十五:相關度評分TF&IDF演算法簡介
阿新 • • 發佈:2019-01-26
演算法介紹
relevance score ,就是計算出一個索引中的文字,與搜尋文字,他們之間的關係,它們之間的關聯匹配度是由Elasticsearch使用的 term frequency/inverse document frequency 演算法,簡稱TF/IDF演算法
Term frequency :搜尋文字中的各個詞條在field 文字中出現多少次,出現的次數越多,就越相關
Inverse document fruquency: 搜尋文字中各個詞條在整個索引的所有文件中出現了多少次,出現的次數越多就越不相關
Field-length norm:field長度,field越長,相關度越弱