1. 程式人生 > >elasticsearch 筆記十五:相關度評分TF&IDF演算法簡介

elasticsearch 筆記十五:相關度評分TF&IDF演算法簡介

演算法介紹

relevance score ,就是計算出一個索引中的文字,與搜尋文字,他們之間的關係,它們之間的關聯匹配度是由Elasticsearch使用的 term frequency/inverse document frequency 演算法,簡稱TF/IDF演算法

Term frequency :搜尋文字中的各個詞條在field 文字中出現多少次,出現的次數越多,就越相關

Inverse document fruquency: 搜尋文字中各個詞條在整個索引的所有文件中出現了多少次,出現的次數越多就越不相關

Field-length norm:field長度,field越長,相關度越弱