1. 程式人生 > >簡單的解釋一下查準率和召回率

簡單的解釋一下查準率和召回率

查準率和召回率(查全率),這兩個指標是搜尋引擎中經典的度量方法。

這裡寫圖片描述

A:檢索到的,相關的 (搜到的也想要的)
B:未檢索到的,但是相關的 (沒搜到,然而實際上想要的)
C:檢索到的,但是不相關的 (搜到的但沒用的)
D:未檢索到的,也不相關的 (沒搜到也沒用的)

這裡寫圖片描述

被檢索到的越多越好,這是追求“查全率”(召回率),即A/(A+B),越大越好。
被檢索到的,越相關的越多越好,不相關的越少越好,這是追求“查準率”,即A/(A+C),越大越好。

在大規模資料集合中,這兩個指標是相互制約的。當希望索引出更多的資料的時候,查準率就會下降,當希望索引更準確的時候,會索引更少的資料。