1. 程式人生 > >機器學習裡面的Ground Truth是什麼意思

機器學習裡面的Ground Truth是什麼意思

在看英文文獻的時候,經常會看到Ground Truth這個詞彙,翻譯的意思是地面實況,放到機器學習裡面,再抽象點可以把它理解為真值、真實的有效值或者是標準的答案

維基百科對Ground Truth在機器學習領域的解釋是:

在機器學習中,“ground truth”一詞指的是訓練集對監督學習技術的分類的準確性。這在統計模型中被用來證明或否定研究假設。“ground truth”這個術語指的是為這個測試收集適當的目標(可證明的)資料的過程。

今天在看《Outlier Analysis》時,有句話: However, it is generally much harder to reduce bias in outlier ensembles because of the absence of ground truth.

放到對異常點的檢測方面來理解這個ground truth就好理解了。在對異常點進行檢測的時候,通過一些ensemble methods可以在一定程度上提高準確性,從而減少bias,但是由於對於異常點的定義本身就是一個問題,所以在對這些資料進行label的過程中,保證labeled data是正確的異常點也是個問題。