1. 程式人生 > >機器學習 | 機器學習評估方法

機器學習 | 機器學習評估方法

-- 測試 全局 class log 方法 hold 相同 ots

機器學習評估方法

  • 留出法(hold out):數據集預留出一部分數據為測試集,將數據集 D 劃分為訓練集 S 和測試集 T。大概比例為測試集占全局數據量的(1/5~1/3)
  • 留一法:留一法是留出法的特例,即每次測試集 T 只留一個數據,剩下的作為訓練集 S
  • K折交叉驗證(k-fold cross validation):每次將數據劃分 k 份,其中一份作為測試集 T,剩下的作為訓練集 S;重復以上過程 k 次,特別地每次用作測試集 T 的都是各不相同的。
  • 自助法(bootstrapping):每次從數據集 D 中有放回地采一個樣本,並將這個樣本放入訓練集 S 中,共重復 m 次,此時訓練集共有 m 個樣本,而測試集 T 則為 D - S(此處的減法為集合減法)

自助法在樣本量較少、難以有效劃分訓練集和測試集時很有用,而留出法k折交叉驗證在樣本量較多時更常用

機器學習 | 機器學習評估方法