1. 程式人生 > >機器學習筆記(二)

機器學習筆記(二)

總結自 《機器學習》周志華

模型評估與選擇
錯誤率=樣本總數/分類錯誤的樣本數
精度=1-錯誤率
誤差:實際預測輸出與樣本真實輸出之間的差異
訓練誤差:學習器在訓練集上的誤差
泛化誤差:學習器在新樣本上的誤差
過擬合:學習能力過於強大,將訓練樣本本身的一些不太一般的特點當作所有潛在樣本的特點導致演算法泛化效能下降
欠擬合:學習能力過於弱小,還未將訓練樣本的一般特點學習到位
小心得:泛化誤差在實際運用中不能直接獲得,因此對於學習演算法的選擇以及引數配置的選擇上無法依賴於泛化誤差的評估,而訓練誤差由於有過擬合現象的出現(即使訓練誤差很小,泛化誤差卻可能很大)也不適合用來做模型評估