1. 程式人生 > >吳恩達機器學習之聚類演算法的引數選擇以及優化

吳恩達機器學習之聚類演算法的引數選擇以及優化

對於K(k<樣本量的)均值聚類,一般引數的自定義主要有兩個,一個是聚類中心初始位置的選擇,二是K值的選擇

優化目標:每個樣本點到該點聚類中心的平方的累加


解決聚類中心的初始化問題:

隨機挑選樣本點作為聚類中心,這個過程重複50-1000次,選出J值最低的(通常K值為2-10的時候該方法比較有效)。

解決K值問題,肘部法:

嘗試不同的K(K值通常為3-10比較好)值,算出J值,選取拐點出的K值