1. 程式人生 > >R語言學習-第九課-判別分析

R語言學習-第九課-判別分析

判別分析

discriminat analysis,是多變數統計中用於判別樣品所屬類別的一種統計分析方法。它所解決的問題是在一些已知研究物件已經用某種方法分成若干類的情況下,確定新的樣品屬於已知類別中的哪一類。

判別分析的主要方法如下:

 

1:Fisher判別

Fisher判別的基本思想是投影,是將K個總體Gi的所有p維,投影在一維上,且各個總體不同的樣本點儘可能分開,來自同一總體的樣本點儘可能集中,結合一元方差的思想匯出的投影函式是判別函式。 也可以說, fisher是尋找這樣的一個空間,樣本投影在這個空間上,類內距離最小(組內離差平方和SSE),類間距離最大(組間離差平方和SSG )。那麼怎麼求這個空間呢,類似於PCA,求最大特徵值對應的特徵向量組成的空間。  當我們取最大幾個特徵值對應的特徵向量組成特徵空間時(這裡指出,最佳投影軸的個數d<=c-1,這裡c是類別數),最佳投影矩陣如下   

image                

                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           

參考:http://www.cnblogs.com/txg198955/p/4106682.html MATLAB Fisher判別的一點思考

https://blog.csdn.net/tiaaaaa/article/details/58145126 分類程式程式碼