1. 程式人生 > >誰說菜鳥不會資料分析(SPSS篇)----- 學習筆記

誰說菜鳥不會資料分析(SPSS篇)----- 學習筆記

1、定義:通過研究變數間的相關係數矩陣,把這些變數間錯綜複雜的關係歸結成少數幾個綜合因子,並據此對變數進行分類的一種統計分析方法。由於歸結出的因子個數少於原始變數個數,但是它們又包含原始變數的資訊,故這一分析過程也稱為降維。

2、目的:探索結構:在變數之間存在高度相關性時希望用較少的因子來概括其資訊

                     簡化資料:把原始變數轉化為因子得分後,使用因子得分進行其他分析,比如聚類分析、回                                              歸分析等

                     綜合評價:通過每個因子得分計算出綜合得分,對分析物件進行綜合評價

3、基本思想:通過因子分析,原始變數會轉變為新的因子,這些因子之間相關性較低,而因子內部的變數相關程度較高

4、基本概念:

  • 因子載荷(factor loading):就是每個原始變數和每個因子之間的相關係數,反映了變數對因子的重要性。通過因子載荷值的高低,可知道變數在對應因子中的重要性大小,利於發現因子的實際含義,利於因子的命名。當有多個因子的時候,因子載荷將構成一個矩陣,稱為因子載荷矩陣。
  • 變數共同度(communality):就是每個變數所包含的資訊能夠被因子所解釋的程度,其取值範圍介於0和1之間,取值越大,說明該變數能被因子解釋的程度越高。
  • 因子旋轉(rotation):因子分析的結果需要每個因子都要有實際意義,有時,原始變數和因子之間的相關係數可能無法明顯地表達出因子的含義,為了使這些相關係數更加顯著,可以對因子載荷矩陣進行旋轉,使原始變數和因子之間的關係更為突出,從而對因子的解釋更加容易。
  • 因子得分(factor score):因子得分可以用來評價每個個案在每個因子上的分值,該分值包含了原始變數的資訊,可以用於代替原始變數進行其他統計分析,比如迴歸分析,可考慮將因子得分作為自變數,與對應的因變數進行迴歸。需要注意原始變數的數值是直接觀測到的,而因子得分只能通過原始變數和因子之間的關係計算得到,且因子得分是經過標準化之後的數值,各個因子得分之間不受量綱的影響。

5、分析步驟:

                   

6、如何判斷資料是否適合因子分析

7、旋轉方法常用:最大方差法,該方法能使每個變數儘可能在一個因子上有較高的載荷,在其餘的因子上載荷較小,方便對因子進行解釋。

累積方差貢獻率達到60%及以上,則說明因子對變數的解釋能力尚可接受,達到80%及以上,說明因子對變數的解釋能力非常好。

判斷最佳因子數:通常選取曲線中較陡的位置所對應的因子個數(特徵值-因子個數圖)。

8、提取因子個數的標準:

  

9、綜合得分:貢獻方差佔比