如何用統計方法分析使用者畫像?(一)
新時代的產品經理“上的了廳堂,下的了廚房,懂的了程式碼,分析的了資料” ,哭笑臉,調侃一下。在實際的產品設計開發中,產品經理的需求的分析離不開使用者使用場景及使用行為資料分析等,但是自己目標使用者群體到底是什麼樣的?是不是我們想象的那個人群呢?使用者可以分為哪幾類?不同的使用者群體到底有多大的佔比?這幾類使用者中,哪些是可以發力的核心使用者?這個產品設計方案到底能解決多大量的使用者需求呢?
在沒有精確的大資料標籤化的使用者畫像資料支撐下,是否可以使用簡單的測量-統計方法,較敏捷地得到一個期望的“使用者畫像”呢?
前言
提起使用者畫像大部分人的意識中就是使用者的“性別、年齡、婚姻狀況。。”等等的一攬子人口學變數描述,確實, 人口學變數用來區分使用者確實是很經典,但並不適用於所有的產品研究, 比如你的產品就是細分領域,比如母嬰電商、某個遊戲產品,目標使用者群體人口學資料很集中,首先是人口學變數並不能直接落地到業務,還需要基於業務進行二次推演,不夠直觀,而好的分類標準應該能直接與現有的資源結合起來指導業務;其次是完全無預設的情況下,事前很難確定各個人口學變數影響的權重,那麼如果要進行探索性分析,需要在問題中納入足夠多的變數。 所以最好的方式是前期定性研究,通過定性方式得到一些區分人物的變數,得到定性的使用者畫像,再通過定量方式去驗證分類變數、人物分類, 從而問卷設計更有針對性。
回收回來的問卷資料有那麼多的變數,哪些變數影響著使用者分類呢?怎麼確定這些變數的影響權重呢?這裡面就會用到統計分析方法: 因子分析-聚類分析 ,下面結合案例說明具體分析過程:
使用者畫像資料分析的第一步:資料降維之因子分析法
資料降維就要用到因子分析方法,把資料進行濃縮,所謂因子分析就是處理多變數資料的一種常用的預處理方法,使用場景是當實際的用於測量的變數較多且相關時,可以將比較繁瑣複雜的變數,用幾個易於解釋的因子來代替原來較多的變數,從而清晰展示資料的結構,然後再用因子進行聚類分析得到分類使用者。

因子分析、聚類分析模型
以案例說明,問卷中相關的題目選項資料是以二分資料表示的,多選題資料就是多重二分法,一共有58個變數,這些變數之間存在相關關係,符合因子分析使用場景,因子分析使用SPSS來分析資料。
分析步驟:
1、選用Analyze->Data Reduction->Factor......
2、引入因子分析變數;描述統計選項卡:要對因子提取前後方差變化,選定“原始分析結果”,相關係數矩陣、KMO和球形檢驗係數,它表示資料是否適合做因子分析。

3、提取公因子方法;主成分分析法;提取因子的方法有很多,最常用的是主成分分析法。特徵值取1,提取因子可選特徵值大於1的因子。因為分析的變數測度單位不同,選相關矩陣,如果測度單位相同,則考慮用協方差矩陣。

這裡簡單說一下主成分分析法與因子分析法異同,具體見下:

4、旋轉方法:方差最大旋轉方法,因子分析需要對因子給予命名和解釋,對因子旋轉與否取決於因子的解釋,如果不旋轉因子已經很好的解釋,那麼就沒必要旋轉;否則應該旋轉。

5、因子得分:作為新變數存入,

6、結果分析:
(1) KMO值與sig值:當KMO值越大時,表示變數間的共同因子越多,越適合做因子分析,根據Kaiser的觀點,當KMO>0.9(很棒)、KMO>0.8(很好)、KMO>0.7(中等)、KMO>0.6(普通)、KMO>0.5(粗劣)、KMO<0.5(不能做因子分析);sig值要<0.05;

(2)公因子方差:
表示公因子對各個變數能說明的程度,每個變數的初始公因子方差都為1,共同度越大,公因子對該變數的說明的程度越大,也就是該變數對公因子的依賴程度越大。一般的基準是<0.4,就可以認為是比較低,這時變數分析中去掉比較好,上面的結果中7個因子的提取值都大於0.5,說明可以作為公共因子分析。
(3)解釋的總方差:
特徵值大於1以上就是比較重要的因子;下圖前四個因子特徵值大於1,累積貢獻率表示因子可以解釋原有變數百分之多少的資訊,所以在分析時候需要不斷去嘗試不同的變數的排列組合,使累積貢獻率越大越好,此案例因子取4個比較顯著,所以目前為止已經將7個因子降維到4個因子。

(4)成份得分系數矩陣:
通常,因子載荷量>0.4就認為是顯著的,也可以取0.5以上的,再根據提取的顯著性的因子給公因子命名:
以下第一個公因子中養魚年限比較顯著,第一個因子命名為“養魚經驗因子”,第二個公因子中“養魚月花費”與“收入”顯著,命名為“養魚花費因子”;第三個“魚種興趣廣泛”顯著性比較高,命名第三個因子為“魚種興趣因子”;第四個“看帖習慣”顯著性比較高,命名為“內容習慣因子”。

資料檢視得到這四個公因子,所以最後從7個因子中提取到了這4個因子。

到此因子分析就算完成了,我們的目的達成了一小半,簡言之就是我們得到了劃分使用者群體的依據,那麼如何對使用者進行分類,可以分成幾類呢?這就需要使用統計學中的另一種統計分析方法——聚類分析,具體分析請等下一篇文章更新......
宣告:本文為個人原創,辛苦碼字比較不易,堅持原創,如覺得有用需轉載請註明出處,謝謝。