1. 程式人生 > >基於大數據的用戶行為預測

基於大數據的用戶行為預測

生成 老年 移動 周期 功能 每天 統計 添加 變換

隨著智能手機的普及和APP形態的愈發豐富,移動設備的應用安裝量急劇上升。用戶在每天使用這些APP的過程中,也會產生大量的線上和線下行為數據。這些數據反映了用戶的興趣與需求,如果能夠被深入挖掘並且合理利用,可以指導用戶的運營。若能提前預測用戶下一步的行為,甚至提前得知用戶卸載、流失的可能性,則能更好地指導產品的優化以及用戶的精細化運營。


大數據服務商個推旗下的應用統計產品“個數”,可以從用戶屬性、使用行為、行業對比等多指標多維度對APP進行全面統計分析。除了基礎統計、渠道統計、埋點統計等功能外,個數的一大特色能力是——可基於大數據進行用戶行為預測,幫助運營者預測用戶流失、卸載、付費的可能性,從而助力APP的精細化運營以及全生命周期管理。

開發者在實踐的過程中,基於大數據進行用戶行為預測會有兩大難點:第一,開發者需要使用多種手段對目標問題進行分解;第二,數據在特定的問題上會有不同的表現。

“個數”利用數據分析建模,對用戶行為進行預測的大概流程包括以下幾點:

1、目標問題分解

(1)明確需要進行預測的問題;
(2)明確未來一段時間的跨度。

2、分析樣本數據

(1)提取出所有用戶的歷史付費記錄,這些付費記錄可能僅占所有記錄的千分之幾,數據量會非常小;
(2)分析付費記錄,了解付費用戶的構成,比如年齡層次、性別、購買力和消費的產品類別等;
(3)提取非付費用戶的歷史數據,這裏可以根據產品的需求,添加條件、或無條件地進行提取,比如提取活躍並且非付費用戶,或者不加條件地直接進行提取;

(4)分析非付費用戶的構成。

3、構建模型的特征

(1)原始的數據可能能夠直接作為特征使用;
(2)有些數據在變換後,才會有更好的使用效果,比如年齡,可以變換成少年、中年、老年等特征;
(3)交叉特征的生成,比如“中年”和“女性”兩種特征,就可以合並為一個特征進行使用。

4、計算特征的相關性

(1)計算特征飽和度,進行飽和度過濾;
(2)計算特征IV、卡方等指標,用以進行特征相關性的過濾。

5、選用相關的模型進行建模

(1)選擇適當的參數進行建模;
(2)模型訓練好後,統計模型的精確度、召回率、AUC等指標,來評價模型;
(3)如果覺得模型的表現可以接受,就可以在驗證集上做驗證,驗證通過後,進行模型保存和預測。

6、預測

加載上述保存的模型,並加載預測數據,進行預測。

7、監控

最後,運營人員還需要對每次預測的結果進行關鍵指標監控,及時發現並解決出現的問題,防止出現意外情況,導致預測無效或預測結果出現偏差。

以上就是“個數”對用戶行為進行預測的整體流程。總的來說,分析和建模的關鍵在於大數據的收集和對大數據細節的處理。在進行用戶行為預測的整個過程中,可供技術人員選擇的方法和模型都有很多,而對於實際的應用者來說,沒有最好的選擇,只有更合適的選擇。

基於大數據的用戶行為預測