1. 程式人生 > >實戰:航空公司客戶價值分析

實戰:航空公司客戶價值分析

一、 背景與挖掘目標

試圖實現以下目標:

(1)藉助航空公司資料,對客戶進行分類。

(2)對不同類別的客戶進行特徵分析,比較不同類別客戶的價值分析。

(3)對不同價值的客戶類別進行個性化服務,制定相應的營銷策略。

二、分析方法

使用 LRMFC模型來進行分析

L:


三、資料探索

注意觀察describe()函式引數變化。

(1)



(2)





匯出後的Excel檔案如下:


四、資料預處理

1、資料清洗

由資料探索分析可知,資料中存在缺失值,存在票價最小值為0、平均折扣率為0但飛行公里數卻大於0的記錄。由於這些記錄的數量不多,所以對其進行丟失處理。

PS:在Excel中對

SUM_YR_1
SUM_YR_2
篩選掉空白值時,
SUM_YR_2
有太多值,篩選只能顯示前10000個值,所以只能通過自定義篩選的方法來去除空白值。


2、屬性規約

根據LRFMC模型,選擇與該模型相關的6個屬性:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、avg_discount、SEG_KM_SUM、LAST_TO_END


結果如下:



3、資料變換

 資料變換是將資料轉換成“適當的”形式,以適應挖掘任務和演算法的要求。本案例中採用的資料變換方式是屬性構造和資料標準化。

由於資料中並沒有直接給出LRFMC5個指標,需要通過屬性構造來提取這5個指標。具體的計算方式如下:

(1)L=LOAD_TIME-FFP_DATE

(2)R=LAST_TO_END

(3)F=FLIGHT_COUNT

(4)M=SEG_KM_SUM

(5)C=avg_discount


程式碼如下:

資料提取後,其資料取值範圍如下: