使用者畫像案例一：汽車精準營銷

阿新 • • 發佈：2018-11-13

使用者畫像案例一：汽車精準營銷

做汽車精準營銷專案已經快一年的時間了，但是說起正真的使用者畫像，又不知道該如何說起，所以我就開始從資料的處理流程一點點的來引進使用者畫像的建立。

1、資料的處理流程

我們用到的技術就是用java寫mapreduce框架來實現使用者上網資料的url的識別，這裡識別用的是正則表示式，其次就是模型的建立使用hive就行處理。

首先我們的資料來源有兩個方面：一個是客戶的資料，還有一個是網路爬蟲資料。

客戶的資料有：使用者手機上網日誌（識別上網的url）、基礎資訊（性別、年齡、省份、地市等）、語音話單（綜採話單、計費話單）、App彙總表、使用者搜尋關鍵字解析表、綜採簡訊話單等；

爬蟲資料：在url中我們解析出來一般是汽車的車型id，但在實際的使用中我們用到的卻是汽車的名稱，所以這就需要爬取汽車網站的資料來進行匹配處理。電話營銷會顯的更直觀，更可靠，所以我們定義了不同的口徑去分析使用者的購車意向。

資料的處理流程說明如下：

對原始上網日誌資料進行初篩處理（由客戶來處理，我們提供規則），因為全國的上網日誌資料是特別大的，一天大概產生80-90T。所有先由客戶初篩出我們需要的資料，我們做的汽車行業，就會只拿出汽車行業相關的資料推送給我們。
初篩之後的資料我們還需要清洗一遍，過濾掉號碼異常的，過濾掉url異常的資料。此過程除了清洗最重要作用還是識別，識別url的網站來源、訪問的板塊（例如：首頁、圖片、價格、論壇等）、車型id、一手車還是二手車等。

資料的匹配和模型的建立，根據使用者的瀏覽行為和一些基礎的標籤，判斷意向購車使用者，給使用者賦值不同的等級類別。

2、使用者畫像的建立

我們的使用者畫像可以分為三大類：使用者的基本屬性、汽車的基本屬性、經銷商的基本屬性，根據客戶的現有資料建立模型，分析現有標籤對客戶意向的影響。根據多個標籤屬性綜合分析可以得到三類使用者：意向階段、對比階段、決策階段。

1）使用者屬性：年齡、性別、城市

年齡段：將年齡按照5歲為一個階段劃分為不同的年齡段，25—50歲之間為購車的主力人群；
性別：購車方面男女的比例是8：2，男士佔主要的地位；
城市等級：將城市劃分成不同的等級，從城市等級看，主要集中二三四線城市，三線城市男性、二線城市及六線小城市女性買車偏好度更高。高等級城市對高價位車型明顯偏好，低線城市10萬元以下價位車型偏好度高於其它等級城市；二線城市對15萬以上車型偏好度顯著高於其他城市；

2）汽車屬性：品牌、最低價、最高價、級別、車身形式、網站、國別、渠道、能源形式、是否純電動

品牌：品牌的銷量與使用者的年齡、性別是密不可分的。分析資料我們得到20—25歲人群更偏向於國產品牌，25—30歲人群更偏向於大品牌，30—35歲人群更偏向合資品牌，35—40歲人群偏好成熟穩重品牌，40—50歲人群對商用車品牌更青睞。女性使用者購車品牌中合資品牌比例明顯高於男性使用者，合資品牌偏向中高階品牌；
價格段：女性使用者更偏向於高階車型，男性使用者購車方面更偏向於實用為主。高等級城市對高價位車型明顯偏好，低線城市10萬元以下價位車型偏好度高於其它等級城市。35—45歲對50萬以上高階車型購買比例最高；30—40歲對25—40萬的中高階品牌車型購買比例最高；而25—35歲使用者對5—10萬的中低端品牌車型購買比例最高。

3）經銷商屬性：主營品牌、電話型別、經銷商名稱

這些標籤主要是針對使用者的語音話單進行處理的，這裡的電話可以分為：官網的400電話，以0開頭的座機號和一些手機號，不同的經銷商所主營的品牌的銷售額是不一樣的，根據他電話諮詢經銷商的情況我們可以推斷使用者的意向情況，這裡也剛好和汽車屬性的判斷很好的銜接上了。

4）已有車使用者的建立

已有車使用者的建立，對模型的意向結果是至關重要的。我們重點分析的是使用者的上網行為，比如某個使用者是汽車愛好者，他每天都會有瀏覽汽車網站的行為，但是他沒有買車的意向或者已經有車了，我們就需要排除這樣的使用者，那麼應該怎樣做呢：

可以從行為分析：愛好者一般好看汽車新聞、圖片、論壇等模組，而意向客戶會偏重引數配置、報價、詢底價、預約試駕等模組。這樣可以初步的找到愛好的使用者；
使用者訪問的app：如果使用者使用這些app，車輪查違章、途虎養車網、58違章查詢、導航犬等app，則可以判斷此使用者是用車使用者；
根據已營銷使用者的反饋情況就可以確定那些使用者是用車使用者，從而在底層的模型中去做過濾；

說明：以上的結果全是我們自己的分析整合得出的結論，不代表整個行業的現象，望周知。

3、模型資料的輸出

我們是從不同的口徑去得到模型結果的，這裡我們叫做模型規則，不同的規則使用者的意向率是不同的，而且我們是根據使用者的需求去下發資料的，這樣我們的規則就是必不可少的。（一下規則僅供參考）

規則1：瀏覽汽車頁面的使用者，這裡一個使用者可能訪問多個網站、同一個網站使用者可以訪問不同的車型，這裡我們處理時，一個使用者是隻能儲存一條訪問記錄的。首先選擇汽車車型不為空的資料，然後按網站統計的使用者的停留時長，停留時間最長的使用者網站資料帶出，然後根據基礎標籤得到使用者的等級，再排除已有車的使用者，就可以得到規則1的結果；
規則2：直接通過電話諮詢的使用者，從使用者的綜採話單、MB計費話單、CB計費話單和自建表的電話相互關聯，找到主動撥打電話諮詢的使用者；

有很多規則這裡就不詳細的一一說明了，最終的結果是將所有的規則合併寫到一張表中去做外呼處理。

使用者畫像案例一：汽車精準營銷