1. 程式人生 > >使用者畫像案例一:汽車精準營銷

使用者畫像案例一:汽車精準營銷

使用者畫像案例一:汽車精準營銷

做汽車精準營銷專案已經快一年的時間了,但是說起正真的使用者畫像,又不知道該如何說起,所以我就開始從資料的處理流程一點點的來引進使用者畫像的建立。

1、資料的處理流程

我們用到的技術就是用java寫mapreduce框架來實現使用者上網資料的url的識別,這裡識別用的是正則表示式,其次就是模型的建立使用hive就行處理。

首先我們的資料來源有兩個方面:一個是客戶的資料,還有一個是網路爬蟲資料。

  • 客戶的資料有:使用者手機上網日誌(識別上網的url)、基礎資訊(性別、年齡、省份、地市等)、語音話單(綜採話單、計費話單)、App彙總表、使用者搜尋關鍵字解析表、綜採簡訊話單等;
  • 爬蟲資料:在url中我們解析出來一般是汽車的車型id,但在實際的使用中我們用到的卻是汽車的名稱,所以這就需要爬取汽車網站的資料來進行匹配處理。電話營銷會顯的更直觀,更可靠,所以我們定義了不同的口徑去分析使用者的購車意向。

資料的處理流程說明如下:

  1. 對原始上網日誌資料進行初篩處理(由客戶來處理,我們提供規則),因為全國的上網日誌資料是特別大的,一天大概產生80-90T。所有先由客戶初篩出我們需要的資料,我們做的汽車行業,就會只拿出汽車行業相關的資料推送給我們。
  2. 初篩之後的資料我們還需要清洗一遍,過濾掉號碼異常的,過濾掉url異常的資料。此過程除了清洗最重要作用還是識別,識別url的網站來源、訪問的板塊(例如:首頁、圖片、價格、論壇等)、車型id、一手車還是二手車等。
  3. 資料的匹配和模型的建立,根據使用者的瀏覽行為和一些基礎的標籤,判斷意向購車使用者,給使用者賦值不同的等級類別。

2、使用者畫像的建立

我們的使用者畫像可以分為三大類:使用者的基本屬性、汽車的基本屬性、經銷商的基本屬性,根據客戶的現有資料建立模型,分析現有標籤對客戶意向的影響。根據多個標籤屬性綜合分析可以得到三類使用者:意向階段、對比階段、決策階段。

1)使用者屬性:年齡、性別、城市

  • 年齡段:將年齡按照5歲為一個階段劃分為不同的年齡段,25—50歲之間為購車的主力人群;
  • 性別:購車方面男女的比例是8:2,男士佔主要的地位;
  • 城市等級:將城市劃分成不同的等級,從城市等級看,主要集中二三四線城市,三線城市男性、二線城市及六線小城市女性買車偏好度更高。高等級城市對高價位車型明顯偏好,低線城市10萬元以下價位車型偏好度高於其它等級城市;二線城市對15萬以上車型偏好度顯著高於其他城市;

2)汽車屬性:品牌、最低價、最高價、級別、車身形式、網站、國別、渠道、能源形式、是否純電動

  • 品牌:品牌的銷量與使用者的年齡、性別是密不可分的。分析資料我們得到20—25歲人群更偏向於國產品牌,25—30歲人群更偏向於大品牌,30—35歲人群更偏向合資品牌,35—40歲人群偏好成熟穩重品牌,40—50歲人群對商用車品牌更青睞。女性使用者購車品牌中合資品牌比例明顯高於男性使用者,合資品牌偏向中高階品牌;
  • 價格段:女性使用者更偏向於高階車型,男性使用者購車方面更偏向於實用為主。高等級城市對高價位車型明顯偏好,低線城市10萬元以下價位車型偏好度高於其它等級城市。35—45歲對50萬以上高階車型購買比例最高;30—40歲對25—40萬的中高階品牌車型購買比例最高;而25—35歲使用者對5—10萬的中低端品牌車型購買比例最高。

3)經銷商屬性:主營品牌、電話型別、經銷商名稱

  • 這些標籤主要是針對使用者的語音話單進行處理的,這裡的電話可以分為:官網的400電話,以0開頭的座機號和一些手機號,不同的經銷商所主營的品牌的銷售額是不一樣的,根據他電話諮詢經銷商的情況我們可以推斷使用者的意向情況,這裡也剛好和汽車屬性的判斷很好的銜接上了。

4)已有車使用者的建立

已有車使用者的建立,對模型的意向結果是至關重要的。我們重點分析的是使用者的上網行為,比如某個使用者是汽車愛好者,他每天都會有瀏覽汽車網站的行為,但是他沒有買車的意向或者已經有車了,我們就需要排除這樣的使用者,那麼應該怎樣做呢:

  1. 可以從行為分析:愛好者一般好看汽車新聞、圖片、論壇等模組,而意向客戶會偏重引數配置、報價、詢底價、預約試駕等模組。這樣可以初步的找到愛好的使用者;
  2. 使用者訪問的app:如果使用者使用這些app,車輪查違章、途虎養車網、58違章查詢、導航犬等app,則可以判斷此使用者是用車使用者;
  3. 根據已營銷使用者的反饋情況就可以確定那些使用者是用車使用者,從而在底層的模型中去做過濾;

說明:以上的結果全是我們自己的分析整合得出的結論,不代表整個行業的現象,望周知。

3、模型資料的輸出

我們是從不同的口徑去得到模型結果的,這裡我們叫做模型規則,不同的規則使用者的意向率是不同的,而且我們是根據使用者的需求去下發資料的,這樣我們的規則就是必不可少的。(一下規則僅供參考)

  • 規則1:瀏覽汽車頁面的使用者,這裡一個使用者可能訪問多個網站、同一個網站使用者可以訪問不同的車型,這裡我們處理時,一個使用者是隻能儲存一條訪問記錄的。首先選擇汽車車型不為空的資料,然後按網站統計的使用者的停留時長,停留時間最長的使用者網站資料帶出,然後根據基礎標籤得到使用者的等級,再排除已有車的使用者,就可以得到規則1的結果;
  • 規則2:直接通過電話諮詢的使用者,從使用者的綜採話單、MB計費話單、CB計費話單和自建表的電話相互關聯,找到主動撥打電話諮詢的使用者;

有很多規則這裡就不詳細的一一說明了,最終的結果是將所有的規則合併寫到一張表中去做外呼處理。