1. 程式人生 > >用戶畫像知識

用戶畫像知識

內容 有道 動態 mil 架構 長度 劃分 擴展性 3.1

用戶畫像相關知識點

1、用戶畫像是什麽?

技術分享

用戶畫像(User Profile),用戶信息標簽化

用戶畫像有很多的的標簽組成,每個標簽都規定了觀察、認識、描述用戶的角度。標簽根據企業業務的發展情況,或多或少,對外而言都是一個整體,這個整體稱之為用戶畫像。

2、為什麽需要用戶畫像?

用戶畫像的核心工作是為用戶打標簽,打標簽的重要目的之一是為了讓人能夠理解並且方便計算機處理。

大數據處理,離不開計算機的運算,標簽提供了一種便捷的方式,使得計算機能夠程序化處理與人相關的信息,甚至通過算法、模型能夠“理解” 人。當計算機具備這樣的能力後,無論是搜索引擎、推薦引擎、廣告投放等各種應用領域,都將能進一步提升精準度,提高信息獲取的效率。

技術分享

用戶畫像的本質就是從業務角度出發對用戶進行分析,了解用戶需求,尋找目標客戶。

3、用戶畫像怎麽設計?

一個標簽通常是人為規定的高度精煉的特征標識

3、1 數據源分析

構建用戶畫像是為了還原用戶信息,因此數據來源於:所有用戶相關的數據。

對於用戶相關數據的分類,引入一種重要的分類思想:封閉性的分類方式

這樣的分類方式,有助於後續不斷枚舉並叠代補充遺漏的信息維度。不必擔心架構上對每一層分類沒有考慮完整,造成維度遺漏留下擴展性隱患。另外,不同的分類方式根據應用場景,業務需求的不同,也許各有道理,按需劃分即可。

  3.1.1 靜態信息數據     

      用戶相對穩定的信息。

  3.1.2 動態信息數據

   

      用戶不斷變化的行為信息。

      在互聯網上,用戶行為,可以看作用戶動態信息的唯一數據來源。

3.2 目標分析

用戶畫像的目標是通過分析用戶行為,最終為每個用戶打上標簽,以及該標簽的權重。

3.3 數據建模方法

如何根據用戶行為,構建模型產出標簽、權重一個事件模型包括:時間、地點、人物三個要素。每一次用戶行為本質上是一次隨機事件,可以詳細描述為:什麽用戶,在什麽時間,什麽地點,做了什麽事

  3.3.1 什麽用戶   

      關鍵在於對用戶的標識,用戶標識的目的是為了區分用戶、單點定位。

  3.3.2 什麽時間     

      時間包括兩個重要信息,時間戳

+時間長度。

      時間戳,為了標識用戶行為的時間點。

      時間長度,為了標識用戶在某一頁面的停留時間。

  3.3.3 什麽地點   

      用戶接觸點,Touch Point。對於每個用戶接觸點。潛在包含了兩層信息:網址 + 內容。

  3.3.4 什麽內容

      每個url網址(頁面/屏幕)中的內容。  

      對於每個互聯網接觸點,其中網址決定了權重;內容決定了標簽。

  3.3.5 什麽事  

      用戶行為類型,對於電商有如下典型行為:瀏覽、添加購物車、搜索、評論、購買、點擊贊、收藏 等等。     

      不同的行為類型,對於接觸點的內容產生的標簽信息,具有不同的權重。

用戶畫像的數據模型,可以概括為下面的公式:用戶標識 + 時間 + 行為類型 + 接觸點(網址+內容),某用戶因為在什麽時間、地點、做了什麽事。所以會打上**標簽。

用戶標簽的權重可能隨時間的增加而衰減,因此定義時間為衰減因子r,行為類型、網址決定了權重,內容決定了標簽,進一步轉換為公式:

標簽權重=衰減因子×行為權重×網址子權重

如:用戶A,昨天在品尚紅酒網瀏覽一瓶價值238元的長城幹紅葡萄酒信息。

標簽:紅酒,長城

時間:因為是昨天的行為,假設衰減因子為:r=0.95

行為類型:瀏覽行為記為權重1

地點:品尚紅酒單品頁的網址子權重記為 0.9(相比京東紅酒單品頁的0.7

假設用戶對紅酒出於真的喜歡,才會去專業的紅酒網選購,而不再綜合商城選購。

則用戶偏好標簽是:紅酒,權重是0.95*0.7 * 1=0.665,即,用戶A:紅酒 0.665、長城 0.665

4、用戶畫像怎麽開發?

技術分享

5、用戶畫像工作堅持的原則(金融企業)

用戶畫像知識