用戶畫像知識
用戶畫像相關知識點
1、用戶畫像是什麽?
用戶畫像(User Profile),即用戶信息標簽化。
用戶畫像有很多的的標簽組成,每個標簽都規定了觀察、認識、描述用戶的角度。標簽根據企業業務的發展情況,或多或少,對外而言都是一個整體,這個整體稱之為用戶畫像。
2、為什麽需要用戶畫像?
用戶畫像的核心工作是為用戶打標簽,打標簽的重要目的之一是為了讓人能夠理解並且方便計算機處理。
大數據處理,離不開計算機的運算,標簽提供了一種便捷的方式,使得計算機能夠程序化處理與人相關的信息,甚至通過算法、模型能夠“理解” 人。當計算機具備這樣的能力後,無論是搜索引擎、推薦引擎、廣告投放等各種應用領域,都將能進一步提升精準度,提高信息獲取的效率。
用戶畫像的本質就是從業務角度出發對用戶進行分析,了解用戶需求,尋找目標客戶。
3、用戶畫像怎麽設計?
一個標簽通常是人為規定的高度精煉的特征標識。
3、1 數據源分析
構建用戶畫像是為了還原用戶信息,因此數據來源於:所有用戶相關的數據。
對於用戶相關數據的分類,引入一種重要的分類思想:封閉性的分類方式。
這樣的分類方式,有助於後續不斷枚舉並叠代補充遺漏的信息維度。不必擔心架構上對每一層分類沒有考慮完整,造成維度遺漏留下擴展性隱患。另外,不同的分類方式根據應用場景,業務需求的不同,也許各有道理,按需劃分即可。
3.1.1 靜態信息數據
用戶相對穩定的信息。
3.1.2 動態信息數據
用戶不斷變化的行為信息。
在互聯網上,用戶行為,可以看作用戶動態信息的唯一數據來源。
3.2 目標分析
用戶畫像的目標是通過分析用戶行為,最終為每個用戶打上標簽,以及該標簽的權重。
3.3 數據建模方法
如何根據用戶行為,構建模型產出標簽、權重。一個事件模型包括:時間、地點、人物三個要素。每一次用戶行為本質上是一次隨機事件,可以詳細描述為:什麽用戶,在什麽時間,什麽地點,做了什麽事。
3.3.1 什麽用戶
關鍵在於對用戶的標識,用戶標識的目的是為了區分用戶、單點定位。
3.3.2 什麽時間
時間包括兩個重要信息,時間戳
時間戳,為了標識用戶行為的時間點。
時間長度,為了標識用戶在某一頁面的停留時間。
3.3.3 什麽地點
用戶接觸點,Touch Point。對於每個用戶接觸點。潛在包含了兩層信息:網址 + 內容。
3.3.4 什麽內容
每個url網址(頁面/屏幕)中的內容。
對於每個互聯網接觸點,其中網址決定了權重;內容決定了標簽。
3.3.5 什麽事
用戶行為類型,對於電商有如下典型行為:瀏覽、添加購物車、搜索、評論、購買、點擊贊、收藏 等等。
不同的行為類型,對於接觸點的內容產生的標簽信息,具有不同的權重。
用戶畫像的數據模型,可以概括為下面的公式:用戶標識 + 時間 + 行為類型 + 接觸點(網址+內容),某用戶因為在什麽時間、地點、做了什麽事。所以會打上**標簽。
用戶標簽的權重可能隨時間的增加而衰減,因此定義時間為衰減因子r,行為類型、網址決定了權重,內容決定了標簽,進一步轉換為公式:
標簽權重=衰減因子×行為權重×網址子權重
如:用戶A,昨天在品尚紅酒網瀏覽一瓶價值238元的長城幹紅葡萄酒信息。
標簽:紅酒,長城
時間:因為是昨天的行為,假設衰減因子為:r=0.95
行為類型:瀏覽行為記為權重1
地點:品尚紅酒單品頁的網址子權重記為 0.9(相比京東紅酒單品頁的0.7)
假設用戶對紅酒出於真的喜歡,才會去專業的紅酒網選購,而不再綜合商城選購。
則用戶偏好標簽是:紅酒,權重是0.95*0.7 * 1=0.665,即,用戶A:紅酒 0.665、長城 0.665。
4、用戶畫像怎麽開發?
5、用戶畫像工作堅持的原則(金融企業)
用戶畫像知識