1. 程式人生 > >基於無埋點技術的使用者行為分析

基於無埋點技術的使用者行為分析

分析從狹來看是用的行資料分析,但是廣說這一個包含用分析,用果分析,用的行分析。用果和用的行分析是不一的,一個是果,一個是程。在國內市上關於用分析的品分基於前臺資料的用分析和基於後臺資料的用分析。基於前臺技的用分析重於用的行分析,而基於後臺技的用分析重於用果分析。類產品可以是有一定的片面性,完成的只是用分析的一部分。基於狀來談談全面的用分析應該怎麼做。篇文章主要會從資料來源和資料收集方式兩個角度來

資料來源

資料是用分析的大前提,一切的分析都始於資料,巧

婦難為無米之炊。用的資料來源有前臺點資料和後臺業務資料。僅僅使用後臺的業務資料,會致前臺用缺失,這樣僅僅資料傳統統計實現的效果差不多。假有兩種路徑能(用字母D表示),A-B-C-E-DA-B-F-D。那麼僅僅後臺資料我知道一個客了,下是多少,那麼如果我想知道哪種路徑引才能更容易下呢?

僅僅使用前臺資料,還是上面那個例子,然能夠識別出用是來自A-B-F-D的,但是要想分析個路徑來的用有多大價,在之後個用有沒有回來,他之後有在我們產品消了多少,像種復的分析,依前臺資料也是做不到的。

如果想分析用戶結果是依靠什麼行

為產生的,以此來品和業務來反向得更好的果,相反的想要根據用來衡量行模式的效果,就需要將前後臺數據打通行關分析。個例子,訂單大於1萬的高淨值以及其化率個指就必前臺資料和後臺資料相合的方式。

怎麼把來自前臺和後臺的用資料關起來?是需要解決的問題

資料收集技

資料收集技主要有兩種:埋點和無埋點。先來科普先兩種技方式,以及明下應該怎麼選擇

埋點

埋點就是了資料分析的需求在原本的復的代碼邏輯之上在加上N取資料的代。比如如果想取某商品的點數量,就得在點事件的中搜集點的商品資料,出包含商品名稱和點

事件的資料({productname,clicktime})。

埋點的優勢

1)埋點最大的優勢就是資料都是手動編碼產生的,靈活性比大,可以更好得支援一些展資料。

2)埋點由於是按照埋點邏輯進行的預處理,所以對之後的分析友好,分析效果也比較好

埋點的劣

1)埋點最重要的前提條件是必十分清楚目,即需要收集什麼的資料必提前確定。所以埋點最容易出問題就是漏埋,一般來布前一定要經過謹慎的校測試,因一旦版本布出去而資料採集出了問題

2)在品的迭代程中,如果代再迭代的候忽略了埋點邏輯的更改,從而致後的分析邏輯不準,甚至bug。更甚於品迭代比快的景,埋點就是一個定

無埋點

埋點技和無埋點技都需要在原有的業務行改。無埋點就是通過編言自身的特點來完成資料收集的自程。比如前臺無埋點其就是通過監JS事件,把面上生的所有事件都採集下來。後臺無埋點實現,但是起來很簡單,其就是將網資料行旁路反解析,前後端互動的資料肯定都會經過,所以網應該包含了大多數業務資料。

無埋點的優勢

1) 於埋點方式來的收益就是正好就是埋點容易生的問題,由於採集的是全量資料,所以品迭代程中是不需要關注埋點邏輯的,也不會出漏埋、埋等象。

2)無埋點方式因收集的是全量資料,可以大大減少運品的試錯成本,試錯的可能性高了,可以來更多啟性的資訊。

3)最後一點,也是最清楚的一點,就是減少了因動帶來的溝通成本。

無埋點的缺陷,也是無埋點存在的一些疑點:

1)適用大部,通用的景,有少部分需要埋點的景覆蓋不了。

2)無埋點採集全量資料,資料傳輸和服器增加

根據前面關於埋點和無埋點的科普,我都明白其兩個方式都有其自身的優勢和缺陷,知乎和其他技術部落格上關於兩個討論點的文章也有很多,有人在批埋點,有人在批無埋點。關於技,我們還是理性看待吧,它兩個不是你死我活的關係,通們調研的得到的情況是,目前沒有方案能完美解決無埋點問題,但是我致力於研究最大限度通通用方式解決埋點問題,儘量減少埋點代,埋點代越少,出的可能性就越低。我們選擇使用前臺無埋點和後臺無埋點技合的方式來取用資料。

如何利用無埋點打通前後臺數據

當前的分析手段,都需要行大量埋點以及關才能做到前臺和後臺資料打通,有沒有可能通無埋點將前後臺數據自打通?

前臺無埋點弊端

前端無埋點針對資料分析比較簡單需求是很合適的,如果是僅僅分析面跳化率、或者控制元件點等行,前端無埋點完全能夠勝任。但是如果要做粒度的分析,僅僅靠前端無埋點可能存在困,最關鍵的原因就是前臺採集技術再先進也還是有些資料難以採集到,比如客戶的下單金額等資料,這些資料很多都是以html形式到前臺,在不同的技術實現中,前臺所展示的金資料可能僅僅是展示資料,並不會再至後臺。所以致如果想要做一些按照客價分群的行,就很難僅僅依靠前端無埋點技實現

後臺無埋點的引入

在典型的前後臺互動的程式中,資料最通用的來源,我們發現wired dataWired data應該包含了90%以上的粒度的業務資料,只是些資料是以不同格式存在於wired data中,裡面的度就是設計一種資料理方案,能通用的將存在於wired data的資料利用起來,是後臺無埋點的實現

前後臺數據自打通

前後臺無埋點的關聯點就在於cookie,在使用者請求中埋入特殊的sessioniduid。後臺的資料採集wired data中如使用者資訊,通過sessioniduid之後,就可以知道某次下單業務是哪個用操作的,在面上有何種行。我採用種方式實現了前後資料的自