1. 程式人生 > >網站點選流資料分析

網站點選流資料分析

網站點選流資料分析:

1. WEB訪問日誌,即指使用者訪問網站時的所有訪問、瀏覽、點選行為資料。比如點選了哪一個連結,在哪個網頁停留時間最多,採用了哪個搜尋項、總體瀏覽時間等。而所有這些資訊都可被儲存在網站日誌中。通過分析這些資料,可以獲知許多對網站運營至關重要的資訊。採集的資料越全面,分析就能越精準;

2. 日誌的生成渠道:
    1)是網站的web伺服器所記錄的web訪問日誌;
    2)是通過在頁面嵌入自定義的js程式碼來獲取使用者的所有訪問行為(比如滑鼠懸停的位置,點選的頁面元件等),然後通過ajax請求到後臺記錄日誌;這種方式所能採集的資訊最全面;
    3)通過在頁面上埋點1畫素的圖片,將相關頁面訪問資訊請求到後臺記錄日誌;

3. 日誌資料內容詳述:
    在實際操作中,有以下幾個方面的資料可以被採集:
    1)訪客的系統屬性特徵。比如所採用的作業系統、瀏覽器、域名和訪問速度等。
    2)訪問特徵。包括停留時間、點選的URL等。
    3)來源特徵。包括網路內容資訊型別、內容分類和來訪URL等。
    4)產品特徵。包括所訪問的產品編號、產品類別、產品顏色、產品價格、產品利潤、產品數量和特價等級等。

4. 點選流:點選流這個概念更注重使用者瀏覽網站的整個流程,網站日誌中記錄的使用者點選就像是圖上的“點”,而點選流更像是將這些“點”串起來形成的“線”。也可以把“點”認為是網站的Page,而“線”則是訪問網站的Session。所以點選流資料是由網站日誌中整理得到的,它可以比網站日誌包含更多的資訊,從而使基於點選流資料統計得到的結果更加豐富和高效;

5. 資料倉庫標準上可以分為四層:ODS(臨時儲存層Operational Data Store)、PDW(資料倉庫層Data Warehouse)、DM(資料集市層)、APP(應用層);

6. 星型模型因為資料的冗餘所以很多統計查詢不需要做外部的連線,因此一般情況下效率比雪花型模型要高。星型結構不用考慮很多正規化的因素,設計與實現都比較簡單。雪花型模型由於去除了冗餘,有些統計就需要通過表的聯接才能產生,所以效率不一定有星型模型高。正規化也是一種比較複雜的過程,相應的資料庫結構設計、資料的 ETL、以及後期的維護都要複雜一些。因此在冗餘可以接受的前提下,實際運用中星型模型使用更多,也更有效率;