1. 程式人生 > >大數據入門第十三天——離線綜合案例:網站點擊流數據分析

大數據入門第十三天——離線綜合案例:網站點擊流數據分析

采集 點擊流 http mda ont strong inf gif amp

推薦書籍:《網站分析實戰——如何以數據驅動決策,提升網站價值》

相關隨筆:http://blog.csdn.net/u014033218/article/details/76847263

一、網站點擊流數據分析項目業務背景

  1.什麽是點擊流數據

    1.web訪問日誌

即指用戶訪問網站時的所有訪問、瀏覽、點擊行為數據。比如點擊了哪一個鏈接,在哪個網頁停留時間最多,采用了哪個搜索項、總體瀏覽時間等。
而所有這些信息都可被保存在網站日誌中。通過分析這些數據,可以獲知許多對網站運營至關重要的信息。采集的數據越全面,分析就能越精準。 ?日誌的生成渠道:
1)是網站的web服務器所記錄的web訪問日誌;
2)是通過在頁面嵌入自定義的js代碼來獲取用戶的所有訪問行為(比如鼠標懸停的位置,點擊的頁面組件等),
  然後通過ajax請求到後臺記錄日誌;這種方式所能采集的信息最全面;
3)通過在頁面上埋點1像素的圖片,將相關頁面訪問信息請求到後臺記錄日誌; ?日誌數據內容詳述: 在實際操作中,有以下幾個方面的數據可以被采集: 1)訪客的系統屬性特征。比如所采用的操作系統、瀏覽器、域名和訪問速度等。 2)訪問特征。包括停留時間、點擊的URL等。 3)來源特征。包括網絡內容信息類型、內容分類和來訪URL等。 產品特征。包括所訪問的產品編號、產品類別、產品顏色、產品價格、產品利潤、

  日誌示例:

GET /log.gif?t=item.010001&m=UA-J2011-1&pin=-&uid=1679790178&sid=1679790178|12&v=je=1$sc=24-bit$sr=1600x900$ul=zh-cn$cs=GBK$dt=【雲南白藥套裝】雲南白藥 牙膏 180g×3 (留蘭香型)【行情 報價 價格 評測】-京東$hn=item.jd.com$fl=16.0 r0$os=win$br=chrome$bv=39.0.2171.95$wb=1437269412$xb=1449548587$yb=1456186252$zb=12$cb=4$usc=direct$ucp=-$umd=none$uct=-$ct=1456186505411
$lt=0$tad=-$sku=1326523$cid1=1316$cid2=1384$cid3=1405$brand=20583$pinid=-&ref=&rm=1456186505411 HTTP/1.1

    2.點擊流數據模型

  點擊流概念

  點擊流這個概念更註重用戶瀏覽網站的整個流程,網站日誌中記錄的用戶點擊就像是圖上的“點”,而點擊流更像是將這些“點”串起來形成的“線”。也可以把“點”認為是網站的Page,而“線”則是訪問網站的Session。所以點擊流數據是由網站日誌中整理得到的,它可以比網站日誌包含更多的信息,從而使基於點擊流數據統計得到的結果更加豐富和高效

  點擊流模型生成

  點擊流數據在具體操作上是由散點狀的點擊日誌數據梳理所得,從而,點擊數據在數據建模時應該存在兩張模型表(Pageviews和visits):

  技術分享圖片

  技術分享圖片

  2.點擊流數據分析意義

    參見文首鏈接

  3.流量分析常見指標 

    1)基礎分析PV,IP,UV

    2)來源分析

    3)受訪分析

    4)訪客分析

    5)轉化路徑分析

  //完整指標參考文首鏈接

大數據入門第十三天——離線綜合案例:網站點擊流數據分析