1. 程式人生 > >O2O中客戶主資料、資料倉庫和大資料

O2O中客戶主資料、資料倉庫和大資料

O2O專案中強調電子化和數字化,因此資料是個很關鍵的基礎工作。而圍繞資料,那麼經常提到的客戶主資料和資料倉庫、大資料是什麼關係呢?今天我們簡單來聊聊,幫助大家理順一下思路。

O2O強調的是客戶體驗,所有的流程和場景都離不開人,都是以人為本。所以,O2O專案中,對人的資料非常關注,尤其是使用者的主資料模型的設計,以及對應主資料模型的資料採集、使用者ID的統一等等,而基於主資料模型進行ID統一和主資料採集的,可以稱之為“統一客戶資料管理”,我們一般簡稱為UCMUniversal Customer Master)。

在對人進行統一後,基本上是形成大會員系統,通過會員ID進行統一和唯一識別,這樣形成了對客戶的主資料(基礎資料)的統一。但是企業一定是需要對整體業務資料的分析,這就意味著要建立

DWDataWarehouse)資料倉庫,在DW裡面進行資料的抽取清洗完善,並進行建模和分析,形成不同主題的資料集市,再通過BI工具進行統計分析展現和資料視覺化。

但由於當前企業的資料量越來越大,而且非結構化資料越來越多,對非結構化資料的處理需求也越來越緊迫;同時海量的結構化資料當資料量增長到10TB以上,可能就會遇到效能瓶頸,這時候就需要構建大資料平臺如Hadoop或者類似Spark等平臺進行重構。

實際上,大資料平臺不是萬能的,它的優勢在於海量資料的儲存和運算,但不善於對結構化資料的業務和事務處理。所以,類似Hadoop大資料平臺適合做大資料量的儲存、ETL和運算,但不適合做企業的業務系統和

事務處理

如果企業既要做業務系統,又需要海量資料和高併發,那麼這種情況不要採取大資料平臺,而是可以採用記憶體資料庫+記憶體計算的技術,可以實現大資料量的業務系統。比如12306的系統平臺,以前經常宕機卡頓,但現在明顯感覺快多了不宕機了吧?就是因為用了記憶體資料庫和記憶體快取計算技術。而記憶體資料庫技術,類似SAPHANAOracle的記憶體資料庫,都是可以考慮的。

同樣,大資料在查詢統計上也不如關係型資料庫。大資料平臺因為結構不同,所以對一條資料的查詢和對數萬條資料的查詢可能都是一個效率,而關係型資料庫當對處理後的小資料量的查詢特別快。因此,統計分析時會選擇一個方式:大資料平臺將資料清洗整理運算之後,載入到一個關係型資料庫,再通過

SQL或者BI工具進行統計分析展現,這樣效率最高。

是不是太專業了?說到底,一個合理的大資料平臺的架構可能是:

針對關係型資料庫,建立企業統一的ETL機制和介面規範,按照統一規則或者基於企業資料匯流排對接全部業務系統,抽取清洗資料來源後到資料來源歷史庫,再分別根據UCM的需要載入或者平抽到UCM的臨時庫、根據DW的需要抽取到資料倉庫的ODS

針對非結構化資料,通過大資料平臺進行海量資料收集、歸檔和索引。並提供專用的大資料查詢工具滿足常規資料查詢和動態的資料分析。尤其要確保既能滿足實時的資料細節獲取也能滿足批量的與關係型DW資料同步

UCM在大資料平臺上清洗整理合並後形成UCM基表庫,根據需要載入到關係型資料介面準備主資料分發服務,服務的物件包括業務系統、企業資料倉庫和資料集市、以及大資料平臺。分發的渠道則仍是統一的ETL平臺。

資料倉庫根據抽取過來的ODS資料進行清洗整理格式化和遷移轉換,在DW進行建模和形成資料集市,比如有關聯分析、有畫像分析、有購物籃分析等等不同主題,最後根據分析的需要將所需資料載入到關係型資料庫,通過BI工具進行統計分析和視覺化展現,或者實現移動端報表展現

相關推薦

O2O中客戶主資料資料倉庫資料

在O2O專案中強調電子化和數字化,因此資料是個很關鍵的基礎工作。而圍繞資料,那麼經常提到的客戶主資料和資料倉庫、大資料是什麼關係呢?今天我們簡單來聊聊,幫助大家理順一下思路。 O2O強調的是客戶體驗,所有的流程和場景都離不開人,都是以人為本。所以,O2O專案中,對人的資料

淺談資料倉庫資料

前言 資料倉庫是今年來適應利用資料支援決策分析的強烈需求而發展起來的資料庫應用技術,誠然,資料倉庫以資料庫為基礎,但是他在需求、客戶、體系結構與執行機制等方面與資料庫存在重大的不同,Kimball說:"我們花了二十年的時間往資料庫中加入資料,現在該是拿出來使用的時候了。"

Peter Cnudde談雅虎如何使用Hadoop深度學習資料平臺

本文要點   瞭解雅虎如何利用Hadoop和大資料平臺技術;   在類似Flickr和Esports這樣的產品中,雅虎如何使用深度學習技術進行場景檢測和物件識別;   機器學習在影象識別、定向廣告、搜尋排名、濫用檢測和個性化中的應用;   Hadoop叢集上用於分類和排名的機器

這可能是AI機器學習資料領域覆蓋最全的一份速查表

https://mp.weixin.qq.com/s?__biz=MjM5ODE1NDYyMA==&mid=2653390110&idx=1&sn=b3e5d6e946b719d08b67d9ebf88283fe&chksm=bd1c3d0d8a6bb41bf05a8ccc9f

世界第二軟體國家如何看待人工智慧機器學習資料

一份關於人工智慧、機器學習和大資料的報告   在當今世界,印度近年來的發展是有目共睹的,雖然在我們國內對於印度的印象屬於比較喜劇的一個國家,並且出於對印度國家的喜愛,網上稱印度為阿三,三哥。但是任何事物都是由兩面性的,雖然印度在一些事情上的發展比較緩慢,並且總是逗人開心,但是印度因為一些機緣巧合在軟體上面的

玩轉資料擁抱智慧 | 清華大學資料能力提升專案宣講會火熱來襲

近年來,“大資料+”的概念越發得到業界認可,資料人才作為資料工作的載體和核心競爭力,也逐漸受到各界關注及重視。既具備行業知識技能,又擁有大資料思想方法和技術能力的交叉型人才成為了企業和社會急需的“寶馬良駒”。今年資料院大資料人才教育工作已邁進第五個年頭,對跨學科交叉型人才培養

[Xcode10 實際操作]七檔案與資料-(5 )複製移動刪除檔案刪除資料

本文將演示如何複製、移動和刪除檔案。 在專案導航區,開啟檢視控制器的程式碼檔案【ViewController.swift】 1 import UIKit 2 3 class ViewController: UIViewController { 4 5 over

資料雲端計算人工智慧的深度剖析與相互關係,值得入行者典藏

雲端計算、大資料和人工智慧,這三個東西現在非常火,並且它們之間好像互相有關係:一般談雲端計算的時候會提到大資料、談人工智慧的時候會提大資料、談人工智慧的時候會提雲端計算……感覺三者之間相輔相成又不可分割。但如果是非技術的人員,就可能比較難理解這三者之間的相互關係,所以有必要解釋一下。

【本人禿頂程式設計師】淺談 Spring Boot微服務架構資料治理三者之間的故事

←←←←←←←←←←←← 我都禿頂了,還不點關注! 微服務架構 微服務的誕生並非偶然,它是在網際網路高速發展,技術日新月異的變化以及傳統架構無法適應快速變化等多重因素的推動下誕生的產物。網際網路時代的產品通常有兩類特點:需求變化快和使用者群體龐大,在這種情況下,如何從系統架構的角度出

一文讀懂 Spring Boot微服務架構資料治理三者之間的故事

微服務架構 微服務的誕生並非偶然,它是在網際網路高速發展,技術日新月異的變化以及傳統架構無法適應快速變化等多重因素的推動下誕生的產物。網際網路時代的產品通常有兩類特點:需求變化快和使用者群體龐大,在這種情況下,如何從系統架構的角度出發,構建靈活、易擴充套件的系統,快速應對需求的變化;同時,隨著使用者的增加,如

嵌入式學習中較好的練手專案課題整理(附程式碼資料學習視訊嵌入式學習規劃)

0、引言 何為嵌入式?         IEEE官方定義:Devices Used to Control,Monitor Assist the Operation of Equipment,Machinery or Plants。 翻譯過來就是:用於“控制、監視或者

雲端計算資料物聯網AI分別有何關係​​​​​​​

物聯網 1、什麼是物聯網? 物聯網在之前被定義為通過射頻識別(RFID)、紅外線感應器、全球定位系統、鐳射掃描器、氣體感應器等資訊感測裝置按約定的協議把任何物品與網際網路連線起來進行資訊交換,以實現智慧化識別、定位、跟蹤、監控和管理的一種網路,簡言之物聯網就是“物物相

特依依|專注J2ee開發SolrSolr4SlorcloudLucene資料的挖掘技術

 D.Maradona²º¹²(307487602)  13:28:56 請教solr的併發能力,最好有資料量化說明 小莮亽丶獨佔伱旳嫵媚(1804667222)  13:30:43 這個是我做的一個簡單併發測試 報告 露露的功課(1982118)  13:32:07 這個報告不錯,但是還不夠清楚 說明你so

基於視覺的 SLAM/Visual Odometry (VO) 開源資料部落格論文列表

以下為機器翻譯,具體參考原文:https://github.com/tzutalin/awesome-visual-slam----基於視覺的SLAM / Visual Odometry開源專案,庫,資料集,工具和研究列表指數開源庫資料集工具專案學習其他圖書館基本視覺和tra

一文透析 Spring Boot微服務架構資料治理三者之間的故事

微服務架構 微服務的誕生並非偶然,它是在網際網路高速發展,技術日新月異的變化以及傳統架構無法適應快速變化等多重因素的推動下誕生

[Revit]Autodesk Revit 二次開發整理(資料準備工作環境搭建)

1 前言 Revit被Autodesk收購之後,整理和開放了一大部分API,供開發者實現自己的功能和程式,總體來說API的功能比較完善,畢竟市面上已經出現了各式各樣的外掛。 本人也是初學者,在Revit分類中分享一些自己記錄的筆記內容。 2 準備工作 工欲善其事,必先利其器。 2.1 語言 首先,定下你自己

一文讀懂Spring Boot微服務架構資料治理之間的故事

微服務架構 微服務的誕生並非偶然,它是在網際網路高速發展,技術日新月異的變化以及傳統架構無法適應快速變化等多重因素的推動下誕生的產

(六)構建Docker私有倉庫Gitlab倉庫持續集成環境

持續集成 gitlab 私有倉庫 docker registry 環境說明IP功能eth0:192.168.124.139eth1:172.16.100.10Docker私有倉庫、Gitlab、持續集成eth0:192.168.124.138eth1:172.16.100.20Docker服務

資料導論(5)——資料的儲存(分散式NoSQL叢集CAPACIDBASE)

  大資料從獲取到分析的各個階段都可能會涉及到資料集的儲存,考慮到大資料有別於傳統資料集,因此大資料儲存技術有別於傳統儲存技術。大資料一般通過分散式系統、NoSQL資料庫等方式(還有云資料庫)進行儲存。同時涉及到以下幾個新理念。 本篇summary主要圍繞以下三方面內容: 大資料儲存方案