1. 程式人生 > >資料倉庫專題(22):匯流排架構和維度建模優勢-雜項

資料倉庫專題(22):匯流排架構和維度建模優勢-雜項

一、匯流排架構

維度建模的資料倉庫中,有一個概念叫Bus Architecture,中文一般翻譯為“匯流排架構”。匯流排架構是Kimball的多維體系結構(MD)中的三個關鍵性概念之一,另兩個是一致性維度(Conformed Dimension)和一致性事實(Conformed Fact)。

在多維體系結構(MD) 的資料倉庫架構中,主導思想是分步建立資料倉庫,由資料集市組合成企業的資料倉庫。但是,在建立第一個資料集市前,架構師首先要做的就是設計出在整個企業 內具有統一解釋的標準化的維度和事實,即一致性維度和一致性事實。而開發團隊必須嚴格的按照這個體系結構來進行資料集市的迭代開發。

一致性維度就好比企業範圍內的一組匯流排,不同資料集市的事實的就好比插在這組總線上的元件。這也是稱之為匯流排架構的原因。

實際設計過程中,我們通常把匯流排架構列表成矩陣的形式,其中列為一致性維度,行為不同的業務處理過程,即事實,在交叉點上打上標記表示該業務處理過程與該維度相關。這個矩陣也稱為匯流排矩陣(Bus Matrix)。

匯流排架構和一致性維度、一致性事實共同組成了Kimball的多維體系結構的基礎,也建立了一套可以逐步建立資料倉庫的方法論。由於匯流排架構是多維體系結構的核心,所以我們有時就把多維體系結構直接稱為匯流排架構。

二、匯流排矩陣      通常,匯流排矩陣的一行會產生幾個相關的事實表,由此可以從不同角度跟蹤業務過程。訂單業務過程可能會有行項級別的訂單事務事實表和訂單級別的訂單快照事實表。這兩種基於訂單的維度模型同屬於訂單業務過程,這種分組稱為業務過程維度模型。

三、維度建模的優勢


      資料倉庫採用使用維度建模的好處:易理解、查詢的高效能、修改的靈活性和可擴充性。

維度建模是一個可不斷擴充新增的過程

(1)在現有的事實表中增加維度。

(2)在事實表中增加事實。

(3)在維度表中增加屬性。

在比較瞭解業務情況下,可先以底層細粒度構建開始,反之,以業務需求的粗粒度開始,至頂向下;

相關推薦

資料倉庫專題22匯流排架構維度建模優勢-雜項

一、匯流排架構 維度建模的資料倉庫中,有一個概念叫Bus Architecture,中文一般翻譯為“匯流排架構”。匯流排架構是Kimball的多維體系結構(MD)中的三個關鍵性概念之一,另兩個是一致性維

資料倉庫專題21Kimball匯流排矩陣說明-官方版

一、前言 Over the years, I have found that a matrix depiction of the data warehouse plan is a pretty good planning tool once you have gathered the business r

資料倉庫專題6-資料倉庫、主題域、主題概念與定義

一、資料倉庫       關於資料倉庫概念的標準定義業內認可度比較高的,是由資料倉庫之父比爾·恩門(Bill Inmon)在1991年出版的“Building the Data Warehouse”(《建立資料倉庫》)一書中所提出:       中文定義:資料倉庫是一個面向

資料倉庫專題9-基本概念定義整理自網際網路

1、星型模型的組成 一個星型模型對應一個分析主題,它由一個事實表和一組維表組成。其中事實表是星型模型的核心,由分析變數和分析維度代理鍵組成,分析變數存放分析事實數 據,分析維度代理鍵用於連線維表。維表是星型模型的外圍,存放分析維度資料,由維的代理鍵、維的層次屬性、維的描述資訊組成。 2、星型維度模型設計的依

資料倉庫專題2-Kimball維度建模四步驟

一、前言   四步過程維度建模由Kimball提出,可以做為業務梳理、資料梳理後進行多維資料模型設計的指導流程,但是不能作為資料倉庫系統建設的指導流程。本文就相關流程及核心問題進行解讀。 二、資料倉庫建設流程 以下流程是根據業務系統、組織結構、團隊結構現狀設定的資料倉庫系統建設流程,適合系統結構複雜,團隊協

TensorFlow系列專題實戰專案Mnist手寫資料集識別

歡迎大家關注我們的網站和系列教程:http://panchuang.net/ ,學習更多的機器學習、深度學習的知識! 目錄: 導讀 MNIST資料集 資料處理 單層隱藏層神經網路的實現 多層隱藏層神經網路的實現 導讀 就像我們在學

資料進階22個免費的資料視覺化分析工具推薦

22個免費的資料視覺化和分析工具推薦   本文總結推薦22個免費的資料視覺化和分析工具。列表如下: 資料清理(Data cleaning)   當你分析和視覺化資料前,常需要“清理”工作。比如一些輸入性列表“New York City” ,同時其他人會

資料倉庫專題20-案例篇電商領域資料主題域模型設計v0.1(改進意見徵集中

一、電商分類(平臺+自營+複合)  (1)平臺型電商:淘寶+天貓+百度Mall等;  (2)自營型電商:         2.1 綜合型:京東(早期)+噹噹(早期);         2.2 垂直型:好像這種型別越來越少了;  (3)複合型電商(平臺+自營):京東+噹噹+

ActiveMQ22Consumer高級特性之消息分組Message Groups

jms message groups activemq 一、簡介Message Groups就是對消息分組,它是Exclusive Consumer功能的增強。邏輯上,Message Groups 可以看成是一種並發的Exclusive Consumer。跟所有的消息都由唯一的consumer處理

Akka22 Stream實時操控動態管道連接-MergeHub,BroadcastHub and PartitionHub

urn abs bound parameter code 結果類型 subscribe mil 又是 在現實中我們會經常遇到這樣的場景:有一個固定的數據源Source,我們希望按照程序運行狀態來接駁任意數量的下遊接收方subscriber、又或者我需要在程序運行時(ru

每天一個linux命令22tar命令

soft 小文件 sof linu gunzip 算法 rect 過程 提取文件 通過SSH訪問服務器,難免會要用到壓縮,解壓縮,打包,解包等,這時候tar命令就是是必不可少的一個功能強大的工具。linux中最流行的tar是麻雀雖小,五臟俱全,功能強大。 tar命令可以為l

並不對勁的字符串專題Trie樹

digi .cn height ini width trie樹 轉化 def 而且 據說這些並不對勁的內容是《信息學奧賽一本通提高篇》的配套練習。 並不會講Trie樹。 1.poj1056-> 模板題。 2.bzoj1212-> 設dp[i]表示T長度為i的前綴

並不對勁的圖論專題SPFA算法的優化

a算法 bubuko 等於 dfs size iomanip 最小 bre else if 1.bzoj1489-> 這是個新套路。 我們希望找到最小的x,那麽可以二分x,然後判斷是否存在圈的邊權的平均值小於等於x。 設圈的邊權依次為w1,w2,w3,…,wk,平均值

微服務架構下的資料一致性保證可靠事件模式

第一篇分享中講到實現可靠事件模式的關鍵在於:可靠事件投遞和避免事件重複消費,其中避免事件重複消費需要微服務滿足冪等性。那麼又該如何實現可靠事件投遞?又該如何保證服務滿足冪等性? 轉載本文需註明出處:EAII企業架構創新研究院,違者必究。如需加入微信群參與微課堂、架構設計與討論直播請

Akka22 Stream實時操控動態管道連線-MergeHub,BroadcastHub and PartitionHub

在現實中我們會經常遇到這樣的場景:有一個固定的資料來源Source,我們希望按照程式執行狀態來接駁任意數量的下游接收方subscriber、又或者我需要在程式執行時(runtime)把多個數據流向某個固定的資料流終端Sink推送。這就涉及到動態連接合並型Merge或擴散型Broadcast的資料流連

Tensorflow系列專題神經網路篇之前饋神經網路綜述

目錄: 神經網路前言 神經網路 感知機模型 多層神經網路 啟用函式 Logistic函式 Tanh函式 ReLu函式 損失函式和輸出單元 損失函

TensorFlow系列專題深度學習簡介

一.深度學習的發展歷程 深度學習的起源階段 深度學習的發展階段 深度學習的爆發階段 二.深度學習的應用 自然語言處理 語音識別與合成 影象領域 三.參考文獻   一.深度學習的發展歷程 作為機器學習

TensorFlow系列專題機器學習基礎

歡迎大家關注我們的網站和系列教程:http://www.tensorflownews.com/,學習更多的機器學習、深度學習的知識! 目錄: 資料預處理 歸一化 標準化 離散化 二值化 啞編碼

TensorFlow系列專題機器學習基礎

歡迎大家關注我們的網站和系列教程:http://www.tensorflownews.com/,學習更多的機器學習、深度學習的知識! 一.人工智慧發展 1956年的8月,美國達特茅斯學院(Dartmouth College)舉行了一次研討會,這次會議由約翰[圖片上傳失敗...(ima

資料結構實現連結串列棧C++版

資料結構實現(六):連結串列棧(C++版) 1. 概念及基本框架 2. 基本操作程式實現 2.1 入棧操作 2.2 出棧操作 2.3 查詢操作 2.4 其他操作 3. 演算法複雜度分析 3.1