1. 程式人生 > >什麽是數據倉庫總線架構

什麽是數據倉庫總線架構

體系 好處 維度建模 修改 處理過程 相關 表示 多維 交叉點

一、總線架構

維度建模的數據倉庫中,有一個概念叫Bus Architecture,中文一般翻譯為“總線架構”。總線架構是Kimball的多維體系結構(MD)中的三個關鍵性概念之一,另兩個是一致性維度(Conformed Dimension)和一致性事實(Conformed Fact)。

在多維體系結構(MD) 的數據倉庫架構中,主導思想是分步建立數據倉庫,由數據集市組合成企業的數據倉庫。但是,在建立第一個數據集市前,架構師首先要做的就是設計出在整個企業內具有統一解釋的標準化的維度和事實,即一致性維度和一致性事實。而開發團隊必須嚴格的按照這個體系結構來進行數據集市的叠代開發。

一致性維度就好比企業範圍內的一組總線,不同數據集市的事實的就好比插在這組總線上的元件。這也是稱之為總線架構的原因。

實際設計過程中,我們通常把總線架構列表成矩陣的形式,其中列為一致性維度,行為不同的業務處理過程,即事實,在交叉點上打上標記表示該業務處理過程與該維度相關。這個矩陣也稱為總線矩陣(Bus Matrix)。

總線架構和一致性維度、一致性事實共同組成了Kimball的多維體系結構的基礎,也建立了一套可以逐步建立數據倉庫的方法論。由於總線架構是多維體系結構的核心,所以我們有時就把多維體系結構直接稱為總線架構。

二、總線矩陣

通常,總線矩陣的一行會產生幾個相關的事實表,由此可以從不同角度跟蹤業務過程。訂單業務過程可能會有行項級別的訂單事務事實表和訂單級別的訂單快照事實表。這兩種基於訂單的維度模型同屬於訂單業務過程,這種分組稱為業務過程維度模型。

三、維度建模的優勢

數據倉庫采用使用維度建模的好處:易理解、查詢的高性能、修改的靈活性和可擴充性。

維度建模是一個可不斷擴充添加的過程

(1)在現有的事實表中增加維度。

(2)在事實表中增加事實。

(3)在維度表中增加屬性。

在比較了解業務情況下,可先以底層細粒度構建開始,反之,以業務需求的粗粒度開始,至頂向下;

什麽是數據倉庫總線架構