1. 程式人生 > >ODS設計指南

ODS設計指南

根據 流程 綜合 數據概念 細節 事實表 還需 包含 抽象

ODS設計指南
在ODS的概念定義中,已經描述了ODS的功能和特點,實際上ODS設計的目標就是以這些特點作為依據的。ODS設計與DW設計在著眼點上有所不同,ODS重點考慮業務系統數據是什麽樣子的,關系如何,在業務流程處理的哪個環節,以及數據抽取接口等問題。
第零步:數據調研
有關數據調研的內容和要求,在《調研規範》文檔中做了詳細定義,此處不再重復。
第一步:確定數據範圍
確定數據範圍實際上是對ODS進行主題劃分的過程,這種劃分是基於對業務系統的調研的基礎上而進行的,並不十分關心整個數據倉庫系統上端應用需求,但是需要把上端應用需求與ODS數據範圍進行驗證,以確保應用所需的數據都已經從業務系統中抽取出來,並且得到了很好的組織。一般來講,主題的劃分是以業務系統的信息模型為依據的,設計者需要綜合各種業務系統的信息模型,並進行宏觀的歸並,得到企業範圍內的高層數據視圖,並加以抽象,劃定幾個邏輯的數據主題範圍。在這個階段,以ER模型表示數據主題關系更為恰當。
第二步:根據數據範圍進行進一步的數據分析和主題定義
在第一步中定義出來了企業範圍內的高層數據視圖,以及所收集到的各種業務系統的資料,在這一步中,需要對大的數據主題進行分解,並進行主題定義,直到每個主題能夠直接對應一個主題數據模型為止。在這個階段,將把第一步生成的每個ER圖中的實體進行分解,分解的結果仍以ER表示為佳。
第三步:定義主題元素
定義維、度量、主題、粒度、存儲期限
定義維的概念特性:
維名稱,名稱應該能夠清晰表示出這個維的業務含義。
維成員,也就是這個維所代表的具體的數據,
維層次,維成員之間的隸屬與包含的層次關系,每個層次需要定義名稱
定義度量的概念特性:
度量名稱,名稱應該能夠清晰標書這個度量的業務含義
定義主題的概念特性:
主題名稱和含義,說明該主題主要包含哪些數據,用於什麽分析;
   主題所包含的維和度量;
主題的事實表,以及事實表的數據。
定義粒度:
主題中事實表的數據粒度說明,這種粒度可以通過對維的層次限制加以說明,也可以通過對事實表數據的業務細節程度進行說明。
定義存儲期限:
主題中事實表中的數據存儲周期。
第四步:叠代,歸並維、度量的定義
在ODS中,因數據來自於多個系統,數據主題劃分時雖然對數據概念進行了一定程度上的歸並,但具體的業務代碼所形成的各個維、以及維成員等還需要進一步進行歸並,把概念統一的維定義成一個維,不允許同一個維存在不同的實體表示(象不同的業務系統中一樣)。
第五步:物理實現
定義每個主題的數據抽取周期、抽取時間、抽取方式、數據接口,抽取流程和規則。
物理設計不僅僅是ODS部分的數據庫物理實現,設計數據庫參數、操作系統參數、數據存儲設計之外,有關數據抽取接口等問題必須清晰定義。

ODS設計指南