1. 程式人生 > >ODS設計

ODS設計

名稱 調研 哪些 不同 nbsp 取出 以及 叠代 得到

1.數據調研

2.確定數據範圍

需要把上端應用需求與ODS數據範圍進行驗證,以確保應用所需的數據都已經從業務系統中抽取出來,並且得到了很好的組織,以ER模型表示數據主題關系

3.根據數據範圍進行進一步的數據分析和主題定義

把第一步生成的每個ER圖中的實體進行分解,分解的結果仍以ER表示為佳

4.定義主題元素

定義主題、粒度、維、度量、存儲期限

a.定義維的概念特性:
維名稱,名稱應該能夠清晰表示出這個維的業務含義。
維成員,也就是這個維所代表的具體的數據,
維層次,維成員之間的隸屬與包含的層次關系,每個層次需要定義名稱

b.定義度量的概念特性:
度量名稱,名稱應該能夠清晰標書這個度量的業務含義

c.定義主題的概念特性:
主題名稱和含義,說明該主題主要包含哪些數據,用於什麽分析;

d.主題所包含的維和度量;
主題的事實表,以及事實表的數據。

e.定義粒度:
主題中事實表的數據粒度說明,這種粒度可以通過對維的層次限制加以說明,也可以通過對事實表數據的業務細節程度進行說明。

f. 定義存儲期限:
主題中事實表中的數據存儲周期。

5.叠代,歸並維、度量的定義

具體的業務代碼所形成的各個維、以及維成員等需要進一步進行歸並,把概念統一的維定義成一個維,不允許同一個維存在不同的實體表示

6.物理實現

定義每個主題的數據抽取周期、抽取時間、抽取方式、數據接口,抽取流程和規則

7.對ODS中的各個主題的事實數據進行時間上的匯總

按照時間維進行匯總,以實現初步的信息沈澱

8.按照業務邏輯的規則,對數據進行歸並

9.把包含細節過多的交易記錄進行拆分

10.匯總、再匯總

ODS設計