1. 程式人生 > >數據倉庫之數據倉庫環境——讀書筆記

數據倉庫之數據倉庫環境——讀書筆記

管理人 不同的 mage 倉庫 http alt 物理 數據集 .com

數據倉庫是一個面向主題的集成的非易失的隨時間變化的用來支持管理人員決策的數據集合。

數據倉庫環境中數據存在不同的細節層

  1. 早期細節層
  2. 當前細節層
  3. 輕度綜合數據層
  4. 高度綜合數據層

數據倉庫只能一步一步的進行設計並載入數據,也就是說它是進化的,而非革命性的。

粒度是數據倉庫中數據單元的細節程度或者綜合程度的級別。

細節程度越高,粒度級就越低;細節程度越低,粒度級就越高。

技術分享圖片

當一個企業或者組織的數據倉庫擁有大量數據時,在細節部分采用雙重或者多重粒度級別是很有意義的。

活樣本數據庫

是從數據倉庫取得真實檔案數據或輕度綜合數據的一個子集,其中樣本是指它是一個大的數據庫的一個子集是指這個數據庫需要進行周期刷新

活樣本數據用來作統計分析和觀察發展趨勢,當數據必須以整體觀察時,活樣本數據庫能提供非常理想的結果,但絕不適用於處理單個數據記錄。

分區設計方法

數據分區是指將數據分散到可以獨立處理的分離物理單元中去。

數據倉庫環境中的問題是如何對當前細節數據進行分區

數據倉庫的數據組織

1. 簡單堆積數據

2. 輪轉綜合數據

3. 簡單直接文件

4. 連續文件

數據倉庫中數據的生命周期包含了數據的清理。

數據倉庫之數據倉庫環境——讀書筆記