資料倉庫快速入門教程5-資料建模
資料建模是為要儲存在資料庫中的資料建立資料模型的過程。 該資料模型是概念表示
- 資料物件
- 不同資料物件之間的關聯
- 規則。
資料建模有助於資料的視覺化表示,並對資料實施業務規則,規則遵從性和政府政策。 資料模型可確保命名約定,預設值,語義,安全性的一致性,同時確保資料質量。
資料模型強調需要哪些資料以及如何組織資料,而不是需要對資料執行哪些操作。 資料模型就像架構師的構建計劃,它有助於構建概念模型並設定資料項之間的關係。
兩種型別的資料模型技術是
- 實體關係(ER)模型
- UML(統一建模語言)
為何使用資料模型?
使用資料模型的主要目標是:
- 準確表示資料庫所需的所有資料物件。 丟失資料將導致錯誤併產生不正確的結果。
- 資料模型有助於在概念,物理和邏輯層面設計資料庫。
- 資料模型結構有助於定義關係表,主鍵和外來鍵以及儲存過程。
- 它提供了基本資料的清晰影象,資料庫開發人員可以使用它來建立物理資料庫。
- 對 識別丟失和冗餘資料也很有幫助。
- 雖然最初建立資料模型既費力又耗時,但從長遠來看,它可以使您的IT基礎架構升級和維護更便宜,更快捷。
資料模型的型別
主要有三種不同型別的資料模型:
- 概念: 此資料模型定義系統包含的內容。 此模型通常由業務涉眾和資料架構師建立。 目的是組織,範圍和定義業務概念和規則。
- 邏輯: 定義 如何 都應該實現系統。 此模型通常由Data Architects和業務分析師建立。 目的是制定規則和資料結構。
- 物理 :此資料模型描述了 如何 使用特定的DBMS系統實現系統。 此模型通常由DBA和開發人員建立。 目的是實際實現資料庫。

圖片.png
概念模型
該模型的主要目的是建立實體,它們的屬性以及它們之間的關係。 在此資料建模級別中,幾乎沒有任何實際資料庫結構的詳細資訊。
資料模型的3個基本要素:
-
實體 :現實世界的東西
-
屬性 :實體的特徵或屬性
-
關係 :兩個實體之間的依賴關係
例如:
Customer和Product是兩個實體。 Customer編號和名稱是Customer實體的屬性
Product名稱和價格是Product實體的屬性
Sale是客戶與產品之間的關係

圖片.png
概念資料模型的特徵
- 提供組織範圍內的業務概念。
- 此類資料模型是為業務受眾設計和開發的。
- 概念模型的開發獨立於硬體規範,如資料儲存容量,位置或軟體規範,如DBMS供應商和技術。 重點是表示使用者將在“現實世界”中看到的資料。
被稱為域模型的概念資料模型通過建立基本概念和範圍為所有利益相關者建立了共同的詞彙表。
參考資料
- python測試開發專案實戰-目錄
- python工具書籍下載-持續更新
- python 3.7極速入門教程 - 目錄
- 討論qq群630011153 144081101
- 原文地址
- 本文涉及的python測試開發庫 謝謝點贊!
- [本文相關海量書籍下載]( https://github.com/china-testing/python-api-tesing/blob/master/books.md
- http://spark.apache.org/docs/2.1.0/api/python/pyspark.sql.html
邏輯資料模型
邏輯資料模型將更多資訊新增到概念模型元素中。 它定義了資料元素的結構並設定了它們之間的關係。

圖片.png
邏輯資料模型為物理模型提供基礎。 但建模結構仍然是通用的。
在此資料建模級別,未定義主鍵或輔助鍵,您需要驗證並調整之前的連線關係。
邏輯資料模型的特徵
- 描述單個專案的資料需求,但可以根據專案範圍與其他邏輯資料模型整合。
- 獨立於DBMS設計和開發。
- 資料屬性將具有精確精度和長度的資料型別。
- 通常將模型的標準化過程應用到3NF。
物理資料模型
物理資料模型描述資料模型的資料庫特定實現。 它提供了資料庫的抽象,並有助於生成模式。 這是因為物理資料模型提供的元資料豐富。

圖片.png
這種型別的資料模型還有助於視覺化資料庫結構。 它有助於為資料庫列建模鍵,約束,索引,觸發器和其他RDBMS功能。
物理資料模型的特徵:
- 物理資料模型描述了單個專案或應用程式所需的資料,儘管它可能與基於專案範圍的其他物理資料模型整合在一起。
- 資料模型包含表之間的關係,這些關係解決了基數和關係的可空性。
- 針對特定版本的DBMS,位置,資料儲存或專案中使用的技術而開發。
- 列應具有精確的資料型別,已分配的長度和預設值。
- 定義了主鍵和外來鍵,檢視,索引,訪問配置檔案和授權等。
資料模型的優點和缺點:
資料模型的優點:
- 設計資料模型的主要目標是確保功能團隊提供的資料物件準確表示。
- 資料模型應足夠詳細,以用於構建物理資料庫。
- 資料模型中的資訊可用於定義表,主鍵和外來鍵以及儲存過程之間的關係。
- 資料模型可幫助企業在組織內部和跨組織進行通訊。
- 資料模型有助於在ETL過程中記錄資料對映
- 幫助識別正確的資料來源以填充模型
資料模型的缺點:
- 對於開發者資料模型,應該知道物理資料儲存的特徵。
- 複雜的應用程式開發,管理。
- 結構中細小的變化需要在整個應用中進行修改。
- DBMS中沒有設定資料操作語言。
結論
- 資料建模是為要儲存在資料庫中的資料開發資料模型的過程。
- 資料模型可確保命名約定,預設值,語義,安全性的一致性,同時確保資料質量。
- 資料模型結構有助於定義關係表,主鍵和外來鍵以及儲存過程。
- 概念,邏輯和物理有三種類型。
- 概念模型的主要目的是建立實體,它們的屬性以及它們之間的關係。
- 邏輯資料模型定義資料元素的結構並設定它們之間的關係。
- 物理資料模型描述資料模型的資料庫特定實現。
- 設計資料模型的主要目標是確保功能團隊提供的資料物件準確表示。
- 最大的缺點是,即使是較小的結構變化也需要在整個應用中進行修改。