1. 程式人生 > >數據庫 chapter 6 關系數據理論

數據庫 chapter 6 關系數據理論

我們 條件 問題分析 lan 傳遞函數依賴 進行 字符 數據庫管理 無重復

第六章 關系數據理論

本章詳細講解關系規範化理論,它既是關系數據庫的重要理論基礎也是數據庫設計的有力工具,規範化理論為數據庫設計提供了理論的指南和工具。

規範化理論雖然是以關系模型為背景,但是它對於一般數據庫邏輯設計同樣具有理論上的意義。

一個關系模式應當是一個五元組:

R(U,D,DOM,F)

1) 關系名R,它是符號化的元組語義;

2) 一組屬性U;

3) 屬性組U中屬性所來自的域D;

4) 屬性到域的映射DOM;

5) 屬性組U上的一組數據依賴F;

3、4對模式設計關系不大,因此可以在本章中簡化為一個三元組R<U,F>; 當且僅當U上的一個關系,滿足F時,稱為關系模式R<U,F>的一個關系。

關系作為一張二維表,一個起碼的要求是:每一個分量必須是不可分的數據項,滿足這個條件的關系模式就屬於第一範式(INF)。

數據依賴是一個關系內部屬性與屬性之間的一種約束關系,這種約束關系是通過屬性間值的相等與否體現出來的數據間相關聯系。其中最重要的是函數依賴和多值依賴。

技術分享

技術分享

技術分享

技術分享

技術分享

完全依賴(full)是指Y需要X中的全部信息來確定自身值,部分依賴(partly)是指Y只需要X中的一部分信息來確定自身值。

技術分享

關系數據庫鐘大哥關系需要滿足一定要求,滿足不同程度的要求的為不同範式。

滿足最低要求的叫做第一範式,簡稱INF,在第一範式中滿足進一步要求的為第二範式,其余依此類推。

技術分享

技術分享

技術分享

技術分享

技術分享

多值依賴(MVD)

技術分享

技術分享

如果一個關系模式是4NF,則必為BCNF。

技術分享

技術分享

技術分享

簡單來說就是:第一範式無重復的列;第二範式屬性完全依賴於主鍵;第三範式屬性不依賴於其他非主屬性鍵。

關系數據庫設計範式介紹

.1 第一範式(1NF)無重復的列
所謂第一範式(1NF)是指數據庫表的每一列都是不可分割的基本數據項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重復的屬性。如果出現重復的屬性,就可能需要定義一個新的實體,新的實體由重復的屬性構成,新實體與原實體之間為一對多關系。在第一範式(1NF)中表的每一行只包含一個實例的信息。簡而言之,第一範式就是無重復的列。

說明:在任何一個關系數據庫中,第一範式(1NF)是對關系模式的基本要求,不滿足第一範式(1NF)的數據庫就不是關系數據庫。

1.2 第二範式(2NF)屬性完全依賴於主鍵[消除部分子函數依賴]
第二範式(2NF)是在第一範式(1NF)的基礎上建立起來的,即滿足第二範式(2NF)必須先滿足第一範式(1NF)。第二範式(2NF)要求數據庫表中的每個實例或行必須可以被惟一地區分。為實現區分通常需要為表加上一個列,以存儲各個實例的惟一標識。例如員工信息表中加上了員工編號(emp_id)列,因為每個員工的員工編號是惟一的,因此每個員工可以被惟一區分。這個惟一屬性列被稱為主關鍵字或主鍵、主碼。
第二範式(2NF)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麽這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與原實體之間是一對多的關系。為實現區分通常需要為表加上一個列,以存儲各個實例的惟一標識。簡而言之,第二範式就是屬性完全依賴於主鍵。

1.3 第三範式(3NF)屬性不依賴於其它非主屬性[消除傳遞依賴]
滿足第三範式(3NF)必須先滿足第二範式(2NF)。簡而言之,第三範式(3NF)要求一個數據庫表中不包含已在其它表中已包含的非主關鍵字信息。例如,存在一個部門信息表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等信息。那麽在的員工信息表中列出部門編號後就不能再將部門名稱、部門簡介等與部門有關的信息再加入員工信息表中。如果不存在部門信息表,則根據第三範式(3NF)也應該構建它,否則就會有大量的數據冗余。簡而言之,第三範式就是屬性不依賴於其它非主屬性。

II、範式應用實例剖析
下面以一個學校的學生系統為例分析說明,這幾個範式的應用。首先第一範式(1NF):數據庫表中的字段都是單一屬性的,不可再分。這個單一屬性由基本類型構成,包括整型、實數、字符型、邏輯型、日期型等。在當前的任何關系數據庫管理系統(DBMS)中,傻瓜也不可能做出不符合第一範式的數據庫,因為這些DBMS不允許你把數據庫表的一列再分成二列或多列。因此,你想在現有的DBMS中設計出不符合第一範式的數據庫都是不可能的。
首先我們確定一下要設計的內容包括那些。學號、學生姓名、年齡、性別、課程、課程學分、系別、學科成績,系辦地址、系辦電話等信息。為了簡單我們暫時只考慮這些字段信息。我們對於這些信息,說關心的問題有如下幾個方面。

學生有那些基本信息
學生選了那些課,成績是什麽
每個課的學分是多少
學生屬於那個系,系的基本信息是什麽。

2.1 第二範式(2NF)實例分析
首先我們考慮,把所有這些信息放到一個表中(學號,學生姓名、年齡、性別、課程、課程學分、系別、學科成績,系辦地址、系辦電話)下面存在如下的依賴關系。
(學號)→ (姓名, 年齡,性別,系別,系辦地址、系辦電話)
(課程名稱) → (學分)
(學號,課程)→ (學科成績)
2.1.1 問題分析
因此不滿足第二範式的要求,會產生如下問題

數據冗余: 同一門課程由n個學生選修,"學分"就重復n-1次;同一個學生選修了m門課程,姓名和年齡就重復了m-1次。

更新異常:
1)若調整了某門課程的學分,數據表中所有行的"學分"值都要更新,否則會出現同一門課程學分不同的情況。
2)假設要開設一門新的課程,暫時還沒有人選修。這樣,由於還沒有"學號"關鍵字,課程名稱和學分也無法記錄入數據庫。

刪除異常 : 假設一批學生已經完成課程的選修,這些選修記錄就應該從數據庫表中刪除。但是,與此同時,課程名稱和學分信息也被刪除了。很顯然,這也會導致插入異常。
2.1.2 解決方案
把選課關系表SelectCourse改為如下三個表:
學生:Student(學號,姓名, 年齡,性別,系別,系辦地址、系辦電話);
課程:Course(課程名稱, 學分);
選課關系:SelectCourse(學號, 課程名稱, 成績)。

2.2 第三範式(3NF)實例分析
接著看上面的學生表Student(學號,姓名, 年齡,性別,系別,系辦地址、系辦電話),關鍵字為單一關鍵字"學號",因為存在如下決定關系:

(學號)→ (姓名, 年齡,性別,系別,系辦地址、系辦電話)
但是還存在下面的決定關系
(學號) → (所在學院)→(學院地點, 學院電話)
即存在非關鍵字段"學院地點"、"學院電話"對關鍵字段"學號"的傳遞函數依賴。
它也會存在數據冗余、更新異常、插入異常和刪除異常的情況。 (數據的更新,刪除異常這裏就不分析了,可以參照2.1.1進行分析)

根據第三範式把學生關系表分為如下兩個表就可以滿足第三範式了:

學生:(學號, 姓名, 年齡, 性別,系別);
系別:(系別, 系辦地址、系辦電話)。

數據庫 chapter 6 關系數據理論