1. 程式人生 > >資料庫 三大正規化 通俗解釋

資料庫 三大正規化 通俗解釋

一、三大正規化通俗解釋:

(1)簡單歸納:

  第一正規化(1NF):欄位不可分;
  第二正規化(2NF):有主鍵,非主鍵欄位依賴主鍵;
  第三正規化(3NF):非主鍵欄位不能相互依賴。

(2)解釋:

  1NF:原子性。 欄位不可再分,否則就不是關係資料庫;;
  2NF:唯一性 。一個表只說明一個事物;
  3NF:每列都與主鍵有直接關係,不存在傳遞依賴。

二、例子說明

  (1)不符合第一欄位的例子

                                                                             表:欄位1, 欄位2(欄位2.1,欄位2.2), 欄位3

欄位2可以拆分成欄位2.1和欄位2.2,不符合第一正規化。

  (2)不符合第二正規化的例子 

                                                                            表:學號, 姓名, 年齡, 課程名稱, 成績, 學分 

這個表明顯說明了兩個事務:學生資訊, 課程資訊。

  1)存在以下問題:

                               a、資料冗餘:每條記錄都含有相同資訊; 
                               b、刪除異常:刪除所有學生成績,就把課程資訊全刪除了; 
                               c、插入異常:學生未選課,無法記錄進資料庫; 
                               d、更新異常:調整課程學分,所有行都調整。
  2)修正:
                               學生表:學號, 姓名, 年齡 

                               課程表:課程名稱,學分     

                               選課關係表:學號, 課程名稱, 成績


  (3)不符合第二正規化的例子 


                                                                         表:學號, 姓名, 年齡, 所在學院, 學院聯絡電話

其中關鍵字為單一關鍵字"學號"。存在依賴傳遞::(學號) → (所在學院) → (學院聯絡電話) 。

  1)存在問題::
      a、資料冗餘:有重複值; 
      b、更新異常:有重複的冗餘資訊,修改時需要同時修改多條記錄,否則會出現資料不一致的情況 
      c、刪除異常 
  2)修正: 
                      學生表:學號, 姓名, 年齡, 所在學院;
                      學院表:學院, 電話 

 

一正規化就是屬性不可分割。屬性是什麼?就是表中的欄位。 
不可分割的意思就按字面理解就是最小單位,不能再分成更小單位了。 
這個欄位只能是一個值,不能被拆分成多個欄位,否則的話,它就是可分割的,就不符合一正規化。 
不過能不能分割並沒有絕對的答案,看需求,也就是看你的設計目標而定。 
舉例: 
學生資訊組成學生資訊表,有姓名、年齡、性別、學號等資訊組成。 
姓名不可拆分吧?所以可以作為該表的一個欄位。 
但我要說這個表要在國外使用呢?人家姓和名要分開,都有特別的意義,所以姓名欄位是可拆分的,分為姓欄位和名欄位。 
簡單來說,一正規化是關係資料庫的基礎,但欄位是否真的不可拆分,根據你的設計目標而定。 

二正規化就是要有主鍵,要求其他欄位都依賴於主鍵。 
為什麼要有主鍵?沒有主鍵就沒有唯一性,沒有唯一性在集合中就定位不到這行記錄,所以要主鍵。 
其他欄位為什麼要依賴於主鍵?因為不依賴於主鍵,就找不到他們。更重要的是,其他欄位組成的這行記錄和主鍵表示的是同一個東西,而主鍵是唯一的,它們只需要依賴於主鍵,也就成了唯一的。 
如果有同學不理解依賴這個詞,可以勉強用“相關”這個詞代替,也就是說其他欄位必須和它們的主鍵相關。因為不相關的東西不應該放在一行記錄裡。 
舉例: 
學生資訊組成學生表,姓名可以做主鍵麼? 
不能!因為同名的話,就不唯一了,所以需要學號這樣的唯一編碼才行。 
那麼其他欄位依賴於主鍵是什麼意思? 
就是“張三”同學的年齡和性別等欄位,不能儲存別人的年齡性別,必須是他自己的,因為張三的學號資訊就決定了,這行記錄歸張三所有,不能給無關人員使用。 

三正規化就是要消除傳遞依賴,方便理解,可以看做是“消除冗餘”。 
消除冗餘應該比較好理解一些,就是各種資訊只在一個地方儲存,不出現在多張表中。 
比如說大學分了很多系(中文系、英語系、計算機系……),這個系別管理表資訊有以下欄位組成: 
系編號,系主任,系簡介,系架構。 
那麼再回到學生資訊表,張三同學的年齡、性別、學號都有了,我能不能把他的系編號,系主任、系簡介也一起存著? 
如果你問三正規化,當然不行,因為三正規化不同意。 
因為系編號,系主任、系簡介已經存在系別管理表中,你再存入學生資訊表,就是冗餘了。 
三正規化中說的傳遞依賴,就出現了。 
這個時候學生資訊表中,系主任資訊是不是依賴於系編號了?而這個表的主鍵可是學號啊! 
所以按照三正規化,處理這個問題的時候,學生表就只能增加一個系編號欄位。 
這樣既能根據系編號找到系別資訊,又避免了冗餘儲存的問題。