您好,登錄后才能下訂單哦!
本篇內容介紹了“數據庫建表設計六范式是什么”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
數據庫設計六范式
為了建立冗余較小、結構合理的數據庫,設計數據庫時必須遵循一定的規則。在關系型數據庫中這種規則就稱為范式。范式是符合某一種設計要求的總結。要想設計一個結構合理的關系型數據庫,必須滿足一定的范式。
在實際開發中最為常見的設計范式有三個:
第一范式是最基本的范式。如果數據庫表中的所有字段值都是不可分解的原子值,就說明該數據庫表滿足了第一范式。不滿足第一范式(1NF)的數據庫就不是關系數據庫。
第一范式的合理遵循需要根據系統的實際需求來定。比如某些數據庫系統中需要用到“地址”這個屬性,本來直接將“地址”屬性設計成一個數據庫表的字段就行。但是如果系統經常會訪問“地址”屬性中的“城市”部分,那么就非要將“地址”這個屬性重新拆分為省份、城市、詳細地址等多個部分進行存儲,這樣在對地址中某一部分操作的時候將非常方便。這樣設計才算滿足了數據庫的第一范式,如下表所示。
上表所示的用戶信息遵循了第一范式的要求,這樣在對用戶使用城市進行分類的時候就非常方便,也提高了數據庫的性能。
第二范式在第一范式的基礎之上更進一層。第二范式需要確保數據庫表中的每一列都和主鍵相關,而不能只與主鍵的某一部分相關(主要針對聯合主鍵而言)。也就是說在一個數據庫表中,一個表中只能保存一種數據,不可以把多種數據保存在同一張數據庫表中。第二范式要求數據庫表中的每個實例或行必須可以被惟一地區分。為實現區分通常需要為表加上一個列,以存儲各個實例的惟一標識。這個惟一屬性列被稱為主關鍵字或主鍵、主碼。
比如要設計一個訂單信息表,因為訂單中可能會有多種商品,所以要將訂單編號和商品編號作為數據庫表的聯合主鍵,如下表所示。
訂單信息表
這樣就產生一個問題:這個表中是以訂單編號和商品編號作為聯合主鍵。這樣在該表中商品名稱、單位、商品價格等信息不與該表的主鍵相關,而僅僅是與商品編號相關。所以在這里違反了第二范式的設計原則。
不符合第二范式,會出現的問題:
(1) 數據冗余:同一個客戶下的訂單,所屬單位和聯系方式出現了冗余
(2) 更新異常:如果調整了某個商品的價格,表中所有下單該商品的價格表都需要調整,否則會出現同一商品價格不統一的情況
(3) 插入異常:如果商家新增了一個商品,由于還沒有人買過沒有訂單號,導致表中無法插入這樣的信息信息了
(4) 刪除異常:如果客戶已完成訂單,或者客戶退貨取消訂單,就需要刪除訂單編號,這樣又會導致商品信息被刪除,問題更大了。
如果把這個訂單信息表進行拆分,把商品信息分離到另一個表中,把訂單項目表也分離到另一個表中,就非常完美了。
這樣設計,在很大程度上減小了數據庫的冗余。如果要獲取訂單的商品信息,使用商品編號到商品信息表中查詢即可。
第三范式需要確保數據表中的每一列數據都和主鍵直接相關,而不能間接相關。數據表中如果不存在非關鍵字段對任一候選關鍵字段的傳遞函數依賴則符合第三范式。簡而言之,第三范式就是屬性不依賴于其它非主屬性。所謂傳遞函數依賴,指的是如果存在"A → B → C"的決定關系,則C傳遞函數依賴于A。
因此,滿足第三范式的數據庫表應該不存在如下依賴關系:
關鍵字段 → 非關鍵字段x → 非關鍵字段y
比如在設計一個訂單數據表的時候,可以將客戶編號作為一個外鍵和訂單表建立相應的關系。而不可以在訂單表中添加關于客戶其它信息(比如姓名、所屬公司等)的字段。如下面這兩個表所示的設計就是一個滿足第三范式的數據庫表。
這樣在查詢訂單信息的時候,就可以使用客戶編號來引用客戶信息表中的記錄,也不必在訂單信息表中多次輸入客戶信息的內容,減小了數據冗余。
再找一張圖,供大家參考一下:
所謂BCNF,是指在第三范式的基礎上進一步消除主屬性對于碼的部分函數依賴和傳遞依賴。BCNF需要符合3NF,并且,主屬性不依賴于主屬性。
假設倉庫管理關系表為StorehouseManage(倉庫ID,存儲物品ID,管理員ID,數量),且有一個管理員只在一個倉庫工作;一個倉庫可以存儲多種物品。這個數據庫表中存在如下決定關系:
(倉庫ID,存儲物品ID) →(管理員ID,數量)
(管理員ID,存儲物品ID) → (倉庫ID,數量)
所以,(倉庫ID,存儲物品ID)和(管理員ID,存儲物品ID)都是StorehouseManage的候選關鍵字,表中的唯一非關鍵字段為數量,它是符合第三范式的。但是,由于存在如下決定關系:
(倉庫ID) → (管理員ID)
(管理員ID) → (倉庫ID)
即存在關鍵字段決定關鍵字段的情況,所以其不符合BCNF范式。它會出現如下異常情況:
(1) 刪除異常:
當倉庫被清空后,所有"存儲物品ID"和"數量"信息被刪除的同時,"倉庫ID"和"管理員ID"信息也被刪除了。
(2) 插入異常:
當倉庫沒有存儲任何物品時,無法給倉庫分配管理員。
(3) 更新異常:
如果倉庫換了管理員,則表中所有行的管理員ID都要修改。
把倉庫管理關系表分解為二個關系表:
倉庫管理:StorehouseManage(倉庫ID,管理員ID);
倉庫:Storehouse(倉庫ID,存儲物品ID,數量)。
這樣的數據庫表是符合BCNF范式的,消除了刪除異常、插入異常和更新異常。
又如,有這樣一個配件管理表WPE(WNO,PNO,ENO,QNT),其中WNO表示倉庫號,PNO表示配件號,ENO表示職工號,QNT表示數量。
有以下約束要求:
(1)一個倉庫有多名職工;
(2)一個職工僅在一個倉庫工作;
(3)每個倉庫里一種型號的配件由專人負責,但一個人可以管理幾種配件;
(4)同一種型號的配件可以分放在幾個倉庫中。
分析表中的函數依賴關系,可以得到:
(1)ENO->WNO;
(2)(WNO,PNO)->QNT
(3)(WNO,PNO)->ENO
(4)(ENO,PNO)->QNT
可以看到,候選鍵有:(ENO,PNO);(WNO,PNO)。所以,ENO,PNO,WNO均為主屬性,QNT為非主屬性。顯然,非主屬性是直接依賴于候選鍵的。所以此表滿足第三范式。
而我們觀察一下主屬性:(WNO,PNO)->ENO;ENO->WNO。顯然WNO對于候選鍵(WNO,PNO)存在傳遞依賴,所以不符合BCNF.
解決這個問題的辦法是分拆為兩個表:管理表EP(ENO,PNO,QNT);工作表EW(ENO,WNO)。但這樣做會導致函數依賴(WNO,PNO)->ENO丟失。
雖然,不滿足BCNF,也會導致一些冗余和一致性的問題。但是,將表分解成滿足BCNF的表又可能丟失一些函數依賴。所以,一般情況下不會強制要求關系表要滿足BCNF。
對于第四范式,從理論層面來講是,關系模式R∈1NF,如果對于R對于R的每個非平凡多值依賴X→→Y(Y不屬于X),X都含有候選碼,則R∈4NF。4NF就是限制關系模式的屬性之間不允許有非平凡且非函數依賴的多值依賴。顯然一個關系模式是4NF,則必為BCNF。
也就是說,當一個表中的非主屬性互相獨立時(3NF),這些非主屬性不應該有多值。若有多值就違反了第四范式。
有這樣一個用戶聯系方式表TELEPHONE(CUSTOMERID,PHONE,CELL)。CUSTOMERID為用戶ID,PHONE為用戶的固定電話,CELL為用戶的移動電話。
本來,這是一個非常簡單的第3范式表。主鍵為CUSTOMERID,不存在傳遞依賴。但在某些情況下,這樣的表還是不合理的。比如說,用戶有兩個固定電話,兩個移動電話。這時,表的具體表示如下:
CUSTOMERID PHONE CELL
1000 8828-1234 149088888888
1000 8838-1234 149099999999
由于PHONE和CELL是互相獨立的,而有些用戶又有兩個和多個值。這時此表就違反第四范式。
在這種情況下,此表的設計就會帶來很多維護上的麻煩。例如,如果用戶放棄第一行的固定電話和第二行的移動電話,那么這兩行會合并嗎?等等
解決問題的方法為,設計一個新表NEW_PHONE(CUSTOMERID,NUMBER,TYPE).這樣就可以對每個用戶處理不同類型的多個電話號碼,而不會違反第四范式。
顯然,第四范式的應用范圍比較小,因為只有在某些特殊情況下,要考慮將表規范到第四范式。所以在實際應用中,一般不要求表滿足第四范式。
第五范式(5NF):是最終范式。消除了4NF中的連接依賴。
第五范式有以下要求:
(1)必須滿足第四范式
(2)表必須可以分解為較小的表,除非那些表在邏輯上擁有與原始表相同的主鍵。
第五范式是在第四范式的基礎上做的進一步規范化。第四范式處理的是相互獨立的多值情況,而第五范式則處理相互依賴的多值情況。
有一個銷售信息表SALES(SALEPERSON,VENDOR,PRODUCT)。SALEPERSON代表銷售人員,VENDOR代表供和商,PRODUCT則代表產品。
在某些情況下,這個表中會產生一些冗余。可以將表分解為PERSON_VENDOR表(SALEPERSON,VENDOR);PERSON_PRODUCT表(SALEPERSON,PRODUCT);VENDOR-_PRODICT表(VENDOR,PRODUCT)
“數據庫建表設計六范式是什么”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。