關系型資料庫的範式
A. 資料庫有幾種範式
目前關系資料庫有六種範式,即第一範式(1NF)、第二範式(2NF)、第三範式(3NF)、巴斯−科德範式(BCNF)、第四範式(4NF)和第五範式(5NF,又稱完美範式)。滿足最低要求的範式是第一範式(1NF)。在第一範式的基礎上進一步滿足更多規范要求的稱為第二範式(2NF),其餘範式依次類推。一般來說,資料庫只需滿足第三範式(3NF)。
第一範式(1NF)第一範式(1NF)是指在關系模型中,對域添加的一個規范要求,所有的域都應該是原子性的,即資料庫表的每一列都是不可分割的原子數據項,而不是集合、數組、記錄等非原子數據項。即實體中的某個屬性有多個值時,必須拆分為不同的屬性。在符合第一範式(1NF)表中的每個域值只能是實體的一個屬性或一個屬性的一部分。
簡而言之,第一範式(1NF)是最基本的範式,如果資料庫表中的所有欄位值都是不可分解的原子值,就說明該資料庫表滿足第一範式(1NF)。在任何一個關系資料庫中,第一範式(1NF)是對關系模式設計的基本要求,所有設計的數據模型都必須滿足第一範式(1NF)。
從上面的定義描述中,可以歸納出第一範式(1NF)具有如下幾個顯著特點:((1)資料庫表中的欄位都是單一屬性。
①欄位不可再分。
②同一列中不能有多個值。
(2)單一屬性由基本類型構成。
①整型。
②實數。
③字元型。
④邏輯型。
⑤日期型。
⑥其他類型。
滿足以上兩大特徵的表就是符合第一範式(1NF)的表,不滿足以上任一特徵的表都是不符合第一範式(1NF)的表。
例如,圖欄位可再分的表所示的「電話」欄位可以再拆分成「手機」與「座機」欄位,不滿足「欄位不可再分」的要求,因此不符合第一範式(1NF)要求。
欄位可再分的表
又如,圖欄位可再分的表所示的「姓名」欄位包含「張偉」與「宋鑫」兩個值,不滿足「同一列中不能有多個值」的要求,因此也不符合第一範式(1NF)要求。
同一列中有多個值的表
第二範式(2NF)第二範式(2NF)是在第一範式(1NF)的基礎上建立起來的,即滿足第二範式(2NF)必須先滿足第一範式(1NF)。第二範式(2NF)要求資料庫表中的每個實例或記錄必須可以被唯一地區分。選取一個能區分每個實體的屬性或屬性組,作為實體的唯一標識。例如,員工表中的身份證號碼即可實現每個員工的區分,該身份證號碼即候選鍵,任何一個候選鍵都可以被選作主鍵。在找不到候選鍵時,可額外增加屬性以實現區分。如果在員工關系中沒有對其身份證號碼進行存儲,而姓名可能會在資料庫運行的某個時間重復,無法區分出實體時,設計身份證號碼等不重復的編號以實現區分,被添加的編號選作主鍵。注意:該主鍵的添加是在ER設計時添加,不是在建庫時隨意添加。
第二範式(2NF)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴,是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與原實體之間是一對多的關系。為實現區分,通常需要為表加上一個列,以存儲各個實例的唯一標識。
簡而言之,第二範式(2NF)在第一範式(1NF)的基礎之上更進一層。第二範式(2NF)需要確保資料庫表中的每一列都和主鍵相關,而不能只與主鍵的某一部分相關(主要針對聯合主鍵而言)。也就是說在一個資料庫表中,一個表中只能保存一種數據,不可以把多種數據保存在同一個資料庫表中。
所謂聯合主鍵,是指由兩個或兩個以上的欄位共同組成數據表的主鍵。如圖聯合主鍵表所示,單憑「客戶」欄位無法確定表中唯一的記錄,單憑「開戶銀行」欄位也無法確定表中唯一的與「開戶銀行」一起組成數據表的聯合主鍵。
聯合主鍵表
從上面的定義描述中,可以歸納出第二範式(2NF)具有如下幾個顯著特點:((1)資料庫表滿足第一範式(1NF)。
(2)資料庫中每個表均有主鍵。
①單欄位主鍵。
②聯合主鍵。即不能存在單個主鍵欄位決定非主鍵欄位的情況。
例如,表中有A、B、C、D、E五個欄位,若A與B為聯合主鍵(A,B),如有A決定C的情況(A→C),則不符合第二範式(2NF)。
滿足以上特徵的表就是符合第二範式(2NF)的表,不滿足以上任何一特徵的表都是不符合第二範式(2NF)的表。
例如,如圖所示,所有欄位均不可再拆分,因而滿足第一範式(1NF)的要求,但表中沒有任何一個欄位可以確定表中的唯一記錄,即表中沒有主鍵,因此其不滿足「資料庫中每張表均有主鍵」的要求,所以不符合第二範式(2NF)要求。
又如,如圖所示,滿足第一範式(1NF)的要求,並且在原來的基礎上增加了「ID」欄位作為表的主鍵,因此其符合第二範式(2NF)要求。
沒有主鍵的數據表
增加了主鍵的數據表
重新分析圖1−3所示的聯合主鍵表,此表符合第一範式(1NF)「欄位不可再拆分」的要求,並且有「客戶」與「開戶銀行」兩個欄位作為表的聯合主鍵(客戶,開戶銀行),但其是否就是一個符合第二範式(2NF)的表呢?
進一步分析,就可以發現:「客戶電話」欄位由「客戶」欄位決定,「開戶行地址」欄位由「開戶銀行」欄位決定;即存在如下依賴關系:客戶→客戶電話,開戶銀行→開戶行地址。
(客戶,開戶銀行)為主鍵欄位,(客戶電話,開戶行地址)為非主鍵欄位,因此,其不符合聯合主鍵中「不能存在單個主鍵欄位決定非主鍵欄位」的情況,所以可以認定其並不是符合第二範式(2NF)的數據表。
例1.1判斷如圖所示的學生信息表是否符合第二範式(2NF)。
圖所示中存在聯合主鍵(學號,課程編號),但存在(學號→姓名)、(課程編號→課程名)的依賴關系,即存在某個主鍵欄位決定非主鍵欄位的情況,因此其不符合第二範式(2NF),不是第二範式(2NF)表。可考慮把此表拆成分數表(見圖)、課程表(見圖)和姓名表(見圖),則此三個表是符合第二範式(2NF)的表。
圖學生信息表
圖分數表
圖課程表
圖姓名表
第三範式(3NF)第三範式(3NF)是第二範式(2NF)的一個子集,即滿足第三範式(3NF)必須滿足第二範式(2NF)。第三範式(3NF)要求一個關系中不包含已在其他關系包含的非主關鍵字信息。
第三範式(3NF)就是任何非主屬性不依賴於其他非主屬性,也就是在滿足第二範式(2NF)的基礎上,任何非主屬性不得傳遞依賴於主屬性。第三範式(3NF)需要確保數據表中的每一列數據都和主鍵直接相關,而不能間接相關。數據不能存在傳遞關系,即每個屬性都跟主鍵有直接關系而不是間接關系。如屬性之間含有A→B→C這樣的關系,是不符合第三範式(3NF)的。
當數據表不符合第三範式(3NF)時,會有大量的冗餘數據,還會存在插入異常、刪除異常、數據冗餘度大、修改復雜等問題。
從上面的定義描述中,可以歸納出第三範式(3NF)具有如下幾個顯著特點:((1)資料庫表滿足第二範式。
(2)資料庫表的非主鍵欄位不存在傳遞依賴關系(即非主鍵欄位不能決定其他非主鍵欄位)。例如,表中有A、B、C、D、E五個欄位,若A為主鍵,如有C決定D的情況(C→D)則不符合第三範式(3NF)。
滿足以上特徵的表就是符合第三範式(3NF)的表,不滿足以上任何一特徵的表都是不符合第三範式(3NF)的表。
如圖所示,表中有主鍵(工號),因而滿足第二範式(2NF)的要求;但表中非主鍵欄位間存在傳遞依賴關系:非主鍵欄位「部門」決定非主鍵欄位「部門電話」和「部門主管」(部門→部門電話,部門→部門主管),因此不符合第三範式(3NF)的要求。
圖非主鍵欄位存在傳遞依賴關系的表
例1.2判斷圖所示的學生院屬信息表是否符合第三範式(3NF)。
圖學生院屬信息表
圖中有主鍵(學號),則滿足第二範式(2NF)的要求,但存在(所在學院→學院電話)、(所在學院→學院地點),即存在非主鍵欄位決定其他非主鍵欄位的情況,因此其不符合第三範式(3NF)的要求,不是第三範式(3NF)表。可考慮把此表拆成學生表(見圖)和學院表(見圖),則兩個表是符合第三範式(3NF)的表。
圖學生表
圖學院表
B. 創建關系型資料庫有幾種範式並詳述各個範式之間的遞進關系
第一範式(1NF):每一個屬性都是原子項,不可分割
INF中所述的不可分割,是指在可分割的情況下必須分割,這是在應用環境中來判斷的,當屬性是文檔時,雖然文檔有段落標記,但還是不應該分割。
第二範式:每個非主屬性要完全函數依賴於候選鍵,或者是主鍵。
關鍵詞是「完全依賴」,與「部分依賴」或「局部依賴」相對,如果候選鍵或主鍵由兩個屬性組成,非主屬性不能只依賴與其中一個或部分屬性。
比如:股票日行情表由股票代碼、股票名稱、日期、收盤價四個屬性組成,這就違反了2NF,因為「股票名稱」部分依賴於「股票代碼」。
第三範式:所有非主屬性對任何候選關鍵字都不存在傳遞依賴
關鍵詞是「傳遞依賴」,如果非主屬性通過另一個非主屬性依賴主鍵,則是傳遞依賴。
比如:股票基本信息表由股票代碼、股票名稱、企業名稱、所在地區、所在省份組成,其中「所在省份」依賴於所在地區,存在傳遞依賴。
-----------------------------------
幾個相關術語:
超鍵(super key):在關系中能唯一標識元組的屬性集稱為關系模式的超鍵
候選鍵(candidate key):不含有多餘屬性的超鍵稱為候選鍵
主鍵(primary key):用戶選作元組標識的一個候選鍵稱為主鍵
主屬性(Prime Attribute):候選鍵中的屬性稱為主屬性
非主屬性(Non-Key Attribute):不包含在任何候選鍵中的屬性稱為非主屬性。
C. 資料庫範式是什麼
範式是指符合某一種級別的關系模式的集合,關系資料庫中的關系必須滿足一定的要求,滿足不同程度要求的為不同的範式。簡而言之,範式是為了消除重復數據來減少冗餘數據,從而讓資料庫內的數據更好地組織,讓磁碟空間得到更有效利用的一種標准化准則。
資料庫設計對數據的存儲性能,以及開發人員對數據的操作都有很大的關系,所以建立科學的、規范的資料庫必須滿足相關的規范准則是至關重要的。設計關系資料庫時,應遵從不同的規范要求設計出合理的關系型資料庫,這些不同的規范要求被稱為不同的範式。各種範式呈遞次規范,越高等級的範式資料庫冗餘越小,滿足高等級範式的先決條件是先滿足低等級範式。
應用資料庫範式有許多優點,但是主要優點有:((1)可以減少數據冗餘,這是最重要的優點。
(2)可以消除異常,如插入異常、更新異常、刪除異常等。
(3)可以讓數據組織得更加和諧、合理、高效。
滿足資料庫設計範式規范的資料庫是簡潔的、結構明晰的;同時,不會發生插入(Insert)、刪除(Delete)和更新(Update)操作異常。反之,不僅給資料庫的編程人員帶來麻煩,而且存儲了大量的冗餘信息。
D. 第一範式第二範式第三範式怎麼區分
滿足第一範式 就是每個屬性都不可在拆分,滿足第二範式,非屬性值要完全依賴主編碼 非碼屬性不相互依賴,滿足第三範式,不存在傳遞依賴。
E. 關系資料庫的幾種設計範式
.1 第一範式(1NF)無重復的列
所謂第一範式(1NF)是指資料庫表的每一列都是不可分割的基本數據項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重復的屬性。如果出現重復的屬性,就可能需要定義一個新的實體,新的實體由重復的屬性構成,新實體與原實體之間為一對多關系。在第一範式(1NF)中表的每一行只包含一個實例的信息。簡而言之,第一範式就是無重復的列。
說明:在任何一個關系資料庫中,第一範式(1NF)是對關系模式的基本要求,不滿足第一範式(1NF)的資料庫就不是關系資料庫。
1.2 第二範式(2NF)屬性完全依賴於主鍵[消除部分子函數依賴]
第二範式(2NF)是在第一範式(1NF)的基礎上建立起來的,即滿足第二範式(2NF)必須先滿足第一範式(1NF)。第二範式(2NF)要求資料庫表中的每個實例或行必須可以被唯一地區分。為實現區分通常需要為表加上一個列,以存儲各個實例的唯一標識。
第二範式(2NF)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與原實體之間是一對多的關系。為實現區分通常需要為表加上一個列,以存儲各個實例的唯一標識。簡而言之,第二範式就是屬性完全依賴於主鍵。
1.3 第三範式(3NF)屬性不依賴於其它非主屬性[消除傳遞依賴]
滿足第三範式(3NF)必須先滿足第二範式(2NF)。簡而言之,第三範式(3NF)要求一個資料庫表中不包含已在其它表中已包含的非主關鍵字信息。第三範式就是屬性不依賴於其它非主屬性。
F. 怎樣區分關系資料庫中的六個範式
這六個範式是逐步加強,資料庫設計時,滿足的範式越高,理論上講,數據冗餘就越少,並且越不容易出問題。。。實際上嘛。。就不說了。。總之,一般設計資料庫時要求滿足第三範式第一範式的意思就是每列都不可再分,且每個表中的每列都是不重復的,只有滿足了第一範式才叫關系型資料庫。先滿足第一範式才能滿足第二範式,第二範式的意思是表中的每行必須唯一,也就是說,要有能唯一標識每行的列(或幾個列也行)滿足第二範式才能滿足第三範式,第三範式是的意思是要求一個資料庫表中不包含已在其它表中已包含的非主關鍵字信息。鮑依斯-科得範式,也就是BC範式,在第三範式的基礎上,消除傳遞依賴(傳遞依賴。。這個還有個定義問題:比如A->B,B->C,則A與C之間的依賴就是傳遞依賴)第四範式,(不廢話了,反正前提是先滿足前一個範式,下面也一樣),消除多值依賴(多值依賴就是存在一對多的關系,間接和直接的都可能有)第五範式,這個就比較扯了,細分成第四範式以後表已經很碎了,第五範式還要求更碎。。。第五範式的目標還是消除多值依賴,不過所消除多值依賴的更難以發現,官方的說法是:保證在第四範式中存在的任何可以分解為實體的三元關系都被分解。 暈不?
G. 創建關系型資料庫有幾種範式
目前關系資料庫有六種範式:第一範式(1NF)、第二範式(2NF)、第三範式(3NF)、Boyce-Codd範式(BCNF)、第四範式(4NF)和第五範式(5NF)
一般到BCNF就比較規范了