當前位置:首頁 » 操作系統 » 資料庫標准化

資料庫標准化

發布時間: 2022-09-26 23:03:56

資料庫的規范化,1\2\3範式怎麼理解

#
資料庫標准化與範式- 開發者在線- www.builder.com.cn
標准化是IT資料庫專業人士都必須遵守的戒律,本文介紹資料庫標准化與範式。 ... VALUES (2, 3) INSERT INTO [sqlTips2005].[Certs].[ProgammerLanguages] ...
www.builder.com.cn/2007/0913/50.shtml - 45k - 網頁快照 - 類似網頁
#
資料庫規范化三個範式應用實例- 開發者在線- www.builder.com.cn
2007年10月22日 ... 本文中解釋了資料庫規范化的重要性,並用不同形式的範式規范化了一個保險 ... 一對多(1:M):一對多關聯意味著給定實體的一個實例可以可以與另一個 ...
www.builder.com.cn/2007/1022/572701.shtml - 41k - 網頁快照 - 類似網頁
#
資料庫設計三大範式應用實例剖析- 開發者在線- www.builder.com.cn
2007年10月22日 ... 資料庫的設計範式是資料庫設計所需要滿足的規范,滿足這些規范的資料庫是簡潔的、結構明晰的。 ... 欄位1, 欄位2. 欄位3. 欄位4. 欄位3.1, 欄位3.2 ...
www.builder.com.cn/2007/1022/572002.shtml

❷ 怎樣設計一個好的資料庫

資料庫設計(Database Design)是指對於一個給定的應用環境,構造最優的資料庫模式,建立資料庫及其應用系統,使之能夠有效地存儲數據,滿足各種用戶的應用需求(信息要求和處理要求)。

在資料庫領域內,常常把使用資料庫的各類系統統稱為資料庫應用系統。

一、資料庫和信息系統
(1)資料庫是信息系統的核心和基礎,把信息系統中大量的數據按一定的模型組織起來,提供存儲、維護、檢索數據的
功能,使信息系統可以方便、及時、准確地從資料庫中獲得所需的信息。
(2)資料庫是信息系統的各個部分能否緊密地結合在一起以及如何結合的關鍵所在。
(3)資料庫設計是信息系統開發和建設的重要組成部分。
(4)資料庫設計人員應該具備的技術和知識:
資料庫的基本知識和資料庫設計技術
計算機科學的基礎知識和程序設計的方法和技巧
軟體工程的原理和方法
應用領域的知識

二、資料庫設計的特點
資料庫建設是硬體、軟體和干件的結合
三分技術,七分管理,十二分基礎數據
技術與管理的界面稱之為「干件」
資料庫設計應該與應用系統設計相結合
結構(數據)設計:設計資料庫框架或資料庫結構
行為(處理)設計:設計應用程序、事務處理等
結構和行為分離的設計
傳統的軟體工程忽視對應用中數據語義的分析和抽象,只要有可能就盡量推遲數據結構設計的決策早期的資料庫設計致力於數據模型和建模方法研究,忽視了對行為的設計
如圖:

三、資料庫設計方法簡述
手工試湊法
設計質量與設計人員的經驗和水平有直接關系
缺乏科學理論和工程方法的支持,工程的質量難以保證
資料庫運行一段時間後常常又不同程度地發現各種問題,增加了維護代價
規范設計法
手工設計方
基本思想
過程迭代和逐步求精
規范設計法(續)
典型方法:
(1)新奧爾良(New Orleans)方法:將資料庫設計分為四個階段
S.B.Yao方法:將資料庫設計分為五個步驟
I.R.Palmer方法:把資料庫設計當成一步接一步的過程
(2)計算機輔助設計
ORACLE Designer 2000
SYBASE PowerDesigner

四、資料庫設計的基本步驟
資料庫設計的過程(六個階段)
1.需求分析階段
准確了解與分析用戶需求(包括數據與處理)
是整個設計過程的基礎,是最困難、最耗費時間的一步
2.概念結構設計階段
是整個資料庫設計的關鍵
通過對用戶需求進行綜合、歸納與抽象,形成一個獨立於具體DBMS的概念模型
3.邏輯結構設計階段
將概念結構轉換為某個DBMS所支持的數據模型
對其進行優化
4.資料庫物理設計階段
為邏輯數據模型選取一個最適合應用環境的物理結構(包括存儲結構和存取方法)
5.資料庫實施階段
運用DBMS提供的數據語言、工具及宿主語言,根據邏輯設計和物理設計的結果
建立資料庫,編制與調試應用程序,組織數據入庫,並進行試運行
6.資料庫運行和維護階段
資料庫應用系統經過試運行後即可投入正式運行。
在資料庫系統運行過程中必須不斷地對其進行評價、調整與修改
設計特點:
在設計過程中把資料庫的設計和對資料庫中數據處理的設計緊密結合起來將這兩個方面的需求分析、抽象、設計、實現在各個階段同時進行,相互參照,相互補充,以完善兩方面的設計

設計過程各個階段的設計描述:
如圖:

五、資料庫各級模式的形成過程
1.需求分析階段:綜合各個用戶的應用需求
2.概念設計階段:形成獨立於機器特點,獨立於各個DBMS產品的概念模式(E-R圖)
3.邏輯設計階段:首先將E-R圖轉換成具體的資料庫產品支持的數據模型,如關系模型,形成資料庫邏輯模式;然後根據用戶處理的要求、安全性的考慮,在基本表的基礎上再建立必要的視圖(View),形成數據的外模式
4.物理設計階段:根據DBMS特點和處理的需要,進行物理存儲安排,建立索引,形成資料庫內模式

六、資料庫設計技巧

1. 設計資料庫之前(需求分析階段)
1) 理解客戶需求,詢問用戶如何看待未來需求變化。讓客戶解釋其需求,而且隨著開發的繼續,還要經常詢問客戶保證其需求仍然在開發的目的之中。
2) 了解企業業務可以在以後的開發階段節約大量的時間。
3) 重視輸入輸出。
在定義資料庫表和欄位需求(輸入)時,首先應檢查現有的或者已經設計出的報表、查詢和視圖(輸出)以決定為了支持這些輸出哪些是必要的表和欄位。
舉例:假如客戶需要一個報表按照郵政編碼排序、分段和求和,你要保證其中包括了單獨的郵政編碼欄位而不要把郵政編碼糅進地址欄位里。
4) 創建數據字典和ER 圖表
ER 圖表和數據字典可以讓任何了解資料庫的人都明確如何從資料庫中獲得數據。ER圖對表明表之間關系很有用,而數據字典則說明了每個欄位的用途以及任何可能存在的別名。對SQL 表達式的文檔化來說這是完全必要的。
5) 定義標準的對象命名規范
資料庫各種對象的命名必須規范。

2. 表和欄位的設計(資料庫邏輯設計)
表設計原則
1) 標准化和規范化
數據的標准化有助於消除資料庫中的數據冗餘。標准化有好幾種形式,但Third Normal Form(3NF)通常被認為在性能、擴展性和數據完整性方面達到了最好平衡。簡單來說,遵守3NF 標準的資料庫的表設計原則是:「One Fact in One Place」即某個表只包括其本身基本的屬性,當不是它們本身所具有的屬性時需進行分解。表之間的關系通過外鍵相連接。它具有以下特點:有一組表專門存放通過鍵連接起來的關聯數據。
舉例:某個存放客戶及其有關定單的3NF 資料庫就可能有兩個表:Customer 和Order。Order 表不包含定單關聯客戶的任何信息,但表內會存放一個鍵值,該鍵指向Customer 表裡包含該客戶信息的那一行。
事實上,為了效率的緣故,對表不進行標准化有時也是必要的。
2) 數據驅動
採用數據驅動而非硬編碼的方式,許多策略變更和維護都會方便得多,大大增強系統的靈活性和擴展性。
舉例,假如用戶界面要訪問外部數據源(文件、XML 文檔、其他資料庫等),不妨把相應的連接和路徑信息存儲在用戶界面支持表裡。還有,如果用戶界面執行工作流之類的任務(發送郵件、列印信箋、修改記錄狀態等),那麼產生工作流的數據也可以存放在資料庫里。角色許可權管理也可以通過數據驅動來完成。事實上,如果過程是數據驅動的,你就可以把相當大的責任推給用戶,由用戶來維護自己的工作流過程。
3) 考慮各種變化
在設計資料庫的時候考慮到哪些數據欄位將來可能會發生變更。
舉例,姓氏就是如此(注意是西方人的姓氏,比如女性結婚後從夫姓等)。所以,在建立系統存儲客戶信息時,在單獨的一個數據表裡存儲姓氏欄位,而且還附加起始日和終止日等欄位,這樣就可以跟蹤這一數據條目的變化。

欄位設計原則
4) 每個表中都應該添加的3 個有用的欄位
dRecordCreationDate,在VB 下默認是Now(),而在SQL Server • 下默認為GETDATE()
sRecordCreator,在SQL Server 下默認為NOT NULL DEFAULT • USER
nRecordVersion,記錄的版本標記;有助於准確說明記錄中出現null 數據或者丟失數據的原因 •
5) 對地址和電話採用多個欄位
描述街道地址就短短一行記錄是不夠的。Address_Line1、Address_Line2 和Address_Line3 可以提供更大的靈活性。還有,電話號碼和郵件地址最好擁有自己的數據表,其間具有自身的類型和標記類別。
6) 使用角色實體定義屬於某類別的列
在需要對屬於特定類別或者具有特定角色的事物做定義時,可以用角色實體來創建特定的時間關聯關系,從而可以實現自我文檔化。
舉例:用PERSON 實體和PERSON_TYPE 實體來描述人員。比方說,當John Smith, Engineer 提升為John Smith, Director 乃至最後爬到John Smith, CIO 的高位,而所有你要做的不過是改變兩個表PERSON 和PERSON_TYPE 之間關系的鍵值,同時增加一個日期/時間欄位來知道變化是何時發生的。這樣,你的PERSON_TYPE 表就包含了所有PERSON 的可能類型,比如Associate、Engineer、Director、CIO 或者CEO 等。還有個替代辦法就是改變PERSON 記錄來反映新頭銜的變化,不過這樣一來在時間上無法跟蹤個人所處位置的具體時間。
7) 選擇數字類型和文本類型盡量充足
在SQL 中使用smallint 和tinyint 類型要特別小心。比如,假如想看看月銷售總額,總額欄位類型是smallint,那麼,如果總額超過了$32,767 就不能進行計算操作了。
而ID 類型的文本欄位,比如客戶ID 或定單號等等都應該設置得比一般想像更大。假設客戶ID 為10 位數長。那你應該把資料庫表欄位的長度設為12 或者13 個字元長。但這額外占據的空間卻無需將來重構整個資料庫就可以實現資料庫規模的增長了。
8) 增加刪除標記欄位
在表中包含一個「刪除標記」欄位,這樣就可以把行標記為刪除。在關系資料庫里不要單獨刪除某一行;最好採用清除數據程序而且要仔細維護索引整體性。

3. 選擇鍵和索引(資料庫邏輯設計)
鍵選擇原則:
1) 鍵設計4 原則
為關聯欄位創建外鍵。 •
所有的鍵都必須唯一。 •
避免使用復合鍵。 •
外鍵總是關聯唯一的鍵欄位。 •
2) 使用系統生成的主鍵
設計資料庫的時候採用系統生成的鍵作為主鍵,那麼實際控制了資料庫的索引完整性。這樣,資料庫和非人工機制就有效地控制了對存儲數據中每一行的訪問。採用系統生成鍵作為主鍵還有一個優點:當擁有一致的鍵結構時,找到邏輯缺陷很容易。
3) 不要用用戶的鍵(不讓主鍵具有可更新性)
在確定採用什麼欄位作為表的鍵的時候,可一定要小心用戶將要編輯的欄位。通常的情況下不要選擇用戶可編輯的欄位作為鍵。
4) 可選鍵有時可做主鍵
把可選鍵進一步用做主鍵,可以擁有建立強大索引的能力。

索引使用原則:
索引是從資料庫中獲取數據的最高效方式之一。95%的資料庫性能問題都可以採用索引技術得到解決。
1) 邏輯主鍵使用唯一的成組索引,對系統鍵(作為存儲過程)採用唯一的非成組索引,對任何外鍵列採用非成組索引。考慮資料庫的空間有多大,表如何進行訪問,還有這些訪問是否主要用作讀寫。
2) 大多數資料庫都索引自動創建的主鍵欄位,但是可別忘了索引外鍵,它們也是經常使用的鍵,比如運行查詢顯示主表和所有關聯表的某條記錄就用得上。
3) 不要索引memo/note 欄位,不要索引大型欄位(有很多字元),這樣作會讓索引佔用太多的存儲空間。
4) 不要索引常用的小型表
不要為小型數據表設置任何鍵,假如它們經常有插入和刪除操作就更別這樣作了。對這些插入和刪除操作的索引維護可能比掃描表空間消耗更多的時間。

4. 數據完整性設計(資料庫邏輯設計)
1) 完整性實現機制:
實體完整性:主鍵
參照完整性:
父表中刪除數據:級聯刪除;受限刪除;置空值
父表中插入數據:受限插入;遞歸插入
父表中更新數據:級聯更新;受限更新;置空值
DBMS對參照完整性可以有兩種方法實現:外鍵實現機制(約束規則)和觸發器實現機制
用戶定義完整性:
NOT NULL;CHECK;觸發器
2) 用約束而非商務規則強制數據完整性
採用資料庫系統實現數據的完整性。這不但包括通過標准化實現的完整性而且還包括數據的功能性。在寫數據的時候還可以增加觸發器來保證數據的正確性。不要依賴於商務層保證數據完整性;它不能保證表之間(外鍵)的完整性所以不能強加於其他完整性規則之上。
3) 強制指示完整性
在有害數據進入資料庫之前將其剔除。激活資料庫系統的指示完整性特性。這樣可以保持數據的清潔而能迫使開發人員投入更多的時間處理錯誤條件。
4) 使用查找控制數據完整性
控制數據完整性的最佳方式就是限制用戶的選擇。只要有可能都應該提供給用戶一個清晰的價值列表供其選擇。這樣將減少鍵入代碼的錯誤和誤解同時提供數據的一致性。某些公共數據特別適合查找:國家代碼、狀態代碼等。
5) 採用視圖
為了在資料庫和應用程序代碼之間提供另一層抽象,可以為應用程序建立專門的視圖而不必非要應用程序直接訪問數據表。這樣做還等於在處理資料庫變更時給你提供了更多的自由。

5. 其他設計技巧
1) 避免使用觸發器
觸發器的功能通常可以用其他方式實現。在調試程序時觸發器可能成為干擾。假如你確實需要採用觸發器,你最好集中對它文檔化。
2) 使用常用英語(或者其他任何語言)而不要使用編碼
在創建下拉菜單、列表、報表時最好按照英語名排序。假如需要編碼,可以在編碼旁附上用戶知道的英語。
3) 保存常用信息
讓一個表專門存放一般資料庫信息非常有用。在這個表裡存放資料庫當前版本、最近檢查/修復(對Access)、關聯設計文檔的名稱、客戶等信息。這樣可以實現一種簡單機制跟蹤資料庫,當客戶抱怨他們的資料庫沒有達到希望的要求而與你聯系時,這樣做對非客戶機/伺服器環境特別有用。
4) 包含版本機制
在資料庫中引入版本控制機制來確定使用中的資料庫的版本。時間一長,用戶的需求總是會改變的。最終可能會要求修改資料庫結構。把版本信息直接存放到資料庫中更為方便。
5) 編制文檔
對所有的快捷方式、命名規范、限制和函數都要編制文檔。
採用給表、列、觸發器等加註釋的資料庫工具。對開發、支持和跟蹤修改非常有用。
對資料庫文檔化,或者在資料庫自身的內部或者單獨建立文檔。這樣,當過了一年多時間後再回過頭來做第2 個版本,犯錯的機會將大大減少。
6) 測試、測試、反復測試
建立或者修訂資料庫之後,必須用用戶新輸入的數據測試數據欄位。最重要的是,讓用戶進行測試並且同用戶一道保證選擇的數據類型滿足商業要求。測試需要在把新資料庫投入實際服務之前完成。
7) 檢查設計
在開發期間檢查資料庫設計的常用技術是通過其所支持的應用程序原型檢查資料庫。換句話說,針對每一種最終表達數據的原型應用,保證你檢查了數據模型並且查看如何取出數據。

❸ 如何設計合理高效的資料庫

一、 引言資料庫對於企業信息化的重要性是不言而喻的。資料庫存儲著現代企業最重要的數據,包括生產、經營、管理等各類數據,這些數據作為企業的核心信息,通過各類信息系統,為用戶提供及時准確的信息,幫助用戶分析,為用戶提供決策依據。為提高企業的工作效率,提升企業形象,具有傳統模式無法比擬的優勢。其中構建合理高效的資料庫,是資料庫建設關鍵之一。如何構建合理高效的資料庫是企業信息化過程要解決的問題。下面就資料庫的構建談談自己的一些經驗,希望能對大家有所幫助。 二、 設計資料庫之前
資料庫並不是憑空想像出來的,而是根據業務部門的需要設計符合業務需求的資料庫。因此在形成資料庫之前需要充分了解業務需求。 1. 充分理解業務需求。需求分析是整個設計過程的基礎,是最困難、最耗費時間的一步。在這期間通過與業務部門交流,了解用戶的想法以及工作流程,通過雙方多次交流,會形成初步的數據模型,當然這時的數據模型不會是最終的模型,還需要和用戶進行交流,並且在以後的信息系統開發過程中還會反復修改。 2. 重視輸入輸出。在定義資料庫表和欄位需求(輸入)時,首先應了解數據產生源和數據流程,也就是必需要知道每個數據在那兒產生,數據在那兒表現,以什麼樣的形式表現等等,然後根據用戶提供的報表或者設計出的報表、查詢和視圖(輸出)以決定為了支持這些輸出哪些是必要的表和欄位。 3. 創建數據字典和ER 圖表。ER 圖表和數據字典可以讓任何了解資料庫的人都明確如何從資料庫中獲得數據。ER圖對表明表之間關系很有用,而數據字典則說明了每個欄位的用途以及任何可能存在的別名。對SQL 表達式的文檔化來說這是完全必要的。 需要注意的是,在需求分析調研過程中,並不是一帆風順的,因為業務人員對於業務的理解不同,以及對於信息知識的缺乏,會影響需求分析的質量,為了提高質量,各方要用更多的時間交流與相互理解,業務部門需要精通業務的人員自始至終全力配合,而開發人員則盡量使用用戶理解的業務術語交流,這樣會避免出現理解不同而產生的歧義。 三、 設計合理的表結構
通常合理的表結構會減少數據冗餘,提高資料庫的性能。設計合理的表結構要遵循以下兩點。 1. 標准化和規范化 數據的標准化有助於消除資料庫中的數據冗餘。標准化有好幾種形式,但3NF(第三範式)通常被認為在性能、擴展性和數據完整性方面達到了最好平衡。簡單來說,遵守3NF標準的資料庫的表設計原則是:某個表只包括其本身基本的屬性,當不是它們本身所具有的屬性時需進行分解。表之間的關系通過外鍵相連接。它具有以下特點:有一組表專門存放通過鍵連接起來的關聯數據。 例如:某個存放單井信息及其有關油井生產日報信息的3NF資料庫就有兩個表:單井基礎信息和油井日報信息。日報信息不包含單井的任何信息,但表內會存放一個鍵值,該鍵指向單井基礎信息里包含該油井信息的那一行。 不過也有例外,有時為了效率的緣故,對表不進行標准化也是必要的。 2. 考慮各種變化 在設計資料庫的時候考慮到哪些數據欄位將來可能會發生變更。使資料庫更具擴展性,從而減少將來數據變更所帶來的損失。 例如,日期類型欄位,有時我們會考慮使用字元類型代替日期類型,因為在處理日期欄位上容易產生數據錯誤,所以我們就使用字元類型。這樣的例子還很多,在做前期設計時都要考慮的。 表結構的設計不是一次就能成功的,在信息系統開發過程中會存在數據讀取、錄入或統計困難,為了解決這些問題會修改表結構,或增加一些欄位,或修改一些欄位的屬性。這個過程不斷重復,因此不要想一次能成功。建議使用專門設計工具來做這些工作,筆者經常使用:SYBASE PowerDesigner ,當然還有其它的工具:ORACLE Designer 2000 ,ROSE等工具。這樣會使你的工作事半功倍。 四、 選擇合理的索引
索引是從資料庫中獲取數據的最高效方式之一。95%的資料庫性能問題都可以採用索引技術得到解決。 1. 邏輯主鍵使用唯一的成組索引,對系統鍵(作為存儲過程)採用唯一的非成組索引,對任何外鍵列採用非成組索引。考慮資料庫的空間有多大,表如何進行訪問,還有這些訪問是否主要用作讀寫。 2. 大多數資料庫都索引自動創建的主鍵欄位,但是可別忘了索引外鍵,它們也是經常使用的鍵,比如運行查詢顯示主表和所有關聯表的某條記錄就用得上。 3. 不要索引大型欄位(有很多字元),這樣作會讓索引佔用太多的存儲空間。如MEMO(備注)、TEXT(文本)等欄位。 4. 不要索引常用的小型表 不要為小型數據表設置任何鍵,假如它們經常有插入和刪除操作就更別這樣作了。對這些插入和刪除操作的索引維護可能比掃描表空間消耗更多的時間。如代碼表,或系統參數表。 五、 保證數據完整性
數據的完整性非常重要,這關繫到數據的准確性,不準確的數據是毫無價值的,因此保證數據的完整性非常重要。 1. 完整性實現機制:實體完整性:主鍵參照完整性: 父表中刪除數據:級聯刪除;受限刪除;置空值父表中插入數據:受限插入;遞歸插入 父表中更新數據:級聯更新;受限更新;置空值 DBMS對參照完整性可以有兩種方法實現:外鍵實現機制(約束規則)和觸發器實現機制用戶定義完整性:NOT NULL;CHECK;觸發器 以上完整性機制需要熟悉和掌握,它對於數據的完整性非常重要。 2. 用約束而非業務規則強制數據完整性 採用資料庫系統實現數據的完整性。這不但包括通過標准化實現的完整性而且還包括數據的功能性。在寫數據的時候還可以增加觸發器來保證數據的正確性。不要依賴於業務層保證數據完整性;它不能保證表之間(外鍵)的完整性所以不能強加於其他完整性規則之上。 3. 強制指示完整性 在有害數據進入資料庫之前將其剔除。激活資料庫系統的指示完整性特性。這樣可以保持數據的清潔而能迫使開發人員投入更多的時間處理錯誤條件。 4. 使用查找控制數據完整性 控制數據完整性的最佳方式就是限制用戶的錄入。只要有可能都應該提供給用戶一個清晰的價值列表供其選擇。這樣將減少鍵入代碼的錯誤和誤解同時提供數據的一致性。某些公共數據特別適合查找:性別代碼、單位代碼等。 5. 採用視圖 視圖是一個虛擬表,其內容由SQL語句定義,視圖不僅可以簡化用戶對數據的理解,也可以簡化他們的操作。那些被經常使用的查詢可以被定義為視圖,從而使得用戶不必為以後的操作每次指定全部的條件。另外通過視圖用戶只能查詢和修改他們所能見到的數據。資料庫中的其它數據則既看不見也取不到。資料庫授權命令可以使每個用戶對資料庫的檢索限制到特定的資料庫對象上,增強數據的安全性。 六、 結束語
資料庫的高效運行不僅需要技術上的支持,也需要硬體平台和網路的支持以及資料庫管理員的有效管理,本文只是從技術的角度說明如何提高資料庫的效率,但在實際應用過程中其它方面的支持也是不可缺少的,尤其是資料庫管理,資料庫建設是「三分技術,七分管理,十二分基礎數據」,因此對於資料庫管理一定要重視,在管理到位的情況下技術才能發揮應有的作用。

❹ geo資料庫數據如何標准化

標准化的方法就是Counts值:

對給定的基因組參考區域,計算比對上的read數,又稱為raw count(RC)。

aw count作為原始的read計數矩陣是一個絕對值,而絕對值的特點是基因長度、測序深度不同不可以比較。所以我們要進行標准化把count矩陣轉變為相對值,去除基因長度、測序深度的影響,我們採用分析的。

標准化的三種方法得出的三種值:

RPM (Reads per million mapped reads):RPM方法:10^6標准化了測序深度的影響,但沒有考慮轉錄本的長度的影響。

RPKM/FPKM方法:

103標准化了基因長度的影響,106標准化了測序深度的影響。TCGA的數據分析多採用這種結果。

TPM (Transcript per million):TPM的計算方法也同RPKM/FPKM類似,TPM可以看作是RPKM/FPKM值的百分比。



具體判斷方法:

表達量是否需要重新標准化。

可以通過boxplot函數觀察一下樣本表達豐度值的分布是否整齊進行判斷。

是否需要log2:根據數據值的大小。

如果表達豐度的數值在50以內,通常是經過log2轉化的。如果數字在幾百幾千,則是未經轉化的。




❺ 資料庫有哪幾種

常用資料庫有mysql、oracle、sqlserver、sqlite等。

mysql性能較好,適用於所有平台,是當前最流行的關系型資料庫之一;sqlserver資料庫具有擴展性和可維護性,且安全性較高,是比較全面的資料庫;還有一種比較主流的資料庫是oracle,oracle資料庫適合大型資料庫;mysql和sqlite適合中小型資料庫。

特點

MySQL所使用的SQL語言是用於訪問資料庫的最常用標准化語言,由於其體積小、速度快、開放源碼等特點,一般中小型網站的開發都選擇MySQL作為網站資料庫。

ORACLE資料庫是目前世界上使用最為廣泛的資料庫管理系統,作為一個通用的資料庫系統,它具有完整的數據管理功能;作為一個關系資料庫,它是一個完備關系的產品。

SQLite 由以下幾個組件組成:SQL 編譯器、內核、後端以及附件。SQLite 通過利用虛擬機和虛擬資料庫引擎(VDBE),使調試、修改和擴展 SQLite 的內核變得更加方便。

❻ mapgis三維建模導入鑽孔數據後怎麼建模

鑽孔多元耦合自動三維建模,需要將鑽孔資料庫標准化。
具體操作:
1、數據的收集、整理與檢查。包括剖面數據的預處理,鑽孔數據的預處理,以及剖面數據與鑽孔數據的配准等工作。並且通過Mapgis格式的華北地區底圖,提取出地表離散點信息。
2、數據導入到建模系統軟體中,進行模型構建。將剖面數據、鑽孔數據、地表離散點數據以及渤海海底數據等,導入到工區中,按照一定的建模順序依次建立各模型元素。
3、根據導入的數據,理清其對應的關系,依序建立各種地質體。按照上面建模過程中生成的地質元素,建立地質體模型。
4、檢查與校驗。檢查、校驗所建立的三維可視化模型,如果發生錯誤,重復前面的步驟,進行模型的修改工作。

❼ 資料庫標准化

第一範式:確保每列的原子性.
如果每列(或者每個屬性)都是不可再分的最小數據單元(也稱為最小的原子單元),則滿足第一範式.
例如:顧客表(姓名、編號、地址、……)其中"地址"列還可以細分為國家、省、市、區等。

第二範式:在第一範式的基礎上更進一層,目標是確保表中的每列都和主鍵相關.
如果一個關系滿足第一範式,並且除了主鍵以外的其它列,都依賴於該主鍵,則滿足第二範式.
例如:訂單表(訂單編號、產品編號、定購日期、價格、……),"訂單編號"為主鍵,"產品編號"和主鍵列沒有直接的關系,即"產品編號"列不依賴於主鍵列,應刪除該列。

第三範式:在第二範式的基礎上更進一層,目標是確保每列都和主鍵列直接相關,而不是間接相關.
如果一個關系滿足第二範式,並且除了主鍵以外的其它列都不依賴於主鍵列,則滿足第三範式.
為了理解第三範式,需要根據Armstrong公里之一定義傳遞依賴。假設A、B和C是關系R的三個屬性,如果A-〉B且B-〉C,則從這些函數依賴中,可以得出A-〉C,如上所述,依賴A-〉C是傳遞依賴。
例如:訂單表(訂單編號,定購日期,顧客編號,顧客姓名,……),初看該表沒有問題,滿足第二範式,每列都和主鍵列"訂單編號"相關,再細看你會發現"顧客姓名"和"顧客編號"相關,"顧客編號"和"訂單編號"又相關,最後經過傳遞依賴,"顧客姓名"也和"訂單編號"相關。為了滿足第三範式,應去掉"顧客姓名"列,放入客戶表中。

❽ 軟體工程師必須知道的10個概念

軟體工程師必須知道的10個概念

優秀的軟體工程師要通曉10個概念,這10個概念超越了編程語言與設計模式,軟體工程師應當從更廣的范圍內明白這些道理。下面一起和我來看看吧!

10. 關系資料庫 (Relational Databases)

關系資料庫因為在大規模 Web 服務上缺乏可擴充性而頗受微詞,然而,關系資料庫仍然是近20年來計算機技術中最偉大的成就。關系資料庫對處理訂單,公司數據方面有著出色的表現。

關系資料庫的核心是以記錄表示數據,記錄存放在資料庫表,資料庫使用查詢語言(SQL)對數據進行搜索與查詢,同時,資料庫對各個數據表進行關聯。

資料庫的標准化技術(normalization)講的是使用正確的方式對數據進行分存以降低冗餘,並加快存取速度。

9. 安全 (Security)

隨著黑客的崛起與數據敏感性的上升,安全變得非常重要。安全是個廣義的概念,涉及驗證,授權與信息傳輸。

驗證是對用戶的身份進行檢查,如要求用戶輸入密碼。驗證通常需要結合 SSL (secure socket layer)進行;授權在公司業務系統中非常重要,尤其是一些工作流系統。最近開發的 OAuth 協議可以幫助 Web 服務將相應信息向相應用戶開放。Flickr 便使用這種方式管理私人照片和數據的訪問許可權。

另外一個安全領域是網路設防,這關繫到操作系統,配置與監控。不僅網路危險重重,任何軟體都是。Firefox 被稱為最安全的瀏覽器,仍然需要頻頻發布安全補丁。要為你的系統編寫安全代碼就需要明白各種潛在的問題。

8. 雲計算 (Cloud Computing)

RWW 最近的關於雲計算的文章 Reaching For The Sky Through Compute Clouds 講到了雲計算如何改變大規模 Web 應用的發布。大規模的並行,低成本,與快速投入市場。

並行演算法發明以來,首先迎來的是網格計算,網格計算是藉助空閑的桌面計算機資源進行並行計算。最著名的例子是 Berkley 大學的 SETI@home 計劃,該計劃使用空閑的 CPU 資源分析太空數據。金融機構也大規模實施網格計算進行風險分析。空閑的資源,加上 J2EE 平台的崛起,迎來了雲計算的概念:應用服務虛擬化。就是應用按需運行,並可以隨著時間和用戶規模而實時改變。

雲計算最生動的例子是 Amazon 的 Web 服務,一組可以通過 API 進行調用的應用,如雲服務(EC2),一個用來存儲大型媒體文件的資料庫(S3),索引服務(SimpleDB),序列服務(SQS)。

7. 並發 (Concurrency)

並發是軟體工程師最容易犯錯的地方,這可以理解,因為我們一直遵從線形思維,然而並發在現代系統中非常重要。

並發是程序中的並行處理,多數現代編程語言包含內置的並發能力,在 Java,指的是線程。關於並發,最經典的例子是「生產/消費」模式,生產方生產數據和任務,並放入工作線程消費或執行。並發的復雜性在於,線程需要經常訪問共同數據,每個線程都有自己的執行順序,但需要訪問共同數據。Doug Lea 曾寫過一個最復雜的並發類,現在是 core Java 的一部分。

6. 緩存(Caching)

緩存對現代 Web 程序不可或缺,緩存是從資料庫取回,並存放在內存中的數據。因為資料庫直接存取的代價非常高,將數據從資料庫取回並放在緩存中訪問就變得十分必要。比如,你有一個網站,要顯示上周的暢銷書,你可以從數據將暢銷書榜一次性取回放在緩存中,而不必在每次訪問時都去資料庫讀數據。

緩存需要代價,只有最常用的內容才可以放入緩存。很多現代程序,包括臉譜網,依靠一種叫做 Memcached 的分布式緩存系統,該系統是 Brad Firzpatrick 在工作於 LiveJournal 項目時開發的,Memcached 使用網路中空閑的內存資源建立緩存機制,Memcached 類庫在很多流行編程語言,包括 Java 和 PHP 中都有。

5. 散列法(Hashing)

Hashing 的目的是加速訪問速度。如果數據是序列存儲的,從中查詢一個項的時間取決於數據列的大小。而散列法對每一個項計算一個數字作為索引,在一個好的 Hashing 演算法下,數據查找的速度是一樣的。

除了存儲數據,散列法對分布式系統也很重要。統一散列法(uniform hash )用來在雲資料庫環境下,在不同計算機之間分存數據。Google 的索引服務就是這種方法的體現,每一個 URL 都被散列分布到特定計算機。

散列函數非常復雜,但現代類庫中都有現成的類,重要的是,如何對散列法進行細調以獲得最好的性能。

4. 演算法的復雜性 (Algorithmic Complexity)

關於演算法的復雜性,軟體工程師需要理解這樣幾件事。第一,大O標記法(big O notation);第二,你永遠都不應該使用嵌套式循環(循環裡面套循環),你應該使用 Hash 表,數組或單一循環;第三,如今優秀類庫比比皆是,我們不必過分糾纏於這些庫的效能的`差別,我們以後還有機會進行細調;最後,不要忽視演算法的優雅及性能,編寫緊湊的,可讀的代碼可以讓你的演算法更簡單,更干凈。

3. 分層 (Layering)

用分層來討論軟體架構是最容易的。John Lakos 曾出版過一本關於大型 C++ 系統的書。Lakos 認為軟體包含了層,書中介紹了層的概念,方法是,對每個軟體組件,數一下它所依賴的組件數目就可以知道它的復雜程度。

Lakos 認為,一個好的軟體擁有金字塔結構,就是說,軟體組件擁有層層積累的復雜度,但每個組件本身必須簡單,一個優秀的軟體包含很多小的,可重復使用的模塊,每個模塊有自己的職責。一個好的系統中,組件之間的依賴性不可交叉,整個系統是各種各樣的組件堆積起來,形成一個金字塔。

Lakos 在軟體工程的很多方面都是先驅,最著名的是 Refactoring (代碼重構)。代碼重構指的是,在編程過程中需要不斷地對代碼進行改造以保證其結構的健壯與靈活。

2. 慣例與模板 (Conventions and Templates)

命名慣例和基礎模板在編程模式中常被忽視,然而它可能是最強大的方法。命名慣例使軟體自動化成為可能,如,Java Beans 框架在 getter 和 setter 方法中,使用簡單的命名慣例。del.icio.us 網站的 URL 命名也使用統一的格式,如 http://del.icio.us/tag/software 會將用戶帶到所有標簽為 software 的頁。

很多社會網路均使用簡單命名,如,你的名字是 johnsmith ,那你的頭像可能命名為 johnsmith.jpg,而你的 rss 聚合文件的命名很可能是 johnsmith.xml 。

命名慣例還用於單元測試,如,JUnit 單元測試工具會辨認所有以 test 開頭的類。

我們這里說的模板(templates )指的並不是 C++ 或 Java 語言中的 constructs,我們說的是一些包含變數的模板文件,用戶可以替換變數並輸出最終結果。

Cold Fusion 是最先使用模板的程序之一,後來,Java 使用 JSP 實現模板功能。Apache 近來為 Java 開發了非常好用的通用模板, Velocity。PHP 本身就是基於模板的,因為它支持 eval 函數。

1. 界面(Interfaces)

軟體工程中最重要的概念是界面。任何軟體都是一個真實系統的模型。

如何使用簡單的用戶界面進行模型化至關重要。很多軟體系統走這樣的極端,缺乏抽象的冗長代碼,或者過分設計而導致無謂的復雜。

在眾多軟體工程書籍中,Robert Martin 寫的《敏捷編程》值得一讀。

關於模型化,以下方法對你會有幫助。首先,去掉那些只有在將來才可能用得著的方法,代碼越精練越好。第二,不要總認為以前的東西是對的,要善於改變。第三,要有耐心並享受過程。

;

❾ 資料庫如何判斷規范化程度

S➡D,D➡M,可以推出S➡M;所以存在傳遞依賴;
第三範式規定不存在函數依賴,所以不滿足第三範式;
屬性不可再分,滿足第一範式;
第一範式基礎上,不存在部分函數依賴,所以滿足第二範式,即2NF;
你可能對部分函數依賴不理解,我解釋一下:S➡D,意味著D依賴於S,也就是S的內容決定著D的內容;如果{A,B}➡M,同時有B➡M,那就有部分函數依賴了,因為{A,B}中的一個子集是B,B是集合中的一部分;這就是部分函數依賴。

熱點內容
g92編程 發布:2025-05-17 21:00:31 瀏覽:170
匯編語言第三版腳本之家 發布:2025-05-17 20:54:26 瀏覽:399
資源配置最佳狀態叫什麼 發布:2025-05-17 20:48:58 瀏覽:84
定義dns伺服器的ip 發布:2025-05-17 20:32:37 瀏覽:954
android判斷圖片 發布:2025-05-17 20:32:33 瀏覽:833
安卓12什麼時候適配小米 發布:2025-05-17 20:31:47 瀏覽:71
c語言字元串初始化 發布:2025-05-17 20:18:43 瀏覽:37
安卓融e聯推送需要什麼許可權 發布:2025-05-17 20:18:39 瀏覽:269
我的世界無限武魂伺服器 發布:2025-05-17 20:17:09 瀏覽:372
安卓手游腳本語言 發布:2025-05-17 19:53:07 瀏覽:22