資料庫草圖
❶ 人類基因組圖譜的介紹
由美國國立人類基因組研究所(nhgri)和能源部(doe)領導的ihgsc不久前宣布,人類基因組測序工作已圓滿完成,其發表在2004年10月21日nature(2004,431:931)上的分析
報告對2001年2月發表的初步分析報告進行了補充。這篇最新分析報告不但為世人展現了一張精度大於99%、誤差小於10萬分之一的精確版人類基因組圖譜,而且還進一步糾正了蛋白編碼基因的數量,僅為2萬~2.5萬個,而非原先估計的3萬~3.5萬個。新基因組圖譜 准確率達99.999%
旨在破譯人類基因組常染色質遺傳密碼的人類基因組計劃(hgp)自1990年啟動至2003年結束,歷時共13年, 該計劃由ihgsc來完成。ihgsc是由法國、德國、日本、中國、英國和美國等6個國家20個研究所的科學家組成的開放性國際協作組織,全球2800餘名科學家參加了ihgsc的工作。
2001年2月,ihgsc宣布,人類基因組草圖已經完成。以今天的眼光來看,草圖顯然存在很多重要的不足,例如,僅測出了約90%的常染色質基因組序列,而且序列之間存在147821個未檢測出的空缺等等。
在2001-2003年之間,ihgsc的不懈努力終於將此草圖轉化為今天這張既高度精確又相當完整的人類基因組圖。此外,在這段時間內,還陸續發表了關於第2、6、7、9、10、13、14、19、20、21、22號染色體和y染色體的詳細評注和分析,其餘12條染色體的資料不久也將發表。
現在的基因組序列(buiid35)共包含28.5億個核苷酸,它近乎完整,涵蓋了99%以上的常染色質基因組序列;准確率為99.999%,也就是說誤差率只有1個鹼基/10萬個鹼基對,比最初制訂的目標精確了10倍。
序列的連續性亦獲得了顯著改善,常染色質基因組序列中僅存在341個空缺。現在,平均每一段連續序列含有3850萬個鹼基對,約比2001年版草圖的81500個鹼基對長475倍。這些沒有中斷的已知序列可以在很大程度上幫助科學家尋找目標基因及其鄰近的調節目標基因活性的序列,並顯著減少他們尋找疾病相關性短而少見的序列的工作量和費用。在剩餘的341個空缺中,很多與片段的重復(segmentalplications)相關,需要採用新的方法才能將其填滿。
ihgsc所完成的測序工作不僅完整而且精確,足以進行一些對敏感性要求較高的科學分析,例如基因數目的研究,疾病相關性重復片段的研究,以及進化過程中基因「生」或「死」
的研究。該基因組序列的資料已於2003年4月被載入免費公用資料庫。「完成」並非意味著現在的人類基因組圖就是完美無缺的。雖然與2001版草圖相比,空缺已經從近15萬個減少至341個,但是人類基因組序列的這些頑固空缺已很難用現有的技術來填補。填補這些空隙需要做進一步的研究,並需要採用新的技術。
美國馬薩諸塞州麻省理工學院和哈佛大學broad研究所所長lander說:「已完成的人類基因組序列在准確率、完整性和連續性方面遠遠超過了我們的預期目標。它反映出全球數百名科學家為了一個共同目標——為21世紀的生物醫學奠定扎實的基礎——而進行大協作的奉獻精神。」
僅有2萬~2.5萬個蛋白編碼基因
ihgsc最新分析所得出的最出人意料的結果就是,人類基因組只含有2萬~2.5萬個蛋白編碼基因。
nhgri所長collins說:「僅僅在10年以前,大多數科學家還認為,人類基因組大約含有10萬個蛋白編碼基因。3年前,當我們對人類基因組序列草圖進行分析時,我們估計人類約有3萬~3.5萬個蛋白編碼基因,這在當時已經使很多人感到震驚。而剛剛結束的分析結果發現人類的蛋白編碼基因數比預計的還要少得多,這使我們對人類基因組的真實情況有了更准確的了解。全世界的科學家都可以從免費公用資料庫中獲得該高度精確的人類基因組序列,這就使他們有可能對人類遺傳學及其影響人類健康和疾病的機制進行更精確的研究。」
人類基因組分析的主要目的之一就是確定人類的全部基因。基因是編碼特定蛋白質的一段dna序列,是遺傳的基本功能單位。目前的研究結果顯示,人類基因組有19599個已經獲得確定的蛋白編碼基因,另外還有2188段可能為蛋白編碼基因的dna序列。
英國wellcometrustanger研究所rogers說:「由於2001年版人類基因組草圖不夠完善,因此導致了一些早期基因模型是錯誤的。基因鑒定仍是一項艱巨的任務。除了其他生物的基因組序列、更好的計算機化模型和其他手段的改進外,人類基因組測序工作的完成必將為基因鑒定工作提供極大的幫助。」
人類基因重復片段高達5.3%
科學家們認為,已完成的人類基因組序列不但確定了更為確切的人類基因數量,而且與2001版基因組序列草圖相比,質量也有顯著的提高,並且使人們對某些現象有了征(胸腺發育不良)。美國聖路易斯市華盛頓大學基因組測序中心前主任、西雅圖市華盛頓大學基因組系主任waterston說:「以前只有基因組序列草圖的時候,要對重復片段進行研究幾乎是不可能的。通過全世界科學家堅持不懈的努力,現在我們已經可以對人類基因組中這一重要而快速進化的部分進行研究了。」
重復片段覆蓋了5.3%的人類基因組,顯著多於大鼠的基因組(約為3%)或小鼠的基因組(在1%~2%之間)。重復片段為人們開啟了一個了解人類基因組是如何進化的以及人類基因組目前正在經歷什麼樣的變化的窗口。人類基因組如此高的重復片段百分比表明,在最近4000萬年內,人類的遺傳物質經歷了快速的功能變革和結構改變。這大概就是人類具有獨特的特徵,從而有別於其非人類靈長類動物祖先的原因。
ihgsc在分析中發現,重復片段在不同的人類染色體之間的分布差異很大。y染色體就是一個最極端的例子,其重復片段占總長度的25%以上。有些重復片段往往群集於每
條染色體的中部(著絲粒)或末端(端粒)附近。科學家們推測,基因組可能將著絲粒和端粒處的重復片段用作一個進化實驗室,來生成具有新功能的基因。揭示基因的「生」與「死」
已完成的人類基因組序列准確度很高,這使科學家有可能了解在人類進化過程中基因的「生」和「死」。科學家在人類基因組中發現了1000多個新基因,這些基因是大約7500萬年前人類與嚙齒類動物向不同方向進化以後產生的。這些基因多數是最近通過基因重復產生的,與免疫、嗅覺和生殖功能有關,例如,人類基因組中最近重復的兩個基因家族分別編碼兩組蛋白質,妊娠特異性β1糖蛋白和絨毛膜促性腺激素β蛋白,這兩組蛋白質可能與人類獨特的較長的妊娠期相關。
此外,科學家們還利用已完成的人類基因組序列發現並鑒定了33個幾乎沒什麼變化的基因,但是由於它們在近期發生了1個或1個以上突變而導致了其功能喪失(或稱為「死亡」)。科學家通過將這些基因與大鼠和小鼠基因組中的對應基因(鼠類中這些對應基因的功能仍保持)進行對照比較後,確定了這些無功能基因(又稱為假基因)在人類基因組的確切位置。有趣的是,科學家們還發現,上述33個假基因中的10個似乎與編碼嗅覺感受器的蛋白相關,這就有助於解釋為什麼人類的功能性嗅覺感受器較少,從而導致了人類的嗅覺比嚙齒類動物差。axel和buck不久前就因在嗅覺分子生物學方面所做出的傑出貢獻而獲得了2004年諾貝爾生理學或醫學獎。
然後,科學家將這33個假基因和黑猩猩的基因組序列草圖進行了對照比較,以確定這些基因在大約500萬年前類人猿進化為人類前是否還是有功能的。分析結果顯示,33個假基因中的27個在人類中和在黑猩猩中均無功能,但有5個假基因雖在人類中無功能,但在黑猩猩中還是有功能的。美國休斯頓baylor醫學院人類基因組測序中心主任gibbs說:「對這些人類基因組中的假基因以及黑猩猩基因組中仍有功能的對應基因的確定,為將來的研究項目打下了堅實的基礎。」gibbs等目前正在進行另一種非人類靈長類動物——恆河猴基因組的測序工作。
❷ 什麼是資料庫
1.什麼是資料庫呢?
每個人家裡都會有冰箱,冰箱是用來干什麼的?冰箱是用來存放食物的地方。
同樣的,資料庫是存放數據的地方。正是因為有了資料庫後,我們可以直接查找數據。例如你每天使用余額寶查看自己的賬戶收益,就是從資料庫讀取數據後給你的。
你可能會問了:我的數據就存放在自己電腦的excel表裡就可以了,為什麼還要搞個資料庫呢?
這是因為資料庫比excel有更多的優勢。資料庫可以存放大量的數據,允許很多人同時使用裡面的數據。
舉個例子你就明白了,excel好比是一個移動硬碟,你使用了這個移動硬碟其他人就用不了了。
資料庫好比是網盤,很多人可以同時訪問裡面里的數據。
而且網盤比移動硬碟能放更多的數據。
2.資料庫是如何存放數據的?
資料庫有很多種類,這里我們重點學習使用最廣泛的關系資料庫。
關系資料庫是由多個表組成的。如果你用過Excel,就會知道Excel是一張一張的二維表。每個表都是由行和列組成的。
同樣的,關系資料庫里存放的也是一張一張的表,只不過各個表之間是有聯系的。所以,簡單來說:
關系資料庫=多張表+各表之間的關系
應的,學會關系資料庫我們只要掌握兩點就可以:
1)多張表裡面,每一張表的結構
2)各表之間的關系
我們接下來分別來看看這兩個知識點。
1) 表的結構
表的結構是指要了解關系資料庫中每張表長什麼樣。
每個表由一個名字標識。表包含帶有列名的列,和記錄數據的行。我們舉個具體的例子就一目瞭然了。
下面圖片里的表名是:學生表,記錄了每個學生的信息。
表中每一列都有一個名字來標識出該列,這個表裡有4列,列名分別是學號,姓名,出生日期,性別。從列名上你也可以知道這一列對應記錄的是什麼數據。
表的每一行里記錄著數據。這里的一行表示該名學生的信息,比如第2行是學號0002學生的信息,他的姓名是猴子,出生日期是1990-12-21,性別是女。
2)各表之間的關系
關系資料庫是由多張表組成的,圖片里是存放在學校資料庫里的4張表。
你能發現下面這4張表之間有什麼關系嗎?
什麼是關系呢?
你是你爸爸的兒子,你是你的兒子的爸爸,這就是生活中的關系。其實,數據之間也是有關系的。關系資料庫里各個表之間如何建立起關系呢?
我們來看圖中「學生表」,「成績表」這兩個表之前的關系。
這兩張表通過」學號」關聯起來,為了更清楚的看到這兩個表的關系,PPT里我用相同顏色代表同一個學生的信息。
例如我想知道學生表裡學號「0001」 的成績是多少?那麼我就可以在成績表裡去查找「學號」值是0001的行,最後在成績表裡發現有3行數據的學號都是「0001」 ,對應的就找到了該學生的三門課程的成績。
通過這個例子你應該對表之間的關系有了大概的了解。關系就是數據能夠對應的匹配,在關系資料庫中正式名稱叫聯結,對應的英文名稱叫做join。
聯結是關系型資料庫中的核心概念,務必記住這個概念,後面會在多表查詢中具體學到。
3.什麼是資料庫管理系統?
前面講的都是關系資料庫原理方面的基本理論。理論有了,當然的就的有對應的軟體實現才能用起來,不然再強大的理論都是一堆無用的東東。這就好比,建築師如果只有設計草圖是無法蓋起樓房的,得有具體的建築人員才能蓋起樓房。
所以,上面講的關系資料庫原理就是「設計草圖」,那麼對應的「建築人員」是誰呢?
實現資料庫原理的「建築人員」就是資料庫管理系統,用來管理資料庫的計算機軟體。
關系資料庫管理系統有很多種,比如Mysql、Oracle、SQL Server等都是實現上面理論的關系資料庫。
4.什麼是sql?
建築施工人員通過使鏟子,拉土機等工具來蓋房子。
那麼,我們通過什麼工具來操作資料庫里的數據呢?
這個工具就是SQL。
SQL是為操作資料庫而開發的一種語言,它可以對資料庫里的表進行操作,比如修改數據,查找數據。
之前我在社群里舉過一個例子,我覺得可以很好的說明白資料庫和sql是什麼關系。
把資料庫比如一碗米飯,裡面放的米是數據。現在我們要吃碗里的米飯,怎麼取出碗里的米飯呢?
這時候我們拿一雙筷子,用筷子操作碗里的米飯。這里的筷子就是SQL,用來操作資料庫里的數據。
5.總結
1)什麼是資料庫?
資料庫用於存放數據,
關系資料庫=多張表+各表之間的關系
2)關系資料庫表長什麼樣?
關系資料庫中每個表由一個名字標識。表包含帶有列名的列,和記錄數據的行。
主鍵是關系資料庫中重要的概念,用來標識數據的唯一性。
3)關系資料庫里各個表之間如何建立聯系呢?
關系資料庫中,如果一張表要關聯其他表,通過對應的列產生了關系。這個關系叫做聯結。
4)什麼是關系資料庫管理系統?
實現資料庫原理的「施工團隊」就是,用來管理資料庫的計算機軟體叫做資料庫管理系統。
常用的關系資料庫管理系統有mysql,orcale,sql server為了方便描述,我們後面說到資料庫,都是指資料庫管理系統。
5)什麼是SQL?
資料庫裡面放著數據,SQL是用來操作資料庫里數據的工具。
現在我們可以理解支付寶的背後的運行原理了,用戶把錢存放到支付寶資料庫里,當用戶查看支付寶余額的時候,後台使用SQL這個工具操作支付寶的資料庫,把裡面的數據查找出來,然後返回給用戶,這樣用戶就可以看到存放到支付寶里的錢和每天的收益了。
❸ 服裝設計有哪些資料庫
你的意思我不太了解,但據我所知是沒有的情況下:服裝設計的藝術和技術技能,是不是你的。首先,我將探討在什麼樣的服裝設計。
一般的服裝設計,服裝設計,從概念草圖到成品的全過程,是服裝設計的過程中,服裝設計是一家服裝廠的縮影,一般有以下幾個方面:1創意設計(包括款式設計,面料設計,色彩設計,服飾配件設計,創意設計效果圖在服裝的形式體現); 2,結構設計(也被稱為紙樣製作,服裝製版,或版本的設計,是反映的格局形式); 3,工藝設計(包括停車位,熱工,裁床,後整個過程的工作)。服裝設計的資料庫有:1,人庫,樣式庫; 3,面料庫,4色庫,服裝配件庫; 6,該版本的類型庫;切庫; 8,無庫;技術庫。
但是,服裝設計有不同的側重點,
其實,對服裝設計的專業,問題的關鍵是實用性主要體現在服裝及衣著技術上面,同時服裝設計服裝技術是一個相對簡單的,直觀的,但服裝的結構是比較復雜的,服裝結構設計職業生涯是一個需要不斷挑戰,要靈活,工作或研究時,通常??需要合適的充電能力和渠道,通過一些比較實用的專業書籍系統自身的知識,以更大的突破。推薦的老師高鴻服裝結構設計及其應用「的入門書籍,實用為主??139元如果這本書可以消化,,服裝工廠模式大全可以做一個更好的整合也139元。貴在實用,這本書很容易理解表達的原則,結合大量企業實例(這是類似的書,一般不會有和沒有大學教科書),後用正規的學習,以及今後的工作有更實際的幫助。詳細介紹你上網路這些書的理解,也可以參加高鴻老師的「服裝紙樣師輔導網路班」(網路的服裝紙樣老師輔導網路類的「直接去的過程YY教育)時裝設計一個更直觀的了解,並能在學習過程中,如何把握關鍵點,以供參考。
❹ 簡述一個資料庫應用系統的建立過程
資料庫建立過程包括六個主要步驟:
1.需求分析:了解用戶的數據需求、處理需求、安全和完整性需求。
2.概念設計:通過數據抽象,設計系統的概念模型,一般為e-r模型。
3.邏輯結構設計:設計系統的模式和外部模式,特別是關系模型的基本表和視圖。
4.物理結構設計:設計數據的存儲結構和訪問方法,如索引的設計。
5.系統實現:組織數據存儲,編寫應用程序,試運行。
6.運維:系統投入運行,進行長期維護。
(4)資料庫草圖擴展閱讀:
資料庫設計技巧:
1.原始文檔與實體之間的關系
它可以是一對一、一對多、多對多。一般來說,它們是一對一的關系:也就是說,原始文檔只對應於一個實體,而且只對應於一個實體。在特殊情況下,它們可能是一對多或多對一的,其中一個原始文檔對應多個實體,或者多個原始文檔對應一個實體。
這里的實體可以理解為基本表。在明確了這些對應關系之後,這對於輸入介面的設計是非常有益的。
2.主鍵和外鍵
通常,實體不能同時沒有主鍵和外鍵。在e-r關系圖中,葉中的實體可以定義主鍵,也可以不定義主鍵(因為它沒有後代),但是它必須有外鍵(因為它有父鍵)。
主鍵和外鍵的設計在全局資料庫的設計中起著重要的作用。當全球資料庫的設計完成後,一位美國的資料庫設計專家說:「鑰匙,鑰匙無處不在,只有鑰匙」,這是他的資料庫設計經驗,也是他高度抽象的信息系統核心思想(數據模型)的體現。
因為:主鍵是實體的高度抽象,主鍵和外鍵對,表示實體之間的連接。
3.基本表的屬性
基表不同於中間表和臨時表,因為它有以下四個特點:
原子性。基表中的欄位沒有分解。
原始性。基表中的記錄是原始數據(底層數據)的記錄。
先驗性。所有輸出數據都可以從基表和代碼表中的數據派生出來。
穩定。表的基本結構比較穩定,表中的記錄保存時間較長。
一旦理解了基本表的性質,就可以在設計資料庫時將它們與中間表和臨時表區分開。
❺ 資料庫如何設計
資料庫設計的基本步驟
按照規范設計的方法,考慮資料庫及其應用系統開發全過程,將資料庫設計分為以下6個階段
1.需求分析
2.概念結構設計
3.邏輯結構設計
4.物理結構設計
5.資料庫實施
6.資料庫的運行和維護
資料庫設計通常分為6個階段1分析用戶的需求,包括數據、功能和性能需求;2概念結構設計:主要採用E-R模型進行設計,包括畫E-R圖;3邏輯結構設計:通過將轉換成表,實現從E-R模型到關系模型的轉換;4:主要是為所設計的資料庫選擇合適的和存取路徑;5資料庫的實施:包括編程、測試和試運行;6資料庫運行與維護:系統的運行與資料庫的日常維護。),主要討論其中的第3個階段,即邏輯設計。
在資料庫設計過程中,需求分析和概念設計可以獨立於任何資料庫管理系統進行,邏輯設計和物理設計與選用的DAMS密切相關。
1.需求分析階段(常用自頂向下)
進行資料庫設計首先必須准確了解和分析用戶需求(包括數據與處理)。需求分析是整個設計過程的基礎,也是最困難,最耗時的一步。需求分析是否做得充分和准確,決定了在其上構建資料庫大廈的速度與質量。需求分析做的不好,會導致整個資料庫設計返工重做。
需求分析的任務,是通過詳細調查現實世界要處理的對象,充分了解原系統工作概況,明確用戶的各種需求,然後在此基礎上確定新的系統功能,新系統還得充分考慮今後可能的擴充與改變,不僅僅能夠按當前應用需求來設計。
調查的重點是,數據與處理。達到信息要求,處理要求,安全性和完整性要求。
分析方法常用SA(Structured Analysis) 結構化分析方法,SA方法從最上層的系統組織結構入手,採用自頂向下,逐層分解的方式分析系統。
數據流圖表達了數據和處理過程的關系,在SA方法中,處理過程的處理邏輯常常藉助判定表或判定樹來描述。在處理功能逐步分解的同事,系統中的數據也逐級分解,形成若干層次的數據流圖。系統中的數據則藉助數據字典(data dictionary,DD)來描述。數據字典是系統中各類數據描述的集合,數據字典通常包括數據項,數據結構,數據流,數據存儲,和處理過程5個階段。
2.概念結構設計階段(常用自底向上)
概念結構設計是整個資料庫設計的關鍵,它通過對用戶需求進行綜合,歸納與抽象,形成了一個獨立於具體DBMS的概念模型。
設計概念結構通常有四類方法:
自頂向下。即首先定義全局概念結構的框架,再逐步細化。
自底向上。即首先定義各局部應用的概念結構,然後再將他們集成起來,得到全局概念結構。
逐步擴張。首先定義最重要的核心概念結構,然後向外擴張,以滾雪球的方式逐步生成其他的概念結構,直至總體概念結構。
混合策略。即自頂向下和自底向上相結合。
- 需要注意:
- ● 在確定支持數據時,請一定要參考你之前所確定的宏觀行為,以清楚如何利用這些數據。
- ● 比如,如果你知道你需要所有員工的按姓氏排序的列表,確保你將支持數據分解為名字與姓氏,這比簡單地提供一個名字會更好。
- ● 你所選擇的名稱最好保持一致性。這將更易於維護資料庫,也更易於閱讀所輸出的報表。
- ● 比如,如果你在某些地方用了一個縮寫名稱Emp_status,你就不應該在另外一個地方使用全名(Empolyee_ID)。相反,這些名稱應當是Emp_status及Emp_id。
- ● 數據是否與正確的table相對應無關緊要,你可以根據自己的喜好來定。在下節中,你會通過測試對此作出判斷。
3.邏輯結構設計階段(E-R圖)
邏輯結構設計是將概念結構轉換為某個DBMS所支持的數據模型,並將進行優化。
在這階段,E-R圖顯得異常重要。大家要學會各個實體定義的屬性來畫出總體的E-R圖。
各分E-R圖之間的沖突主要有三類:屬性沖突,命名沖突,和結構沖突。
E-R圖向關系模型的轉換,要解決的問題是如何將實體性和實體間的聯系轉換為關系模式,如何確定這些關系模式的屬性和碼。
4.物理設計階段
物理設計是為邏輯數據結構模型選取一個最適合應用環境的物理結構(包括存儲結構和存取方法)。
首先要對運行的事務詳細分析,獲得選擇物理資料庫設計所需要的參數,其次,要充分了解所用的RDBMS的內部特徵,特別是系統提供的存取方法和存儲結構。
常用的存取方法有三類:1.索引方法,目前主要是B+樹索引方法。2.聚簇方法(Clustering)方法。3.是HASH方法。
5.資料庫實施階段
資料庫實施階段,設計人員運營DBMS提供的資料庫語言(如sql)及其宿主語言,根據邏輯設計和物理設計的結果建立資料庫,編制和調試應用程序,組織數據入庫,並進行試運行。
6.資料庫運行和維護階段
資料庫應用系統經過試運行後,即可投入正式運行,在資料庫系統運行過程中必須不斷地對其進行評價,調整,修改。
資料庫設計5步驟
Five Steps to design the Database
1.確定entities及relationships
a)明確宏觀行為。資料庫是用來做什麼的?比如,管理雇員的信息。
b)確定entities。對於一系列的行為,確定所管理信息所涉及到的主題范圍。這將變成table。比如,僱用員工,指定具體部門,確定技能等級。
c)確定relationships。分析行為,確定tables之間有何種關系。比如,部門與雇員之間存在一種關系。給這種關系命名。
d)細化行為。從宏觀行為開始,現在仔細檢查這些行為,看有哪些行為能轉為微觀行為。比如,管理雇員的信息可細化為:
· 增加新員工
· 修改存在員工信息
· 刪除調走的員工
e)確定業務規則。分析業務規則,確定你要採取哪種。比如,可能有這樣一種規則,一個部門有且只能有一個部門領導。這些規則將被設計到資料庫的結構中。
====================================================================
範例:
ACME是一個小公司,在5個地方都設有辦事處。當前,有75名員工。公司准備快速擴大規模,劃分了9個部門,每個部門都有其領導。
為有助於尋求新的員工,人事部門規劃了68種技能,為將來人事管理作好准備。員工被招進時,每一種技能的專業等級都被確定。
定義宏觀行為
一些ACME公司的宏觀行為包括:
● 招聘員工
● 解僱員工
● 管理員工個人信息
● 管理公司所需的技能信息
● 管理哪位員工有哪些技能
● 管理部門信息
● 管理辦事處信息
確定entities及relationships
我們可以確定要存放信息的主題領域(表)及其關系,並創建一個基於宏觀行為及描述的圖表。
我們用方框來代表table,用菱形代表relationship。我們可以確定哪些relationship是一對多,一對一,及多對多。
這是一個E-R草圖,以後會細化。
細化宏觀行為
以下微觀行為基於上面宏觀行為而形成:
● 增加或刪除一個員工
● 增加或刪除一個辦事處
● 列出一個部門中的所有員工
● 增加一項技能
● 增加一個員工的一項技能
● 確定一個員工的技能
● 確定一個員工每項技能的等級
● 確定所有擁有相同等級的某項技能的員工
● 修改員工的技能等級
這些微觀行為可用來確定需要哪些table或relationship。
確定業務規則
業務規則常用於確定一對多,一對一,及多對多關系。
相關的業務規則可能有:
● 現在有5個辦事處;最多允許擴展到10個。
● 員工可以改變部門或辦事處
● 每個部門有一個部門領導
● 每個辦事處至多有3個電話號碼
● 每個電話號碼有一個或多個擴展
● 員工被招進時,每一種技能的專業等級都被確定。
● 每位員工擁有3到20個技能
● 某位員工可能被安排在一個辦事處,也可能不安排辦事處。
2.確定所需數據
要確定所需數據:
a)確定支持數據
b)列出所要跟蹤的所有數據。描述table(主題)的數據回答這些問題:誰,什麼,哪裡,何時,以及為什麼
c)為每個table建立數據
d)列出每個table目前看起來合適的可用數據
e)為每個relationship設置數據
f)如果有,為每個relationship列出適用的數據
確定支持數據
你所確定的支持數據將會成為table中的欄位名。比如,下列數據將適用於表Employee,表Skill,表Expert In。
Employee
Skill
Expert In
ID
ID
Level
Last Name
Name
Date acquired
First Name
Description
Department
Office
Address
如果將這些數據畫成圖表,就像:
3.標准化數據
標准化是你用以消除數據冗餘及確保數據與正確的table或relationship相關聯的一系列測試。共有5個測試。本節中,我們將討論經常使用的3個。
關於標准化測試的更多信息,請參考有關資料庫設計的書籍。
標准化格式
標准化格式是標准化數據的常用測試方式。你的數據通過第一遍測試後,就被認為是達到第一標准化格式;通過第二遍測試,達到第二標准化格式;通過第三遍測試,達到第三標准化格式。
如何標准格式:
1. 列出數據
2. 為每個表確定至少一個鍵。每個表必須有一個主鍵。
3. 確定relationships的鍵。relationships的鍵是連接兩個表的鍵。
4. 檢查支持數據列表中的計算數據。計算數據通常不保存在資料庫中。
5. 將數據放在第一遍的標准化格式中:
6. 從tables及relationships除去重復的數據。
7. 以你所除去數據創建一個或更多的tables及relationships。
8. 將數據放在第二遍的標准化格式中:
9. 用多於一個以上的鍵確定tables及relationships。
10. 除去只依賴於鍵一部分的數據。
11. 以你所除去數據創建一個或更多的tables及relationships。
12. 將數據放在第三遍的標准化格式中:
13. 除去那些依賴於tables或relationships中其他數據,並且不是鍵的數據。
14. 以你所除去數據創建一個或更多的tables及relationships。
數據與鍵
在你開始標准化(測試數據)前,簡單地列出數據,並為每張表確定一個唯一的主鍵。這個鍵可以由一個欄位或幾個欄位(連鎖鍵)組成。
主鍵是一張表中唯一區分各行的一組欄位。Employee表的主鍵是Employee ID欄位。Works In relationship中的主鍵包括Office Code及Employee ID欄位。給資料庫中每一relationship給出一個鍵,從其所連接的每一個table中抽取其鍵產生。
RelationShip
Key
Office
*Office code
Office address
Phone number
Works in
*Office code
*Employee ID
Department
*Department ID
Department name
Heads
*Department ID
*Employee ID
Assoc with
*Department ID
*EmployeeID
Skill
*Skill ID
Skill name
Skill description
Expert In
*Skill ID
*Employee ID
Skill level
Date acquired
Employee
*Employee ID
Last Name
First Name
Social security number
Employee street
Employee city
Employee state
Employee phone
Date of birth
將數據放在第一遍的標准化格式中
● 除去重復的組
● 要測試第一遍標准化格式,除去重復的組,並將它們放進他們各自的一張表中。
● 在下面的例子中,Phone Number可以重復。(一個工作人員可以有多於一個的電話號碼。)將重復的組除去,創建一個名為Telephone的新表。在Telephone與Office創建一個名為Associated With的relationship。
將數據放在第二遍的標准化格式中
● 除去那些不依賴於整個鍵的數據。
● 只看那些有一個以上鍵的tables及relationships。要測試第二遍標准化格式,除去那些不依賴於整個鍵的任何數據(組成鍵的所有欄位)。
● 在此例中,原Employee表有一個由兩個欄位組成的鍵。一些數據不依賴於整個鍵;例如,department name只依賴於其中一個鍵(Department ID)。因此,Department ID,其他Employee數據並不依賴於它,應移至一個名為Department的新表中,並為Employee及Department建立一個名為Assigned To的relationship。
將數據放在第三遍的標准化格式中
● 除去那些不直接依賴於鍵的數據。
● 要測試第三遍標准化格式,除去那些不是直接依賴於鍵,而是依賴於其他數據的數據。
● 在此例中,原Employee表有依賴於其鍵(Employee ID)的數據。然而,office location及office phone依賴於其他欄位,即Office Code。它們不直接依賴於Employee ID鍵。將這組數據,包括Office Code,移至一個名為Office的新表中,並為Employee及Office建立一個名為Works In的relationship。
4.考量關系
當你完成標准化進程後,你的設計已經差不多完成了。你所需要做的,就是考量關系。
考量帶有數據的關系
你的一些relationship可能集含有數據。這經常發生在多對多的關系中。
遇到這種情況,將relationship轉化為一個table。relationship的鍵依舊成為table中的鍵。
考量沒有數據的關系
要實現沒有數據的關系,你需要定義外部鍵。外部鍵是含有另外一個表中主鍵的一個或多個欄位。外部鍵使你能同時連接多表數據。
有一些基本原則能幫助你決定將這些鍵放在哪裡:
一對多在一對多關系中,「一」中的主鍵放在「多」中。此例中,外部鍵放在Employee表中。
一對一在一對一關系中,外部鍵可以放進任一表中。如果必須要放在某一邊,而不能放在另一邊,應該放在必須的一邊。此例中,外部鍵(Head ID)在Department表中,因為這是必需的。
多對多在多對多關系中,用兩個外部鍵來創建一個新表。已存的舊表通過這個新表來發生聯系。
5.檢驗設計
在你完成設計之前,你需要確保它滿足你的需要。檢查你在一開始時所定義的行為,確認你可以獲取行為所需要的所有數據:
● 你能找到一個路徑來等到你所需要的所有信息嗎?
● 設計是否滿足了你的需要?
● 所有需要的數據都可用嗎?
如果你對以上的問題都回答是,你已經差不多完成設計了。
最終設計
最終設計看起來就像這樣:
設計資料庫的表屬性
資料庫設計需要確定有什麼表,每張表有什麼欄位。此節討論如何指定各欄位的屬性。
對於每一欄位,你必須決定欄位名,數據類型及大小,是否允許NULL值,以及你是否希望資料庫限制欄位中所允許的值。
選擇欄位名
欄位名可以是字母、數字或符號的任意組合。然而,如果欄位名包括了字母、數字或下劃線、或並不以字母打頭,或者它是個關鍵字(詳見關鍵字表),那麼當使用欄位名稱時,必須用雙引號括起來。
為欄位選擇數據類型
SQL Anywhere支持的數據類型包括:
整數(int, integer, smallint)
小數(decimal, numeric)
浮點數(float, double)
字元型(char, varchar, long varchar)
二進制數據類型(binary, long binary)
日期/時間類型(date, time, timestamp)
用戶自定義類型
關於數據類型的內容,請參見「SQL Anywhere數據類型」一節。欄位的數據類型影響欄位的最大尺寸。例如,如果你指定SMALLINT,此欄位可以容納32,767的整數。INTEGER可以容納2,147,483,647的整數。對CHAR來講,欄位的最大值必須指定。
長二進制的數據類型可用來在資料庫中保存例如圖像(如點陣圖)或者文字編輯文檔。這些類型的信息通常被稱為二進制大型對象,或者BLOBS。
關於每一數據類型的完整描述,見「SQL Anywhere數據類型」。
❻ 怎樣根據已有分類圖用gis建立資料庫
GIS項目所需的數據是以不同的格式分散存儲在不同的目錄下。為了進行分析,必須找到數據,從中獲得所需要的信息,並將它復制到合適的工作空間中去。使用ArcGIS軟體ArcCatalog,能夠高效地瀏覽和組織所需的數據。 通過組織GIS項目資料庫來存放獲得的或創建的數據。將使用ArcGIS軟體ArcCatalog來預覽和復制數據,創建文件夾來存儲數據,並創建圖層來顯示遠程數據。使用Catalog目錄樹下的一個目錄來組織項目資料庫,可以更容易地找到所需數據。
組織GIS項目資料庫的方法有多種。其中一個較好的方法就是創建一個單獨的project文件夾,然後用其部分子文件夾來存儲輸入數據,用其它子文件夾來存儲分析過程中產生的數據集。
與其他眾多的GIS項目一樣,GIS項目所需數據來自於多種數據源。其中部分數據具有不同的數據格式或不同的坐標系統。大多數數據已經收集好了。下表列出了所使用數據的當前位置。
用戶將復制這些數據(保留原始數據作為備份),將其放到一個單獨的project文件夾,這樣獲取比較方便。還需要創建一個新的文件夾,用以存儲分析過程中產生的數據。
並沒有一個統一的方法構造GIS項目資料庫;選擇什麼樣的方法合適,很大程度上取決於個人偏好。創建的目標是:使數據集的重復最小,數據組織合理,易於訪問。這樣有助於在項目分析過程中以及以後重新查看項目時,避免產生混淆。在硬碟上創建文件夾及移動數據集前,最好畫出project文件夾結構草圖。
City_share、County_share,和State_share文件夾存儲在本地機上,但可以通過網路共享這些文件夾。可以使用ArcGIS來管理和顯示網路中任何共享驅動器上的GIS數據。
用戶還需要考慮如何給新創建的數據集命名,並創建命名規范。使用有意義的名字可以讓我們一看就知道這個數據集的內容是什麼。例如,如果我們合並兩地塊的數據集,可以將新產生的地塊數據集命名為parcel01mrg,以此來表明這是第一個新產生的地塊數據集,並且是通過合並操作得來的。如果隨後編輯數據集,可以將編輯後的數據集命名為parcel02edt,等等。
使用ArcGIS軟體ArcCatalog來復制含有共享文件的文件夾到一個新位置,這樣在復制數據操作時,保持原始數據不變。接下來,創建新的個人資料庫來存儲將要創建的新數據集。另外,還要創建兩個新文件夾:一個用來存儲該城市的GreenvalleyDB地理資料庫的圖層;另一個用來存儲分析過程中產生的新圖層。步驟如下:
1.復制project文件夾;
2.創建與project文件夾的連接;
3.在project文件夾中創建WaterProject個人地理資料庫;
4.在project文件夾中新建City_layers文件夾;
5.在project文件夾中新建Analysis文件夾。
復制project文件夾
project文件夾中包含有其它部門與用戶共享的數據。可以將整個project文件夾復制到本地硬碟中。
1.單擊Start,指向Programs,指向ArcGIS,並單擊ArcCatalog。
2.打開ArcGIS\ArcTutor\Getting_Started文件夾,雙擊該文件夾,查看其內容。
3.單擊project文件夾,然後按住Ctrl鍵,將文件夾從當前位置拖放到本地硬碟C盤,或其它分區或文件夾。
把文件夾拖到另一驅動器(如從C盤拖到D盤),將把該文件夾及其內容復制到新位置。如果在同一驅動器拖動文件夾到一個新位置,只是移動文件夾。要在同一驅動器里復制文件夾,在拖動文件夾的同時,按住Ctrl鍵即可。
4.ArcGIS復制完數據後,在Catalog目錄樹中單擊C:\ ,在Catalog窗口右邊查看C:\中的內容。
可以看到project文件夾在列表中。
現在,已經復制了project文件夾,就可以在不改變原始數據情況下對復制數據進行操作。
建立與project文件夾的連接
如果在一個驅動器上有許多文件夾,用滑鼠拖動滾動條來找到某個文件夾會非常繁瑣。建立文件夾的一個連接會很方便。下面為project文件夾創建一個連接。
1.在教程中,我們通過單擊Connect to Folder建立文件夾的連接並瀏覽該文件夾,下面介紹一個快速方法:
2.單擊List按鈕 ,指向Catalog窗口右邊的project文件夾(需選擇contents選項);
3.單擊project文件夾並拖放到位於Catalog目錄樹頂部的Catalog目錄中;
新的C:\project文件夾連接就顯示在Catalog目錄樹中了。
這個連接是project文件夾的一個快捷方式。在下面的項目分析中,我們可以使用這個連接訪問project文件夾的數據。
創建個人地理資料庫
接下來,我們將在project文件夾中創建一個個人地理資料庫來存儲更新的和項目過程中新創建的數據集。使用地理資料庫是存儲、獲取和管理數據的一種有效方法。
1.單擊剛才創建的project文件夾連接,在Catalog右邊的窗口查看其內容。
2.右鍵單擊project文件夾連接,指向New,然後單擊Personal Geodatabase。
如果正在使用ArcInfo,可以看到其他選項。
在Catalog窗口的右邊列出了新的地理資料庫,並高亮顯示其名稱(New Personal Geodatabase)。
3. 在高亮顯示的文本上,重命名資料庫為「WaterProject」,並按Enter鍵。
創建City_layers文件夾和Analysis文件夾
現在我們要在project文件夾下創建兩個新的文件夾,用來存儲該城市的GreenvalleyDB地理資料庫中的圖層以及在分析過程產生的新的圖層。
1. 右擊project文件夾,指向New,單擊Folder。
在Catalog窗口的右邊,列出了高亮顯示文件名為New Folder的新文件夾。
2. 在高亮顯示的文本上,鍵入「City_layers」重命名該文件夾。按Enter鍵。
以同樣的方式創建Analysis文件夾。
3. 右擊project文件夾,指向New,單擊Folder,重命名文件夾為「Analysis」。
如果新文件夾的位置錯誤或名字拼寫錯誤,只需右擊該文件夾,單擊Delete或Rename,然後重新開始。
❼ 怎樣做access構建小網站資料庫步驟哦
1、和客戶溝通,確定網站類型及要表現的主題內容欄目
2、用筆在草稿紙上話出大概布局設計圖
3、根據草圖,搜集資料開始PS網站
4、規劃網站目錄,使用DIV思想在PS中切圖
5、邊切邊使用DIV思想製作HTML靜態頁面,最好能在不同瀏覽器中同時預覽調試HTML
6、分析網站功能,畫出流程圖,規劃資料庫中的數據表,注意表與表之間的關系
7、大部分情況下,首頁都會