當前位置:首頁 » 操作系統 » UDB演算法

UDB演算法

發布時間: 2022-09-09 02:43:25

『壹』 請問用軟體做倉庫管理發展前途怎麼樣

數據倉庫技術和前景發展現狀
----計算機系統的功能從數值計算擴展到數據管理距今已有三十多年了。最初的數據管理形式主要是文件系統,少量的以數據片段之間增加一些關聯和語義而構成層次型或網狀資料庫,但數據的訪問必須依賴於特定的程序,數據的存取方式是固定的、死板的。到了1969年,E.F.Codd博士發表了他著名的關系數據模型的論文。此後,關系資料庫的出現開創了數據管理的一個新時代。
----二十多年來,大量新技術、新思路涌現出來並被用於關系資料庫系統的開發和實現:客戶/伺服器體系結構、存儲過程、多線索並發內核、非同步I/O、代價優化,等等,這一切足以使得關系資料庫系統的處理能力毫不遜色於傳統封閉的資料庫系統。而關系資料庫在訪問邏輯和應用上所帶來的好處則遠遠不止這些,SQL的使用已成為一個不可阻擋的潮流,加上近些年來計算機硬體的處理能力呈數量級的遞增,關系資料庫最終成為聯機事務處理系統的主宰。整個80年代直到90年代初,聯機事務處理一直是資料庫應用的主流。然而,應用在不斷地進步。當聯機事務處理系統應用到一定階段的時候,企業家們便發現單靠擁有聯機事務處理系統已經不足以獲得市場競爭的優勢,他們需要對其自身業務的運作以及整個市場相關行業的態勢進行分析,而做出有利的決策。這種決策需要對大量的業務數據包括歷史業務數據進行分析才能得到。在如今這樣激烈的市場競爭環境下,這種基於業務數據的決策分析,我們把它稱之為聯機分析處理,比以往任何時候都顯得更為重要。如果說傳統聯機事務處理強調的是更新資料庫--向資料庫中添加信息,那麼聯機分析處理就是從資料庫中獲取信息、利用信息。因此,著名的數據倉庫專家RalphKimball寫道:「我們花了二十多年的時間將數據放入資料庫,如今是該將它們拿出來的時候了。」
----事實上,將大量的業務數據應用於分析和統計原本是一個非常簡單和自然的想法。但在實際的操作中,人們卻發現要獲得有用的信息並非如想像的那麼容易:第一,所有聯機事務處理強調的是密集的數據更新處理性能和系統的可靠性,並不關心數據查詢的方便與快捷。聯機分析和事務處理對系統的要求不同,同一個資料庫在理論上都難以做到兩全;第二,業務數據往往被存放於分散的異構環境中,不易統一查詢訪問,而且還有大量的歷史數據處於離線狀態,形同虛設;第三,業務數據的模式針對事務處理系統而設計,數據的格式和描述方式並不適合非計算機專業人員進行業務上的分析和統計。因此有人感嘆:20年前查詢不到數據是因為數據太少了,而今天查詢不到數據是因為數據太多了。針對這一問題,人們設想專門為業務的統計分析建立一個數據中心,它的數據從聯機的事務處理系統中來、從異構的外部數據源來、從離線的歷史業務數據中來……這個數據中心是一個聯機的系統,它是專門為分析統計和決策支持應用服務的,通過它可滿足決策支持和聯機分析應用所要求的一切。這個數據中心就叫做數據倉庫。這個概念在90年代初被提出來,如果需要給數據倉庫一個定義的話,那麼數據倉庫就是一個作為決策支持系統和聯機分析應用數據源的結構化數據環境。數據倉庫所要研究和解決的問題就是從資料庫中獲取信息的問題。
----那麼數據倉庫與資料庫(主要指關系資料庫)又是什麼關系呢?回想當初,人們固守封閉式系統是出於對事務處理的偏愛,人們選擇關系資料庫是為了方便地獲得信息。我們只要翻開C.J.Date博士的經典之作《AnIntroctiontoDatabaseSystems》便會發現:今天數據倉庫所要提供的正是當年關系資料庫要所倡導的。然而,「成也蕭何、敗也蕭何」,由於關系資料庫系統在聯機事務處理應用中獲得的巨大成功,使得人們已不知不覺將它劃歸事務處理的范疇;過多地關注於事務處理能力的提高,使得關系資料庫在面對聯機分析應用時又顯得「老革命遇到新問題」--今天的數據倉庫對關系資料庫的聯機分析能力提出了更高的要求,採用普通關系型資料庫作為數據倉庫在功能和性能上都是不夠的,它們必須有專門的改進。因此,數據倉庫與資料庫的區別不僅僅表現在應用的方法和目的方面,同時也涉及到產品和配置上的不同。
----以辨證的眼光來看,數據倉庫的興起實際上是數據管理的一種回歸,是螺旋式的上升。今天的資料庫就好比當年的層次資料庫和網型資料庫,它們面向事務處理;今天的數據倉庫就好比是當年的關系資料庫,它針對聯機分析。所不同的是,今天的數據倉庫不必再為聯機事務處理的特性而無謂奔忙,由於技術的專業化,它可更專心於聯機分析領域的發展和探索。
----從廠商的角度看,經過長期發展,聯機事務處理系統的市場至90年代中期出現飽和跡象,其增長速度明顯減慢。這導致各大資料庫廠商的傳統業務增長面臨嚴峻挑戰,尋求新的業務增長點成為他們的當務之急。數據倉庫的興起無疑為資料庫產品創造了巨大的市場,它將成為本世紀末到下世紀初資料庫市場的一個新的增長點。因此,數據倉庫的概念一開始便伴隨著濃烈的市場炒作。對於廣大用戶來說,只有從自身應用需求出發,破除技術和概念的神秘性,避虛就實,密切關注技術發展的方向,方可獲得滿意的產品、解決方案和經濟效益。
----數據倉庫的概念一經出現,就首先被應用於金融、電信、保險等主要傳統數據處理密集型行業。國外許多大型的數據倉庫在1996~1997年建立。那麼,什麼樣的行業最需要和可能建立數據倉庫呢?有兩個基本條件:第一,該行業有較為成熟的聯機事務處理系統,它為數據倉庫提供客觀條件;第二,該行業面臨市場競爭的壓力,它為數據倉庫的建立提供外在的動力。
數據倉庫的關鍵技術
----那麼,數據倉庫都有哪些組成部分和關鍵技術呢?與關系資料庫不同,數據倉庫並沒有嚴格的數學理論基礎,它更偏向於工程。由於數據倉庫的這種工程性,因而在技術上可以根據它的工作過程分為:數據的抽取、存儲和管理、數據的表現以及數據倉庫設計的技術咨詢四個方面。在此,我們將分別討論每一個環節。
----1.數據的抽取
----數據的抽取是數據進入倉庫的入口。由於數據倉庫是一個獨立的數據環境,它需要通過抽取過程將數據從聯機事務處理系統、外部數據源、離線的數據存儲介質中導入數據倉庫。數據抽取在技術上主要涉及互連、復制、增量、轉換、調度和監控等幾個方面。數據倉庫的數據並不要求與聯機事務處理系統保持實時的同步,因此數據抽取可以定時進行,但多個抽取操作執行的時間、相互的順序、成敗對數據倉庫中信息的有效性則至關重要。
----在技術發展上,數據抽取所涉及的單個技術環節都已相對成熟,其中有一些是躲不開編程的,但整體的集成度還很不夠。目前市面上所提供的大多是數據抽取工具。這些工具通過用戶選定源數據和目標數據的對應關系,會自動生成數據抽取的代碼。但抽取工具支持的數據種類是有限的;同時數據抽取過程涉及數據的轉換,它是一個與實際應用密切相關的部分,其復雜性使得不可嵌入用戶編程的抽取工具往往不能滿足要求。因此,實際的數據倉庫實施過程中往往不一定使用抽取工具。整個抽取過程能否因工具的使用而納入有效的管理、調度和維護則更為重要。從市場發展來看,以數據抽取、異構互連產品為主項的數據倉庫廠商一般都很有可能被其他擁有資料庫產品的公司吞並。在數據倉庫的世界裡,它們只能成為輔助的角色。
----2.存儲和管理
----數據倉庫的真正關鍵是數據的存儲和管理。數據倉庫的組織管理方式決定了它有別於傳統資料庫的特性,同時也決定了其對外部數據表現形式。要決定採用什麼產品和技術來建立數據倉庫核心,則需要從數據倉庫的技術特點著手分析。
----數據倉庫遇到的第一個問題是對大量數據的存儲和管理。這里所涉及的數據量比傳統事務處理大得多,且隨時間的推移而累積。從現有技術和產品來看,只有關系資料庫系統能夠擔當此任。關系資料庫經過近30年的發展,在數據存儲和管理方面已經非常成熟,非其他數據管理系統可比。目前不少關系資料庫系統已支持數據分割技術,能夠將一個大的資料庫表分散在多個物理存儲設備中,進一步增強了系統管理大數據量的擴展能力。採用關系資料庫管理數百個GB甚至到TB的數據已是一件平常的事情。一些廠商還專門考慮大數據量的系統備份問題,好在數據倉庫對聯機備份的要求並不高。
----數據倉庫要解決的第二個問題是並行處理。在傳統聯機事務處理應用中,用戶訪問系統的特點是短小而密集;對於一個多處理機系統來說,能夠將用戶的請求進行均衡分擔是關鍵,這便是並發操作。而在數據倉庫系統中,用戶訪問系統的特點是龐大而稀疏,每一個查詢和統計都很復雜,但訪問的頻率並不是很高。此時系統需要有能力將所有的處理機調動起來為這一個復雜的查詢請求服務,將該請求並行處理。因此,並行處理技術在數據倉庫中比以往更加重要。大家可以注意一下,在針對數據倉庫的TPC-D基準測試中,比以往增加了一個單用戶環境的測試,稱為「系統功力」(QppD)。系統的並行處理能力對QppD的值有重要影響。目前,關系資料庫系統在並行處理方面已能做到對查詢語句的分解並行、基於數據分割的並行、以及支持跨平台多處理機的群集環境和MPP環境,能夠支持多達上百個處理機的硬體系統並保持性能的擴展能力。

----數據倉庫的第三個問題是針對決策支持查詢的優化。這個問題主要針對關系資料庫而言,因為其他數據管理環境連基本的通用查詢能力還不完善。在技術上,針對決策支持的優化涉及資料庫系統的索引機制、查詢優化器、連接策略、數據排序和采樣等諸多部分。普通關系資料庫採用B樹類的索引,對於性別、年齡、地區等具有大量重復值的欄位幾乎沒有效果。而擴充的關系資料庫則引入了點陣圖索引的機制,以二進制位表示欄位的狀態,將查詢過程變為篩選過程,單個計算機的基本操作便可篩選多條記錄。由於數據倉庫中各數據表的數據量往往極不均勻,普通查詢優化器所得出的最佳查詢路徑可能不是最優的。因此,面向決策支持的關系資料庫在查詢優化器上也做了改進,同時根據索引的使用特性增加了多重索引掃描的能力。以關系資料庫建立的數據倉庫在應用時會遇到大量的表間連接操作,而連接操作對於關系資料庫來說是一件耗時的事兒。擴充的關系庫中對連接操作可以做預先的定義,我們稱之為連接索引,使得資料庫在執行查詢時可直接獲取數據而不必實施具體的連接操作。數據倉庫的查詢常常只需要資料庫中的部分記錄,如最大的前50家客戶,等等。普通關系資料庫沒有提供這樣的查詢能力,只好將整個表的記錄進行排序,從而耗費了大量的時間。決策支持的關系資料庫在此做了改進,提供了這一功能。此外,數據倉庫的查詢並不需要像事務處理系統那樣精確,但在大容量數據環境中需要有足夠短的系統相應時間。因此,一些資料庫系統增加了采樣數據的查詢能力,在精確度允許的范圍內,大幅度提高系統查詢效率。總之,將普通關系資料庫改造成適合擔當數據倉庫的伺服器有許多工作可以做,它已成為關系資料庫技術的一個重要研究課題和發展方向。可見,對於決策支持的擴充是傳統關系資料庫進入數據倉庫市場的重要技術措施。
----數據倉庫的第四個問題是支持多維分析的查詢模式,這也是關系資料庫在數據倉庫領域遇到的最嚴峻的挑戰之一。用戶在使用數據倉庫時的訪問方式與傳統關系資料庫有很大的不同。對於數據倉庫的訪問往往不是簡單的表和記錄的查詢,而是基於用戶業務的分析模式,即聯機分析。如附圖所示,它的特點是將數據想像成多維的立方體,用戶的查詢便相當於在其中的部分維(棱)上施加條件,對立方體進行切片、分割,得到的結果則是數值的矩陣或向量,並將其製成圖表或輸入數理統計的演算法

----關系資料庫本身沒有提供這種多維分析的查詢功能,而且在數據倉庫發展的早期,人們發現採用關系資料庫去實現這種多維查詢模式非常低效、查詢處理的過程也難以自動化。為此,人們提出了多維資料庫的概念。多維資料庫是一種以多維數據存儲形式來組織數據的數據管理系統,它不是關系型資料庫,在使用時需要將數據從關系資料庫中轉載到多維資料庫中方可訪問。採用多維資料庫實現的聯機分析應用我們稱之為MOLAP。多維資料庫在針對小型的多維分析應用有較好的效果,但它缺少關系資料庫所擁有的並行處理及大規模數據管理擴展性,因此難以承擔大型數據倉庫應用。這樣的狀態直到「星型模式」在關系資料庫設計中得到廣泛應用才徹底改變。幾年前,數據倉庫專家們發現,關系資料庫若採用「星型模式」來組織數據就能很好地解決多維分析的問題。「星型模式」只不過是資料庫設計中數據表之間的一種關聯形式,它的巧妙之處在於能夠找到一個固定的演算法,將用戶的多維查詢請求轉換成針對該數據模式的標准SQL語句,而且該語句是最優化的。「星型模式」的應用為關系資料庫在數據倉庫領域大開綠燈。採用關系資料庫實現的聯機分析應用稱為ROLAP。目前,大多數廠商提供的數據倉庫解決方案都採用ROLAP。
----在數據倉庫的數據存儲管理領域,從當今的技術發展來看,面向決策支持擴充的並行關系資料庫將是數據倉庫的核心。在市場上,資料庫廠商將成為數據倉庫的中堅力量。
----3.數據的表現
----數據表現是數據倉庫的門面。這是一個工具廠商的天下。它們主要集中在多維分析、數理統計和數據挖掘方面。
----多維分析是數據倉庫的重要表現形式,由於MOLAP系統是專用的,因此,關於多維分析領域的工具和產品大多是ROLAP工具。這些產品近兩年來更加註重提供基於Web的前端聯機分析界面,而不僅僅是網上數據的發布。
----數理統計原本與數據倉庫沒有直接的聯系,但在實際的應用中,客戶需要通過對數據的統計來驗證他們對某些事物的假設,以進行決策。與數理統計相似,數據挖掘與數據倉庫也沒有直接聯系。而且這個概念在現實中有些含混。數據挖掘強調的不僅僅是驗證人們對數據特性的假設,而且它更要主動地尋找並發現蘊藏在數據之中的規律。這聽起來雖然很吸引人,但在實現上卻有很大的出入。市場上許多數據挖掘工具其實不過是數理統計的應用。它們並不是真正尋找出數據的規律,而是驗證盡可能多的假設,其中包括許多毫無意義的組合,最後由人來判斷其合理性。因此,在當前的數據倉庫應用中,有效地利用數理統計就已經能夠獲得可觀的效益。
----4.數據倉庫設計的技術咨詢
----在數據倉庫的實施過程中,有一些更為基本的問題需要解答。它們包括:數據倉庫提供哪些部門使用?不同的部門怎樣發揮數據倉庫的決策效益?數據倉庫需要存放哪些數據?這些數據以什麼樣的結構存放?數據從哪裡裝載?裝載的頻率多少為合適?需要購置哪些數據管理的產品和工具來建立數據倉庫?等等。這些問題依賴於特定的數據倉庫系統,屬於技術咨詢的范疇。
----事實上,數據倉庫絕不是簡單的產品堆砌,它是綜合性的解決方案和系統工程。在數據倉庫的實施過程中,技術咨詢服務至關重要,是一個不可缺少的部分,它甚至於比購買產品更為重要。目前,數據倉庫的技術咨詢主要來自數據倉庫軟體產品的供應商和獨立的針對數據倉庫技術的咨詢公司。
主流廠商及產品
----作為數據管理市場的熱點,近年來有很多公司投入數據倉庫市場的角逐。在此,我們將選擇介紹其中一部分廠商。首先,它們是為中國市場所熟悉的,其產品能夠容易買到。其次,我們主要選擇軟體廠商。第三,這些廠商分為兩大類,一類是擁有資料庫產品背景的,它們將是數據倉庫市場的中堅力量;另一類是工具產品廠商,提供數據倉庫解決方案中的外圍工具(在此不多介紹)。
----數據管理類廠商中主要有(字母排序):IBM,Informix,Microsoft,NCR,Oracle,Sybase等。
----■IBM
----作為數據倉庫領域中的一支勁旅,IBM是一家同時擁有硬體和軟體的廠商。在數據倉庫技術領域,IBM最注目的是其SP/2的MPP硬體環境。近年來,它以開放系統管理了大量超過TB容量的數據倉庫。由於封閉的主機系統一時難以成為數據倉庫中心系統的主流,SP/2等開放的MPP環境必然成為主宰。相比之下,IBM的資料庫軟體表現平常,其數據倉庫核心採用的是DB2UniversalServer(簡稱UDB)的ParallelEdition。IBM的優勢在於業界的聲譽、市場份額、硬體系統和咨詢服務。
----■Informix
----Informix是一家專業的資料庫廠商,其關系資料庫伺服器DynamicServer在傳統聯機事務處理應用中始終占據著穩定而廣泛的市場份額。近年來,數據倉庫成為該公司重要的發展領域之一。在數據倉庫技術上,Informix主要關注在這么幾個方面:第一,並行處理的資料庫伺服器。Informix的ExtendedParallelServer(XPS)專為企業級決策支持系統而設計,採用非共享技術支持群集系統和MPP環境,能夠提供近線性的性能擴展能力。第二,在並行關系資料庫的基礎上,Informix增加了針對決策支持操作的擴展。第三,Informix提供了MetaCubeOLAP中間件,以多層客戶/伺服器結構實現ROLAP解決方案,並在其中集成了基於匯總和采樣的查詢優化機制。
----1998年底,著名的數據倉庫供應商RedBrick並入了Informix,增強了它在數據抽取、數據挖掘以及在行業顧問咨詢方面的實力。目前,Informix將數據倉庫看成產品和服務的集合,將整體解決方案命名為DecisionFrontier。
----■Microsoft
----微軟是以其關系資料庫SQLServer作為它數據倉庫核心的。在數據倉庫領域,微軟的計劃是將Plato(一個OLAP伺服器)和DataTransformationServices(數據轉換服務,包括數據抽取、轉換和裝載能力)作為其SQLServer7.0資料庫的免費組成部分。微軟的OLAP走的是ROLAP的路子,與其數據轉換一樣,屬於常規的解決方案;而並行處理和決策支持擴展則不是SQLServer的強項。因此,整個解決方案仍面向中低端,價格取勝是關鍵。
----為此,微軟在數據倉庫市場中倡導了另一個概念--數據集市(DataMart)。所謂數據集市就是一個面向部門應用的、小型的數據倉庫;所採用的技術與數據倉庫相似,但存儲的內容更加專題化。對於數據集市這樣的規模,微軟的解決方案便可成為理想的選擇。
----■NCR
----NCR是數據倉庫的先驅之一,具有強大的以業務為中心的顧問咨詢力量,在傳統數據倉庫領域有很大的市場。NCR的數據倉庫產品名為TeradataScalableWarehouse,取超大規模數據之意,面向高端數據倉庫市場。NCR的Teradata並非一個開放的資料庫系統,它專為數據倉庫領域而設計的。但在有關數據倉庫性能的TPC-D測試中,Teradata的表現卻很平常,它需要更多的並行處理機。Teradata運行的平台主要是MPP環境,操作系統也是NCR自己的,直到最近才支持Unix和NT。
----NCR是專注於高端數據倉庫的廠商,其Teradata在大規模系統和數據量下表現良好。但它的解決方案也面臨著挑戰:聯機多維分析是它的弱項。
----■Oracle
----Oracle公司早先在數據倉庫上的研究集中在OLAP多維分析上。數年前,Oracle收購了名為IRI的多維資料庫廠商,推出Express多維資料庫,以MOLAP模式提供了聯機分析的解決方案。隨著近年來ROLAP的解決方案漸漸成為主流,在Oracle最新推出的數據倉庫解決方案--OracleDataMartSuite中Oracle以Oracle8EnterpriseServer為數據倉庫伺服器。
----■Sybase
----早在1994年推廣System10的時候,Sybase便在資料庫的大規模並行聯機備份、數據復制、異構資料庫互連等方面做了大量工作。在核心領域,Sybase專門為MPP環境設計了NavigationServer,與SQLServer配合構成大規模並行處理環境。1995年初,Sybase通過收購ExpressWay,推出了第一個與大型關系資料庫結合的點陣圖索引機制--SybaseIQ。目前,Sybase推出的數據倉庫解決方案名叫SybaseWarehouseStudio,其中有通過SybaseIQ加強的AdaptiveServer,以及Power系列的設計、轉換、OLAP工具。但在實際的應用解決方案中,由於市場的原因,Sybase往往需要借用第三方的工具。
數據倉庫未來發展方向
----數據倉庫是數據管理技術和市場上一個方興未艾的領域,有著良好的發展前景。在此,我們將從技術、應用、市場等幾個方面探討數據倉庫的未來發展。
----數據倉庫技術的發展自然包括數據抽取、存儲管理、數據表現和方法論等方面。在數據抽取方面,未來的技術發展將集中在系統集成化方面。它將互連、轉換、復制、調度、監控納入標准化的統一管理,以適應數據倉庫本身或數據源可能的變化,使系統更便於管理和維護。在數據管理方面,未來的發展將使資料庫廠商明確推出數據倉庫引擎,作為伺服器產品與資料庫伺服器並駕齊驅。在這一方面,帶有決策支持擴展的並行關系資料庫將最具發展潛力。在數據表現方面,數理統計的演算法和功能將普遍集成到聯機分析產品中,同時與Internet/Web技術緊密結合,推出適用於Intranet、終端免維護的數據倉庫訪問前端。在這個方面,按行業應用特徵細化的數據倉庫用戶前端軟體將成為產品作為數據倉庫解決方案的一部分。數據倉庫實現過程的方法論將更加普及,將成為資料庫設計的一個明確分支,成為管理信息系統設計的必備。

----計算機應用發展的數據倉庫傾向是數據倉庫發展的推動力。傳統的聯機事務處理系統並不單獨考慮數據倉庫,但實際應用對數據倉庫所能提供的功能卻早有需求。因此,許多事務處理系統近年來陷入一個兩難的境地:在現有系統上增加有限的聯機分析功能,包括復雜的報表和數據匯總操作;一方面嚴重影響了事務處理聯機性能,另一方面統計分析又因系統結構上的種種限制而不能充分體現。其結果是:應用技術的發展是朝著更加細化,更加專業的方向。在新一代的應用系統中,數據倉庫在一開始便被納入系統設計的考慮,聯機分析應用於普遍的事務處理系統之中。在數據管理上,聯機事務處理和數據倉庫在應用中相對獨立,使聯機事務處理系統本身更加簡潔高效,同時分析統計也更為便利。面向行業的數理統計學向更為普遍的應用發展,並集成到應用系統的數據倉庫解決方案中。它們將立足於數據倉庫提供的豐富信息,更好地為業務決策服務。
----在市場上,我們將從廠商和用戶兩個方面看數據倉庫的發展。對於提供數據倉庫產品和解決方案的廠商來說,嚴酷的市場競爭是永恆的主題。未來的發展將是不提供完整解決方案的廠商可能被其他公司收購,例如從事數據抽取、提供專用工具的軟體公司很可能並入大型資料庫廠商而去構建完整的解決方案。能夠持續發展的廠商大致有兩類:一是擁有強大的資料庫、數據管理背景的公司;二是專門提供面向具體行業的、關於數據倉庫實施的技術咨詢的公司。
----從用戶的角度看,數據管理的傳統領域,如金融、保險、電信等行業中的特定應用,如信用分析、風險分析、欺詐檢測等,是數據倉庫的主要市場之外,數據倉庫的應用隨著現代社會商業模式的變革而進一步普及和深入。近年來,一場悄悄的革命正在改變產品製造和提供服務的方式,它就是數字化定製經濟模式。在這個世界裡,用戶可以購買一台根據自己要求組裝的計算機、一條根據自己體形設計的牛仔褲、一種根據自己身體需要而生產的保健葯、一副與自己臉型相配的眼鏡……,大規模的定製不僅是一種製造過程、後勤系統、或者推銷策略,它很可能成為下一世紀企業生產的組織原則,就像成批生產是本世紀的組織原則一樣。在未來大規模定製經濟環境下,數據倉庫將成為企業獲得競爭優勢的關鍵武器。
----總之,數據倉庫是一項基於數據管理和利用的綜合性技術和解決方案,它將成為資料庫市場的新一輪增長點,同時也成為下一代應用系統的重要組成部分。數據倉庫對於廣大計算機用戶,包括中國用戶,並不遙遠;它看得見、摸得著、買得到。數據倉庫技術其實也不神秘,至少比絕大多數統計學定理來得簡單。相信大家必能在數據倉庫的實施和使用中獲得滿意的效果。

『貳』 OP的含義有幾種

共有31種,分別是:

漫畫《海賊王》(OnePiece)

手術(operation)

已售完(outofprint)

運營商可變演算法配置域

原價(originalprices)

鳳凰社(OrderofPhoenix)

骨質疏鬆症

不定額保險單(openpolicy)

擎天柱(OptimusPrime)

Overpower

Agnitum公司出品防火牆

片頭曲(OpeningSong)

觸摸屏英文縮寫

過強(overpowered)

組織夥伴英文縮寫

俄羅斯網路防火牆軟體

光學工程師英文縮寫

光學零件(optics)

菲律賓總統辦公室網站

《我型我show》07屆冠軍組合

非離子表面活性劑英文縮寫

原創版權(ORIGINALPUBLISHING)

作品編號(opus)

出光功率(OutputPower)

光學探頭(opticalprobe)

運放(OperationalAmplifier)

操作碼英文縮寫

管理員(OPERATOR)

學分英文縮寫

遮色瓷(opaque)

有機農作物袋(OrganicPlants)

拓展資料:

《航海王》是日本漫畫家尾田榮一郎作畫的少年漫畫作品,在《周刊少年Jump》1997年34號開始連載。改編的電視動畫《航海王》於1999年10月20日起在富士電視台首播。

2012年5月11日,《航海王》獲得第41回日本漫畫家協會賞。截至2015年6月15日,《航海王》以日本本土累計發行了3億2086萬6000本,被吉尼斯世界紀錄官方認證為「世界上發行量最高的單一作者創作的系列漫畫」。2017年7月21日,日本紀念日協會通過認證,將每年的7月22日設立為「ONE PIECE紀念日」。

『叄』 從就業形勢與薪酬來看,現在計算機編程,網路工程,還有資料庫,哪個比較好呢

從就業形式和薪酬看的話,DBA(資料庫管理員)急缺。
從學習的角度看,資料庫這方面的東西還不是很好學習的,涉及數據結構,數據演算法,數據原理等.... 如果想要學精通就必須對數學方面有很突出的優勢,邏輯計算能力強,考出DBA證就業很快,薪酬不低。
但是這只是初期,計算機編程人員和網路工程師,技術過硬的,經驗豐富的工資也不會低。
以上觀點都是相對而言,剩下的就看你的興趣和方向了,奉勸一句,如果你只是為了就業和薪酬的話,我認為你都路不會走的太遠,第一你要有興趣,二就是方向,三就是恆心和毅力。希望你能成功。
最「容易」的資料庫系統-Microsoft SQL Server
最「難」的資料庫-無冕之王Oracle
資料庫系統的貴族-IBM UDB/DB2
以Java為中心的資料庫-Sybase Adaptive Server Enterprise(ASE) 12.0
值得期盼的Informix Centaur

『肆』 誰又河北省計算機水平考試模擬題

一、 單項選擇題

(每小題1分,共60分,下列各題A)、B)、C)、D)四個選項中,只有一個選項是正確的)

1.語言編譯軟體按軟體分類來看是屬於( )

A)操作系統 B)應用軟體 C)資料庫管理系統 D)系統軟體

D

2.計算機一般按( )進行分類

A)運算速度 B)字長 C)主頻 D)內存

C

3.微型計算機的性能主要由( )來評價。

A)主板的價錢 B)CPU的性能 C)內存大小 D)規格

B

4.可以逐行讀取、翻譯並執行源程序的是( )

A)操作系統 B)解釋程序 C)編譯程序 D)組譯程序

B

5.系統軟體中最基本的是( )

A)操作系統 B)文字處理程序 C)文件管理程序 D)資料庫管理系統

A

6.一座辦公樓內各個辦公室中的微機進行聯網,這個網路屬於( )

A)WAN B)LAN C)MAN D)GAN

B

7.http是一種( )

A)高級程序設計語言 B)域名 C)超文本傳輸協議 D)網址

C

8.從www.uste.e.cn可以看出,它是中國的一個( )的站點。

A)政府部門 B)軍事部門 C)工商部門 D)教育部門

D

9.下面一個可能的E-mail地址是( )

A)liumei hz col co.cn B)[email protected]

C)www.net.e.cn.1iumei D)@e.cn

B

10.微機區域網中為網路提供資源並對這些資源進行管理的計算機是( )

A)網路伺服器 B)網路工作站 C)網路通訊設備 D)網路用戶終端

A

11.目前使用的防毒軟體的主要作用是( )

A)檢查計算機是否感染病毒,清除已被感染的病毒

B)杜絕病毒對計算機的侵害

C)查出計算機已感染的任何病毒,清除其中一部分

D)檢查計算機是否被已知病毒感染,並清除該病毒

D

12.信息安全就是要保證信息的( )

A)有效性 B)經濟性 C)實用性 D)可訪問性

A

13.網路安全技術主要研究( )

A)安全攻擊、安全機制、安全服務

B)安全防範、安全機制、安全漏洞

C)安全攻擊、安全控制、安全防範

D)安全控制、安全保密、安全防範

A

14.操作系統是最貼近計算機的軟體系統,應具有必要的安全性。為保障操作系統的安全性,採用的安全措施主要是( )

A)訪問控制、存儲保護、安全核控制

B)存儲保護、文件管理與保密、進程分層設計

C)訪問控制、文件保護及保密、存儲保護

D)訪問控制、文件管理與保密、安全核控制

C

15.已知一維數組A採用順序存取結構,每個元素佔用4個存儲單元,第1個元素的地址為100,A[12]的地址是( )

A)160 B)144 C)148 D)112

B

16.稀疏矩陣的十字鏈表法存儲中,假設有m個行指針向量,n個列指針向量,那麼共有多少條鏈?( )

A)m B)n C)m+n D)m×n

C

17.某隊列初始為空,若它的輸入序列為a,b,c,d,它的輸出序列應為( )

A)d,c,b,a B)a,b,c,d

C)a,c,b,d D)d,a,c,b

B

18.某堆棧的輸入序列為1,2,3,…,n-1,n,輸出序列的第一個元素為n,則第i個輸出元素為( )

A)n-i+1 B)i C)n-i D)哪個元素無所謂

A

19、對含有n個元素的散列表進行檢索,平均檢索長度為( )

A)O(1og2n) B)O(n) C)O(nlog2n) D)不直接依賴於n

D

20.設散列表的地址空間為0到10,散列函數為h(k)=k mod 11,用線性探查法解決碰撞,現從空的散列表開始,依次插入關鍵碼值84、25、38、57、49,則最後一個關鍵碼值49的地址為( )

A)4 B)5 C)6 D)7

C

21、一組權值(7,5,2,4)對應的霍夫曼樹的帶權路徑長度為( )

A)25 B)35 C)45 D)55

B

22、具有n個結點的完全二叉樹,若按自上而下、從左到右依次給結點編號,則編號最小的葉結點的序號是( )

A) B) C) D)

C

23.在序列{2,5,8,11,15,16,22,24,27,35,50}中採用折半查找法查找24時,需要進行( )次元素的比較。

A)3 B)4 C)8 D)11

B

24.下面關於B樹和B+樹的敘述中,不正確的是( )

A)B樹和B+樹都是平衡的多分樹 B)都可以用於文件的索引結構

C)都能有效地支持順序檢索 D)都能有效地支持隨機檢索

C

25.對數據元素序列(49,72,68,13,38,50,97,27)進行排序,前三遍排序結束時的結果依次為:第一遍:49,72,68,13,38,50,97,27;第二遍:49,68,72,13,38,50,97,27;第三遍:13,49,68,72,38,50,97,27。該排序採用的方法是( )

A)插入排序法 B)選擇排序法 C)起泡排序法 D)堆排序法

A

26、進程就是可與其他程序共同執行的程序段的一次執行過程,它是系統進行資源分配和調度的一個基本單位。進程具有 (1) 、 (2) 、獨立性、非同步性和結構性五個基本特徵。

(1)、(2):( )

A)動態性 B)靜態性 C)共行性 D)並發性

AD

27、段頁式存儲管理汲取了頁式管理和段式管理的長處,其實現原理結合了頁式和段式管理的基本思想,即( )。

A)用分段方法來分配和管理存儲空間,用分頁方法來管理地址空間。

B)用分段方法來分配和管理地址空間,用分頁方法來管理存儲空間。

C)用分段方法來分配和管理主存空間,用分頁方法來管理輔存空間。

D)用分段方法來分配和管理輔存空間,用分頁方法來管理主存空間。

B

28.採用假離線技術的目的是( )。

A)提高外設和主機的利用率 B)提高內存和主機效率

C)減輕用戶編程負擔 D)提高程序的運行速度

A

29、分時操作系統追求的目標是( )

A)高吞吐率 B)充分利用內存 C)快速響應 D)減少系統開銷

C

30、在操作系統中,對信號量S的P原語操作定義中,使進程進入相應等待隊列等待的條件是( )

A、S>O B、S<O C、S=0 D、S<>0

B

31、某一磁碟請求序列(磁軌號)如下:

0 22 5 7 11 21 2

按照最短尋道時間優先磁碟調度演算法對磁碟請求進行服務,設當前磁頭在4道上,則移動臂總移動道數為( )

A)68 B)40 C)32 D)22

B

32、按照傳統的數據模型分類,資料庫系統可以分為三種類型,分別是( )

A)大型、中型和小型 B)西文、中文和兼容

C)層次、網狀和關系 D)數據、圖形和多媒體

C

33、資料庫DB、資料庫系統DBS、資料庫管理系統DBMS這三者之間的關系是( )

A)DBS包括DB和DBMS B)DBMS包括DB和DBS

C)DB包括DBS和DBMS D)DBS就是DB,也就是DBMS

A

34、下列敘述中正確的是( )

A)資料庫的庫結構包括資料庫中各個記錄的數據

B)資料庫中的數據不僅僅是數值型數據

C)資料庫管理系統的主要功能是建立資料庫

D)資料庫文件的結構不能由系統自動生成

B

35、在下面的兩個關系中,職工號和部門號分別為職工關系和部門關系的主鍵(或稱主碼)。

職工(職工號、職工名、部門號、職務、工資)

部門(部門號、部門名、部門人數、工資總額)

在這兩個關系的屬性中,只有一個屬性是外鍵,它是( )

A)職工關系的「職工號」 B)職工關系的「部門號」

C)部門關系的「部門號」 D)部門關系的「部門名」

B

36、在下面三個關系中:

學生關系是S(SNO,SNAME,SEX,AGE)

課程關系是C(CNO,CNAME,CREDIT)

學生選課關系是SC(SNO,CNO,GRADE)

要查找選修「資料庫」課程的女學生的姓名,將涉及到的關系是( )

A)S B)C,SC C)S,SC D)S,C,SC

D

37、有關系S(S#,SNAME,SEX),C(C#,CNAME),SC(S#,C#)。其中S#為學生號,SNAME為學生姓名,SEX為性別,C#為課程號,CNAME為課程名。要查詢選修「計算機」課的全體女學生姓名的SQL語句是SELECT SNAME FROM S,C,SC WHERE子句。這里WHERE子句的內容是( )

A)S,S#=SC.S# and SEX=「女」and CNAME=「計算機」

B)S,S#=SC.S# and C.C#=SC.C#and.CNAME=「計算機」

C)SEX=「女」and CNAME=「計算機」

D)S.S#=SC.S# and C.C#=SC.C# and SEX=「女」and CNAME=「計算機」

D

38、有如下兩個關系R和S,則R÷S的結果為( )

交費單位
電話號
電話名稱

通信段
26180040
程式控制室

電影院
26191999
電影院售票處

通信段
26191306
通信工區

關系R

電話號
電話名稱
電話費

26180040
程式控制室
20

26191306
通信工區
66

26191999
電影院售票處
73

26180099
人民公園
25

關系S

交費單位

通信段

A)

交費單位
電話號
電話名稱

通信段
26180040
程式控制室

B)

交費單位

通信段

電影院

C)

電話號
電話名稱
電話費

26180040
程式控制室
20

26191306
通信工區
66

D)

A

39、資料庫管理系統能實現對資料庫中數據的查詢、插入、修改和刪除,這類功能稱為( )

A)數據定義功能 B)數據管理功能 C)數據操縱功能 D)數據控制功能

C

40、SQL語言中的「視圖」對應與資料庫系統三級模式結構中的( )

A)外模式 B)模式 C)內模式 D)都不對應

A

41、SQL語言集數據查詢、數據操縱、數據定義和數據控制功能於一體,其中CREATE、DROP、ALTER語句是實現哪種功能的( )

A)數據查詢 B)數據操縱 C)數據定義 D)數據控制

C

42、SQL語言的GRANT和REVOKE語句主要用來維護資料庫的( )

A)安全性 B)完整性 C)可靠性 D)一致性

D

43、設有關系R=(A,B,C),與SQL語句

SELECT DISTINCT A

FROM R

WHERE B=17

等價的關系代數表達式是( )

A)ПA(R) B)σB=17(R) C)ПA(σB=17(R)) D)σB=17(ПA(R))

C

44、規范化理論是關系資料庫進行邏輯設計的理論依據。根據這個理論,關系資料庫中的關系必須滿足:其每一屬性都是( )

A)互不相關的 B)不可分解的

C)長度可變的 D)互相關聯的

B

45、關系資料庫規范化是為解決下述什麼問題而引入的?( )

A)插入、刪除和數據冗餘 B)提高查詢速度

C)減少數據操作的復雜性 D)保證數據的安全性和完整性

A

46、關系模式學生(學號,課程號,名次),若每一名學生每門課程有一定的名次,每門課程每一名次只有一名學生,則以下敘述中錯誤的是( )

A)(學號,課程號)和(課程號,名次)都可以作為候選碼

B)只有(學號,課程號)能作為候選碼

C)關系模式屬於第三範式

D)關系模式屬於BCNF

B

47、根據關系資料庫規范化理論,對於「系別」關系:

系別(系代號,系名,系成員,系主任)

因為哪個屬性而使它不滿足1NF?( )

A)系主任 B)系成員 C)系名 D)系代號

B

48、設有關系W(工號,姓名,工種,定額),將其規范化到3NF的正確答案是( )

A)W1(工號,姓名),W2(工種,定額)

B)W1(工號,工種,定額),W2(工號,姓名)

C)W1(工號,姓名,工種),W2(工號,定額)

C

49、資料庫物理設計不包括( )

A)選擇存取結構 B)載入數據方法

C)分配存儲空間 D)確定存取方法

B

50、資料庫管理系統中的數據操縱語言(DML)所實現的操作一般包括( )

A)查詢、插入、修改、刪除 B)排序、授權、刪除

C)建立、插入、修改、排序 D)建立、授權、修改

A

51、主流資料庫管理系統應該更強調系統在理論上和實踐上的完備性,具有巨大的數據存儲和管理能力,有利於支持全局性的及關鍵性的數據管理工作。如下列出的資料庫管理系統中,目前還不能稱為主流資料庫管理系統的為( )

A)Oracle B)IBM DB2 C)FoxPro D)SYBASE

C

52、DB2通用資料庫(UDB)V7.1有許多特點,以下不是它的特點的是( )

A)支持聯機分析處理(OLAP) B)支持面向對象和多媒體應用

C)並發處理能力 D)支持Internet應用

C

53、下列不屬於事務的ACID特性的是( )

A)一致性(Consistency) B)原子性(Atomicity)

C)連續性(Continuity) D)持久性(Durability)

C

54、在基於日誌的恢復中,正確的選項是( )

A)利用更新日誌記錄中的改後值可以進行UNDO

B)利用更新日誌記錄中的改前值可以進行REDO

C)利用更新日誌記錄中的改後值可以進行UNDO,利用更新日誌記錄中的改前值可以進行REDO

D)利用更新日誌記錄中的改前值可以進行UNDO,利用更新日誌記錄中的改後值可以進行REDO

D

55、為了對資料庫的事務處理的並發性進行控制,保證資料庫的一致性,最常用的方法是封鎖的方法。對於共享鎖(S)和排他鎖(X)來說,其相容關系如下,其中錯誤的是( )

A)S/S:TRUE B)S/X:FALSE

C)X/S:FALSE D)X/X:TRUE

D

56、SQL數據定義語言中包含了許可權授予和回收的命令,下面敘述錯誤的是( )

A)grant語句用來授予許可權,revoke語句用來回收許可權

B)預設情況下,在SQL中被授予許可權的用戶允許將該許可權授予其他用戶

C)許可權all priviledges可以用作授予所有許可權的縮寫形式,用戶名public指系統所有當前用戶和將來的用戶

D)如果希望授予許可權並允許接受授權者將許可權傳遞給其他用戶,將with grant option子句附加在適當的grant命令後即可

B

57、若系統在運行時,由於某種原因,造成系統停止運行,致使事務在執行過程中以非控制方式終止,這時內存中的信息丟失,而存儲在外存上的數據未受影響,這種情況是下面的哪種問題?( )

A)事務故障 B)系統故障 C)介質故障 D)運行故障

B

58、S-Designer是一種可視化的資料庫設計工具,它的後續版本是Power-Designer,它具有很強的資料庫建模功能。但如下所列出的功能中,哪一項不是它的功能?( )

A)從數據流圖(DFD)生成資料庫的概念數據模型(CDM)

B)從概念數據模型(CDM)生成物理數據模型(PDM)

C)從現存資料庫逆向生成物理數據模型(PDM)

D)從物理數據模型(PDM)逆向生成概念數據模型(CDM)

A

59、下述哪個是關於分布式資料庫系統的不正確說法?( )

A)分布式系統的所有問題是(或應當是)內部的、實現級別的問題。

B)分布式系統的所有問題是外部的、用戶級別的問題。

C)分布式系統所有的數據操作在邏輯上是不變的。

D)分布式系統數據定義功能在分布式系統中需要進行擴充。

B

60、並行資料庫系統中,下列哪種敘述是不正確的?( )

A)無共享是指各處理器不共享公共的主存儲器,但共享公共的磁碟。

B)共享磁碟模式是指所有的處理器共享公共的磁碟。

C)共享內存模式是指所有的處理器共享一個公共的主存儲器。

D)並行機器有四種重要的體系結構模式。

A

二、填空題

(每小題2分,共40分)

1. 計算機的主機是由________、_______和_______組成。

控制器、運算器、主存儲器

2. URL即統一資源定位器,標準的URL由三部分組成:________、________和路徑及文件名。

伺服器類型、主機名

3.若某線性表採用順序存儲結構,每個數據元素佔用k個存儲單元,第一個數據元素的存儲地址為LOC(a1),則第i個數據元素的存儲地址LOC(ai)=_______________________。

(LOC(ai)=LOC(a1)+(i-1)k)

4、若某堆棧初始為空,PUSH與POP分別表示對堆棧進行一次進棧與出棧操作,那麼對於輸入序列a,b,c,d,e,依次經過PUSH,PUSH,POP,PUSH,POP,PUSH,PUSH以後,輸出序列應該是_____________。

b,c

5.設高度為h的二叉樹上只有度為0和度為2的結點,問該二叉樹的結點數可能的最大值為 ① ,最小值為 ② 。

①2h-1,②2h-1

6、若一個待散列的線性表的長度為n,用於散列的散列表的長度為m,則m應 ① n,負載因子為 ② 。

①大於等於,②n/m

7、如果系統中有n個進程,則在就緒隊列中進程的個數最多為_____________。

n-1

8、在操作系統中,不可中斷執行的操作稱為____________。

原語

9、____________是文件存在的標志,它記錄了系統管理文件的全部信息。

JCB

10、如果系統中所有作業是同時到達的,則使作業平均周轉時間最短的作業調度演算法是____________。

計算時間短作業優先演算法

11、數據模型的三要素是指__________。

數據結構、數據操作和完整性約束條件

12、數據的邏輯獨立性是指資料庫__________ 變化時,不影響應用程序。

邏輯結構

13、在資料庫技術中,使用數據模型的概念描述資料庫的語義和結構,一般可分為兩類:概念數據模型和__________數據模型。

結構

14、SQL語言中引用了游標,使用游標是為了把集合操作轉為_____處理。

單記錄

15、在「學生一選課一課程」資料庫中的3個關系如下:

S(S#,SNAME,SEX,AGE),SC(S#,C#,GRADE),C(C#,CNAME,TEACHER)查找選修「資料庫技術」這門課程的學生的學生名和成績。若使用連接查詢的SQL語句是:

SELECT SNAME,GRADE

FROM S,SC,C

WHERE CNAME=『資料庫技術』AND_______。

S.S#=SC.S#AND SC.C#=C.C#

16、若一個關系R為1NF,且它的每一個非主屬性都完全依賴於碼,則R為______。

2NF(或第二範式)

17、在資料庫設計中,學生的學號在某一局部應用中被定義為字元型,而另一局部應用中被定義為整型,那麼被稱之為_______沖突。

屬性沖突

18、當前使用的資料庫管理系統主要是以_________為主流,所以我們所說的資料庫管理系統主要是指該資料庫管理系統。

關系型資料庫管理系統(RDBMS)

19、在資料庫並發控制中,封鎖自身會產生一定的問題,即__________,它是指兩個或更多的事務同時處於等待狀態,每個事務都在等待其他的事務釋放鎖使其可繼續執行。

死鎖

20、對象的繼承性允許不同類的對象共享它們之間公共部分的結構和特性,表示了類之間的__________。

相似性

熱點內容
usb大容量存儲驅動 發布:2024-05-07 19:02:01 瀏覽:815
紅米1s沒有存儲空間 發布:2024-05-07 18:59:09 瀏覽:505
妖雲解壓密碼 發布:2024-05-07 18:50:08 瀏覽:1002
sql語句等於怎麼寫 發布:2024-05-07 18:05:46 瀏覽:816
我的世界電腦版第三方伺服器大全 發布:2024-05-07 18:00:46 瀏覽:627
主伺服器的ip地址 發布:2024-05-07 17:58:50 瀏覽:546
組伺服器打電腦游戲 發布:2024-05-07 17:46:19 瀏覽:866
java的文件路徑 發布:2024-05-07 16:55:29 瀏覽:293
雲表伺服器安裝導致電腦崩潰 發布:2024-05-07 15:58:35 瀏覽:524
ftp是什麼檢測器 發布:2024-05-07 15:37:59 瀏覽:403