空間資料庫設計
❶ 建立空間資料庫的原理、方法和步驟
一、目標任務
1.主要工作任務
《1∶25萬內陸乾旱區地下水資源評價塔里木盆地地下水勘查空間資料庫》是在綜合研究已有資料的基礎上,補充野外實際工作,建立了58個標准圖幅的1∶25萬空間資料庫。
2.技術要求
採用中國地質大學開發的MAPGIS軟體平台,完全依照中國地質調查局提出的各項技術標准,執行中國地質調查局最新修訂的《西北地下水資源勘查評價空間資料庫工作指南》2.0版及其他相關標准。對選定的58幅1∶25萬標准圖幅綜合水文地質圖、地質圖、生態環境水文地質圖、地貌圖、地下水開發利用規劃圖、地下水水化學類型圖、地下水資源分布圖、平原區地下水質量分區圖、綜合水文地質剖面圖、重點流域等水位線圖等圖件進行數字化處理和空間資料庫的建立。
參考標准或引用標准:
GB 2260中華人民共和國行政區劃代碼
GB 9649地質礦產術語分類代碼
GB/14157水文地質術語
GB/T 14538-93綜合水文地質圖圖例及色標(1∶200000~1∶500000)
GB/T 14848地下水質量標准
GB/T 13923-92,國土基礎信息數據分類與代碼(中國標准出版社,1992)
DZ/T 0197-1997數字化地質圖圖層及屬性文件格式(國家行業標准)
西北地下水資源勘查評價空間資料庫工作指南
3.提交成果
1)資料庫成果(光碟匯交):見表6-1。
2)文檔:屬性表、圖幅基本概況表、工作日誌、自檢表、互檢表、質檢組檢查表、圖面檢查表。
表6-1 成果匯交光碟物理存儲結構
3)塔里木盆地地下水勘查包括58個標准圖幅的水文地質專業圖件共7張彩色噴墨全要素圖各1張、重點流域等水位線圖3張和綜合水文地質剖面圖1張。
4)《1∶25萬內陸乾旱區地下水資源評價塔里木盆地地下水勘查空間資料庫》建庫報告一份。
二、工作方法及流程
(一)項目組織與實施
項目由新疆地質調查院組織,由水文地質工程地質、繪圖、計算機等專業技術骨幹組成,嚴格按照規范和技術要求實施。
(二)工作方法
概據任務書的要求,收集、購買已出版的塔里木盆地58幅圖的地理信息數字化成果數據,採用中國地質大學開發的MAPGIS6.1軟體平台,將此數據在經緯秒格式下進行拼接,按《西北地下水資源勘查評價空間資料庫工作指南》標准對地理屬性進行了修改。各類專業圖件經過專業人員的編圖,經審查合格後,採用彩色或灰度掃描,進行圖形數字化,做到圖元丟失率為0,誤差小於0.02mm,其精度均達到設計要求。數據在矢量化過程中以作者原圖為主的原則,屬性內容以報告和圖面內容相結合的方法採集,成果資料中沒有的不予反映。
(三)工作流程
本次資料庫建設完全按照《西北地下水資源勘查評價空間資料庫工作指南》的具體要求,對相關數據資料進行整理。在MAPGIS支持環境下完成圖形數據的輸入和編輯,利用Access系統下創建的滿足《西北地下水資源勘查評價空間資料庫工作指南》數據結構要求的數據表,完成外掛屬性數據的錄入,並實現圖層與屬性數據的連接。
1.數據信息組成
根據新疆塔里木盆地地下水勘查總體設計書的要求,確定此次工作數據信息的內容為基礎地理、基礎地質、社會經濟信息、水文地質信息(含水文地質條件、水文地質觀測、地下水資源等)、環境地質信息、元數據信息,具體的數據信息與內容見表6-2。
表6-2 主要數據類型與數據特徵
2.圖層劃分
新疆塔里木盆地空間資料庫的建設,從基礎資料圖件到成果表達圖件,多數內容涉及大量的矢量圖形。因此,標准化處理必須確定各種圖件的圖層劃分、圖元、屬性等方面的內容,以使圖形庫最大限度地達到共享。圖形分層主要考慮到便於圖形的操作、管理和計算,同時考慮數據本身的專業數據特點。圖層劃分詳見表6-3 。
表6-3 塔里木盆地地下水勘查空間資料庫圖層劃分
續表
注:#代表含水層編號,含水層未分時,#用「0」替代。
圖6-1 工作流程示意圖
3.數據准備階段
作者原圖及簡單圖件用二值或灰度,以300dpi精度掃描,復雜圖件用彩色以300DPI精度掃描。所有圖件的圖式圖例參數說明文件放入README文件夾中。
4.數據矢量化階段
放大70倍進行圖件的數字化處理。點線數字化時,要保證其准確性和自然光滑,有坐標的點採用單點展繪的方法直接投影到1∶25萬圖中,保證了精度。線數字化時,為確保拓撲時弧段不變形,未採用MAPGIS系統提供的線圓滑功能。
5.檢查矢量化圖件
噴繪數字化圖件,對照原圖進行自檢、互檢、抽檢,並由水文地質專家進行100%的檢查,確保矢量化後的圖形數據與原圖件一致性和完整性。
6.誤差校正
塔里木盆地面積大,橫跨4個帶。各帶圖件經檢查無誤後,生成基於原圖高斯北京投影帶方式的理論圖框,進行誤差校正。每標准圖幅採集13個控制點,除4個角點外,其餘點均勻分布在圖幅內。
7.無投影格式下重新拓撲
將檢查無誤的數據投影到經緯度格式。在經緯度下再進行各帶各類圖件的拼接,為確保套合精度,重新進行拓撲,錄入面屬性,再將參與做面的線從整體拓撲圖層中弧轉線中分離出來,做線屬性。
8.噴繪圖件
對參與整體拓撲的圖層進行拓撲處理、錯誤檢查、修改,然後編輯區顏色。將各圖層形成工程文件後,彩噴出圖。再由繪圖專業人員和水文地質專家對照原圖檢查,檢查出錯誤進行修改,再出圖,再次檢查,直至完全無誤,最後彩噴成果圖件。
9.填寫屬性卡片
屬性卡片的內容以原圖和原報告為主要依據。
10.錄入屬性
在MAPGIS屬性庫管理模塊中將各圖層ID號和圖元編號做唯一。
11.轉換文件格式
將經緯度格式下的屬性文件,生成E00文件,轉入ARCINFO中,形成最終的ARCINFO格式數據。
工作流程見圖6-1。
❷ 地質-生態環境空間資料庫建庫標准
一、范圍
本標準定義了山東半島城市群地質-生態環境空間資料庫的數據結構框架、數據實體及實體之間的相互關系,定義了成果圖件空間數據的要素集、要素類、要素分類代碼及屬性數據項,可用於山東半島城市群項目數據的採集、存儲、管理、共享及資料庫建設。
二、規范性引用文件
下列標准所包含的條文,通過在本標准中引用而構成為本標準的條文。本標准出版時,所示版本均為有效。所有標准都會被修訂,使用本標準的各方應探討使用下列標准最新版本的可能性。
GB / T 1. 1—2000 標准化工作導則 第 1 部分: 標準的結構和編寫規則
GB / T 13923—92 國土基礎信息數據分類代碼
GB / T 2260—1999 中華人民共和國行政區劃代碼
GB / T 2659 世界各國和地區名稱代碼
GB / T 9649—88 地質礦產術語分類代碼
DZ / T 0160—95 1∶ 200000 地質圖地理底圖編繪規范及圖式
DZ / T 0197—1997 數字化地質圖圖層及屬性文件格式
GB 958—99 區域地質圖圖例 ( 1∶ 50000)
DZ / T 0179—1997 地質圖用色標准及用色原則
DDB 9702 GIS 圖層描述數據內容標准
GB 17108—1997 海洋功能區劃技術導則
中國地質調查局 地質圖空間資料庫建設工作指南 ( 2. 0 版)
中國地質調查局 1∶ 20 萬區域水文地質圖空間資料庫圖層及屬性文件格式工作指南
三、術語和定義
本標准涉及的主要術語如下:
1. 地理信息資料庫 ( geodatabase)
採用標准關系資料庫技術來管理、表現地理信息的空間資料庫。
2. 數據包 ( data package)
邏輯相關數據實體的集合,本標准中將山東半島城市群項目數據整體視作一個數據包。
3. 數據實體 ( data entity)
描述專業領域同一類型數據的數據元素的集合,如地質構造數據實體,概念上等同於UML 的類。數據實體可通過一個或多個相關的數據元素及相關的數據實體定義。
4. 數據集 ( dataset)
邏輯相關數據組成的數據集合,如一幅地圖可視作一個數據集,數據集是一個邏輯上的整體。
5. 數據子集 ( subdataset)
按一定規則劃分的數據集中邏輯相關數據的集合,本標准中的一個數據子集對應一個地圖要素類,數據子集類別對應地圖上的圖層劃分。
6. 空間數據 ( spatial data)
用來表示空間實體的位置、形狀、大小和分布特徵諸方面信息的數據。空間數據不僅具有實體本身的空間位置及形態信息,而且還有實體屬性和空間關系 ( 如拓撲關系)信息。
7. 空間參照系 ( spatial reference)
對地理信息數據的空間范圍和投影的描述。
8. 地圖 ( map)
地理信息的圖形描述,包括地理信息數據和地圖元素,如標題、圖例和比例尺等。本標准中將一幅地圖視作一個數據集進行管理,並通過一組要素集 ( 要素類、關系類、屬性表的集合) 、空間參照系、地圖樣式定義地圖的數據內容及顯示方式。
9. 圖層 ( layer)
地圖上特定區域范圍內按一定規則劃分的相似要素類的集合,如水系、城鎮。圖層為要素類的專題組合及表現,一個圖層定義了它包含地理信息數據的地理位置和顯示方法。
10. 要素 ( feature)
現實世界中的對象在地圖圖層中的表示,如地圖中表示道路的一條線。
……
四、縮略語和符號
1. 縮略語
ARD 圖外整飾要素 ( Elements Around Map)
BMAP 地理底圖 ( Basemap)
BOU 境界、邊界 ( Bourn)
CD 代碼 ( Code)
COL 綜合柱狀圖 ( Colomnar Chart)
DT 日期 ( Date)
ELE 地形高程 ( Elevation)
……
2. UML 類圖符號
山東半島城市群地區地質-生態環境與可持續發展研究
3. ER 圖符號
山東半島城市群地區地質-生態環境與可持續發展研究
五、基於 UML 的 Geodatabase 的空間數據模型
構建地質數據的空間數據模型是建立地質信息資料庫的一項關鍵工作,是資料庫建設的基礎。Geodatabase 數據模型作為 ArcGIS 軟體平台的一種通用數據形式,目前已被國內外眾多地質空間資料庫的建設所採用。數據建模也已經成為地質資料庫建立的一項主要內容。
目前針對地質、水文、礦產、海洋等多個領域的專業 Geodatabase 數據模型都已存在,國內目前應用於區域地質 - 生態環境調查的綜合地質 - 生態環境空間數據模型還比較少見。因此,本項目在分析國內外目前比較通用的各專業數據模型的基礎上,提出了專門面向山東半島城市群地質 - 生態環境空間資料庫建設的 Geodatabase 數據模型。
在 Geodatabase 數據模型中,允許定義要素之間類型的關聯,Geodatabase 對空間數據管理以關系資料庫為基礎,利用商用關系資料庫成熟的數據處理能力對空間數據和非空間數據進行統一管理。Geodatabase 使用面向對象的方法,使得要素可以具有自己的行為和屬性,並且要素類具有繼承性、多態性和封裝性。這樣,以更加適合自然的行為和人的思維方式去組織數據,更精確地模擬真實世界。
1. Geodatabase 數據模型的結構體系
Geodatabase 數據模型作為一種新型的面向對象的數據模型,融入了面向對象的核心技術,如類 ( Class) 、對象 ( Object) 、封裝 ( Encapsulation) 、繼承 ( Inheritance) 和多態( Polymorphism) 等思想和技術。Geodatabase 數據模型的目的就是為了讓用戶能更容易、更自然地表示 GIS 數據特徵和更容易地建立特徵之間的各種關系。Geodatabase 空間資料庫數據模型如表 12 -1 所示。
表 12 -1 Geodatabase 內部結構
續表
2. Geodatabase 資料庫模型的特點
Geodatabase 有兩種,即個人與多用戶 Geodatabase。
1) 個人 Geodatabase 支持內置於 ArcGIS 系統並提供對本地數據的訪問,適用於面向項目的 GIS,在 Microsoft Access 資料庫平台上實現,提供生成和更新 Access 資料庫的服務,可處理小型或適中的 Access 資料庫。但個人 Geodatabase 的存儲容量有不能超過 2GB的限制。
2) 多用戶的 Geodatabase 是通過 ArcSDE ( ARC 空間資料庫引擎) 實現的。ArcSDE可以生成和訪問從小型到大型的 Geodatabase 並提供關系型數據的開放界面。
與標準的關系資料庫相比,Geodatabase 簡化了地理數據建模的工作,因為它包含有用於建模地理信息的通用模型。
此外,Geodatabase 還同時支持兩個視圖,即對象視圖和關系視圖。這樣就綜合了對象視圖和關系視圖兩者的優點。對象視圖在 Geodatabase 中占據主導地位,其目的是提供一個接近於邏輯數據模型的數據模型,因而更接近於現實。關系視圖則用於一些 Geodata-base 數據的常規處理,它表示的是一些簡單地理對象的特徵。
3. 基於 UML 的 Geodatabase 數據模型的設計
( 1) Geodatabase 資料庫設計的方法
在 ArcGIS 中,建立地理資料庫可以有多種方法。藉助 ArcCatalog,可以通過 3 種方式建立新的地理資料庫。
第一種方法是建立一個新的地理資料庫。
第二種方法是移植已經存在的數據到地理資料庫中去。
第三種方式是用 CASE 工具來建立地理資料庫。
( 2) 面向對象和 UML ( 統一建模語言)
面向對象是軟體程序設計中的一種新思想,它能使程序設計更加貼近現實,並且花費更小的精力。面向對象方法學包含了對象 ( object) 、類 ( classification) 、繼承 ( inherit-ance) 、聚集和消息 ( messages) 的概念。
UML ( Unified Modeling Language,統一建模語言) 是一種基於面向對象方法的建模語言,具有創建系統的靜態結構和動態行為等多種結構模型的能力,是一種通用的建模語言。在 Geodatabase 的設計中,主要用到描述系統靜態結構的類圖。類圖的節點表示系統中的類及其屬性和操作。類圖的邊表示類之間的聯系,包括繼承、關聯、依賴、聚合等。
類的表示由 3 個部分方框組成,上面部分給出了類的名稱; 中間部分給出了該類的單個對象的屬性; 下面部分給出了一些可以應用到這些對象的操作。類的表示如圖 12 -5。
圖 12 -5 類的表示
關聯是對類的實例之間聯系的命名,與關聯有關的內容有關聯元數 ( Degree) 、關聯角色 ( Role) 和重復度 ( Multiplicity) 。
UML 中有 3 種類型的類: 抽象類 ( abstract class) 、可創建化類 ( creatable class) 和可實例化類 ( instantiable class) 。
UML 類圖的符號見本節第四部分內容。
( 3) 面向對象的地理數據模型的設計方法
利用 CASE 工具進行 Geodatabase 數據模型設計的步驟具體為:
1) 在 CASE 工具中進行 UML 建模。
2) 將設計好的 UML 模型載入資料庫 ( repositry) 。
3) 利用 GIS 軟體提供的 CASE 介面,根據資料庫中的 UML 模型生成空間資料庫結構。至此,Geodatabase 空間資料庫結構初具雛形。在 GIS 軟體環境中,現在可以將新生成的數據或已有的數據進行格式轉換後載入到設計好的 Geodatabase 空間資料庫中,由空間資料庫統一管理。利用 CASE 工具來建立 Geodatabase 地理資料庫的工作流程見圖12 - 6。
圖 12 -6 利用 CASE 工具來建立 Geodatabase 地理資料庫的工作流程
六、地質 - 生態環境 Geodatabase 數據模型的建立
( 一) 數據模型設計的依據
根據山東半島城市群地質 - 生態環境調查評價研究工作的需要和山東半島城市群地質 - 生態環境 GIS 資料庫系統的整體設計要求,結合各地質 - 生態環境要素的成果圖件和文本報告資料,利用 UML 設計工具 Microsoft Visio 完成了山東半島城市群地質 - 生態環境Geodatabase 數據模型的設計 ( 圖 12 - 7) 。
圖 12 -7 山東半島城市群地質 - 生態環境 Geodatabase 數據模型的設計依據
( 二) 山東半島城市群地質 - 生態環境資料庫的 UML 類圖
1. 數據集管理
山東半島城市群項目數據包中的數據以數據集為單元統一組織管理,數據集管理方式就是將一份文字報告或一幅成果圖件視作邏輯上的整體,用 「數據集編號」唯一標識,通過數據集實體統一管理。同一數據集的不同實體,例如成果圖中的圖層,通過實體中的「數據集編號」元素關聯。
2. 空間數據管理
山東半島城市群項目數據包由文字報告及成果圖件兩大類數據組成,並以成果圖件為主,成果圖件是一空間數據實體,統一存儲在面向對象的地理信息資料庫中,以圖幅為單元進行管理。
3. 數據包總體結構
本標准中山東半島城市群項目數據包總體結構用 UML 模型來體現,山東半島城市群項目數據包由 「成果報告」、「元數據」及 「存檔文件」3 個數據實體 ( UML 類) 組成,通過 「數據集」實體統一組織管理。「成果報告」由它的繼承類 「文字報告」及 「成果圖件」定義,為研究成果數據包的主體數據。「元數據」及 「存檔文件」為數據集的輔助數據,「元數據」存放文字報告或成果圖件的元數據; 「存檔文件」存放文字報告或成果圖件的相關存檔文件,供數據集數據的整體下載與利用。
一個 「數據集」實體對應一個項目的 「文字報告」或一幅 「成果圖件」; 每一個數據集必須有一個而且只能有一個 「元數據」文件; 「存檔文件」是 「數據集」的可選聚合實體。
「成果圖件」是一空間數據實體,由特定的面向對象地理信息資料庫 ( Geodatabase)統一存儲、管理。一幅 「成果圖件」數據內容由一組空間要素集 ( 基礎地理要素集、地質要素集、地球物理要素集、地球化學要素集、輔助要素集) 組成,空間要素集數據類型包括矢量 ( Feature Dataset,簡稱要素集) 、柵格 ( Raster Dataset) 和 TIN ( TIN Dataset)3 種。
4. 數據集編號的編碼規則
數據集編號由資料庫管理方統一編碼,必須保證編號在資料庫中唯一,編號中的英文字母全部大寫。
山東半島城市群項目數據集按 「項目或圖幅—提交單位—提交年份—成果序號」編碼。數據集編號的字元串長度不得超過 22 位,以保證 「數據集編號 + 要素類名」的字元串總長度不超過 30 位。
5. 成果圖件要素類命名規則
要素類名字元串總長度不得超過 8 位。
矢量要素類按 「要素集類型 + 要素類名 + 要素類型」命名,全部用大寫英文字母表示。「要素集類型」用一位代碼表示,如 「L」表示基礎地理要素集。柵格數據集數據以「要素集類型 + 要素類型」命名,要素類型用代碼 RAS 表示,如 「DRSRAS」表示遙感柵格數據。TIN 數據集數據以 「要素集類型 + 要素類型」命名,要素類型用代碼 TIN 表示,如 「LELETIN」表示地面高程 TIN。
6. 成果圖件要素分類編碼規則
要素分類編碼用以標識不同的要素類要素,保證地圖要素存儲、交換、顯示的一致性。
( 1) 分類編碼原則
1) 科學性、系統性;
2) 相對穩定性;
3) 不受地圖比例尺的限制;
4) 完整性和可擴展性;
5) 適用性。
( 2) 分類編碼方法
成果圖件要素類中不同要素的分類編碼採用中華人民共和國國家標准 《國土基礎信息數據分類與代碼》的編碼結構,結構如下:
山東半島城市群地區地質-生態環境與可持續發展研究
大類碼、小類碼、一級代碼和二級代碼分別用數字順序排列。識別位由用戶自行定義,以便於擴充。在本項目中編碼分兩類: ①基礎地理要素編碼; ②地質專業要素編碼( 地質、地球物理、地球化學等) 。
( 三) 山東半島城市群項目數據實體及實體關系
山東半島城市群項目數據實體類及其代碼見表 12 -2,實體類名代碼按實體類的英文名縮略語編碼,本標准中山東半島城市群項目數據實體及實體間關系用 UML 及實體關系圖 ( ERD) 來體現。
表 12 -2 山東半島城市群項目數據實體類及其代碼
1. 數據集實體 ( MGRD_Dataset)
山東半島城市群項目數據包中的 「數據集」實體用來統一組織管理 「文字報告」、「成果圖件」、「元數據」及 「存檔文件」數據實體,「數據集」實體中的數據項包含數據集的歸屬項目、提交日期、提交單位、主題類別及地理范圍等可用於數據集檢索的信息。一個 「數據集」實體對應一個項目的 「文字報告」或一幅 「成果圖件」,「數據集」實體與 「元數據」實體間為一一對應關系,與 「存檔文件」實體間為一對多的對應關系。「數據集」實體的數據內容及其存儲表通過 「數據子集」實體分類定義,主鍵 [數據集編號]可用於同一數據集中不同 「數據子集」的關聯,也可用於數據集對應的 「元數據」及「存檔文件」的關聯。
2. 成果報告數據實體 ( MGRD SumTmaryReport)
研究成果報告數據實體包括項目的最終綜合文字報告及相應的成果圖件。
( 1) 文字報告數據實體 ( SR_WordReport)
文字報告數據實體包括 「文字報告」及圖像格式的 「報告附圖」數據實體,文字報告及附圖均以二進制大對象存儲。數據實體之間通過 [數據集編號] 關聯。
( 2) 成果圖件數據實體 ( SR_hemeMapSet)
「成果圖件」數據實體是一空間數據實體,主要以矢量圖形格式存儲在地理信息資料庫中,其中也包括柵格數據及 TIN 數據用於數據的空間分析。
1) 要素集: 「成果圖件」 數據實體以圖幅為數據集單元進行管理; 圖幅內容以分屬不同空間要素集 ( 基礎地理要素集、地質要素集、地球物理要素集、地球化學要素集、輔助要素集) 的要素類組合,同一個要素集內的要素類享有同一空間參照系,相互具有拓撲關系。
2) 要素類: 一個要素類的存儲單元為關系資料庫中的一個數據表,要素類圖元類型有點、線、面、注記 4 種,一個要素類只能包含一種圖元類型。本標准中基礎地理要素集、地質要素集、地球物理要素集、地球化學要素類、輔助要素集的要素類用 UML 類圖體現。
3) 圖層: 圖層為要素類的專題組合及表現,不同圖層的組合即構成了可視化 「成果圖件」。本項目通過對數據來源的分析,提出並建立了適合山東半島城市群地區地質 - 生態環境調查與評價特點的空間資料庫數據圖層。考慮到空間數據的應用和相互轉換,每一圖層均應建立相應的內部屬性表,屬性表必須包含一些基本欄位內容,根據具體任務的不同,需靈活擴充內部屬性表欄位內容。 「成果圖件」數據實體的圖層劃分及其代碼見表 12 -3。
4) 要素類屬性: 要素類的要素特徵由屬性表定義,屬性表每一行對應一個要素,每一列包含要素的一個特徵信息。
表 12 -3 成果圖件數據實體的圖層劃分及其代碼
5) 要素類要素分類: 同一要素類中不同類型的要素用不同的代碼標識,通過屬性表中的 「編碼」 ( GEO_CODE) 數據項體現,以便地圖中同一要素類要素的分類顯示,並保證地圖要素存儲、交換、顯示的一致性。在本項目中成果圖件的基礎地理要素分類代碼採用中華人民共和國國家標准 《國土基礎信息數據分類與代碼》,並根據需要進行了擴充,地質專業要素分類代碼全部由本標準定義,見表 12 -4 和表 12 -5。
表 12 -4 基礎地理要素分類代碼
表 12 -5 地質專業要素分類代碼
圖12 -8 山東半島城市群項目數據包UML類圖
圖層編碼中,第一位為圖類代碼,L 代表基礎地理類圖層; D 代表基礎地質類圖層;G 代表國土資源圖層; W 代表地殼穩定性圖層; S 代表水資源圖層; H 代表海岸帶圖層;T 代表生態環境圖層; R 代表人類工程活動圖層; F 代表分析評價圖層; Y 代表預測與防治圖層; Z 代表輔助圖層。第二位為比例尺代碼,圖件均採用 1∶ 50 萬比例尺,代碼為 B。第三位到第五位為圖名的漢語拼音首字母縮寫。第六位為圖層數字編號。
( 四) 山東半島城市群項目 UML 類圖
1. 山東半島城市群項目數據包 UML 類圖
UML 類圖見圖 12 - 8。
2. 成果圖件要素集 UML 類圖
1) 基礎地理要素集實體 UML 類圖 ( FD_Geography) 。本項目將基礎地理要素分為地理網格、居民地、境界、交通網、地貌地形、水系、海洋海岸帶、行政區劃、柵格數據等 9個抽象要素類,建立了 「各市基本情況」對象類,與表明各地區域的 「城市群」類相連接,將山東半島城市群8 個地級市的地理位置數據與地區的基本資料數據有機地聯系起來。
2) 地質要素集實體 UML 類圖 ( FD_Geology) 。
3) 國土資源要素集實體 UML 類圖 ( FD_LandResource) 。
4) 水資源要素集實體 UML 類圖 ( FD_WaterResource) 。
5) 生態環境要素集實體 UML 類圖 ( FD_Environment) 。
6) 輔助要素集實體 UML 類圖 ( FD_Ancillary) 。
3. 山東半島城市群項目數據實體關系圖
1) 數據集實體 ER 圖 ( MGRD_DataSet) 。
2) 研究成果報告數據實體 ER 圖 ( MGRD_SummaryReport) ( 圖 12 - 9) 。
圖 12 -9 研究成果報告數據實體 ER 圖 ( MGRD_SummaryReport)
七、山東半島城市群項目數據包數據字典
( 一) 數據集實體 ( MGRD_DataSet)
山東半島城市群地區地質-生態環境與可持續發展研究
( 二) 研究成果報告數據實體 ( MGRD_SummaryReport)
1. 文字報告數據實體 ( SR_WordReport)
山東半島城市群地區地質-生態環境與可持續發展研究
2. 成果圖件數據實體 ( SR_ThemeMapSet)
( 1) 基礎地理要素集實體 ( FD_Geography)
山東半島城市群地區地質-生態環境與可持續發展研究
( 2) 地質要素集實體 ( FD_Geology)
山東半島城市群地區地質-生態環境與可持續發展研究
( 3) 水資源要素集實體 ( FD_HydroResource)
山東半島城市群地區地質-生態環境與可持續發展研究
❸ 空間資料庫的空間資料庫的特點
1、數據量龐大。
空間資料庫面向的是地理學及其相關對象,而在客觀世界中它們所涉及的往往都是地球表面信息、地質信息、大氣信息等及其復雜的現象和信息,所以描述這些信息的數據容量很大,容量通常達到 GB級。
2、具有高可訪問性 。
空間信息系統要求具有強大的信息檢索和分析能力, 這是建立在空間資料庫基礎上的,需要高效訪問大量數據。
3、空間數據模型復雜
空間資料庫存儲的不是單一性質的數據,而是涵蓋了幾乎所有與地理相關的數據類型,這些數據類型主要可以分為 3 類:
(1)屬性數據:與通用資料庫基本一致,主要用來描述地學現象的各種屬性,一般包括數字、文本、日期類型。
(2)圖形圖像數據:與通用資料庫不同,空間資料庫系統中大量的數據藉助於圖形圖像來描述。
(3)空間關系數據:存儲拓撲關系的數據,通常與圖形數據是合二為一的。
4、屬性數據和空間數據聯合管理。
5、空間實體的屬性數據和空間數據可隨時間而發生相應變化。
6、空間數據的數據項長度可變,包含一個或多個對象,需要嵌套記錄。
7、一種地物類型對應一個屬性數據表文件。多種地物類型共用一個屬性數據表文件。
8、具有空間多尺度性和時間多尺度性。
9、應用范圍廣泛。
空間資料庫的設計
❹ 系統資料庫和模型庫設計
(一)系統資料庫類型
資料庫是整個農用地分等信息系統的基礎,是系統開發設計要考慮的重中之重。在數據形式上,系統資料庫包括兩大塊:一是空間資料庫,二是屬性資料庫。目前的空間數據技術已從以MapInfo為代表的混合型資料庫(空間資料庫+關系型資料庫)發展到以ArcInfo的Coverage為代表的拓展型資料庫。鑒於農用地分等屬性數據量龐大,為減少數據冗餘,提高數據檢索的速度,本研究採用空間數據和屬性數據分開管理的模式,依據關鍵欄位進行綁定,進行科學索引,從而實現空間數據和屬性動態鏈接和高效整合。
1.空間資料庫
江蘇省農用地分等信息系統空間資料庫內容包括以下方面:
(1)土地利用現狀圖層:全省13個省轄市以1996年土地利用現狀圖為基礎,經變更調繪形成以2000年為基準年的土地利用現狀圖,以現行的土地分類標准按八大類分類進行信息提取並分層存儲,系統分別存儲為耕地、林地、水域、未利用地、建設用地等圖層。
(2)全省土壤類型圖層:以土屬為分類單位,比例尺為1:20萬。
(3)1996年和2000年全省行政區劃圖層:在行政區劃中精確到鄉鎮級別,分別提取存儲了市名圖層、縣(區)名圖層、鄉(鎮)名圖層、全省行政界線圖層、市級行政界線圖層、縣(區)級行政界線圖層、鄉(鎮)級行政界線圖層。
(4)評價單元圖層:通過GIS空間疊加功能,利用土地利用現狀圖、行政區劃圖和土壤類型圖疊加產生的評價單元圖層,建立分等評價單元資料庫。
2.屬性資料庫
江蘇省農用地分等信息系統屬性資料庫內容包括以下方面:
(1)土壤屬性數據:以全國第二次土壤普查為基礎,結合全省土壤監測樣點數據,建立土壤質量狀況資料庫,最小單位為土種,包括pH值、有機質含量、表層土壤質地、耕層厚度、障礙層深度、水土侵蝕程度、鹽漬化程度數據。
(2)農田水利環境數據:建立了1996~2000年間各鄉鎮農田水利環境基礎資料庫,包括灌溉保證率、排水條件數據。
(3)土地利用現狀數據:建立了全省13個省轄市的以1996年土地利用現狀圖為基礎,經變更調繪形成的以2000年為基準年的土地利用現狀資料庫,區分耕地中的詳細用地類型差異,標示水田、旱地、荒草地等納入本次評價范圍的用地內容。
(4)全省地形地貌資料庫。
(5)農業區劃數據:輸入了江蘇省農業區劃數據,把江蘇全省劃分為6大區劃,以鄉鎮為最小級別,建立全省鄉鎮的區劃歸屬資料庫。
(6)農業耕作制度數據:建立了全省各市、縣、鄉鎮的農業耕作制度資料庫,包括指定作物水稻和小麥的播種空間分布狀況資料庫。
(7)光溫生產潛力數據:建立了全省各市、縣指定作物水稻和小麥的光溫生產潛力和氣候生產潛力資料庫。
(8)農業投入-產出數據:全省13個省轄市以鄉鎮為單位,建立了1996~2000年農業生產投入-產出資料庫。
(9)作物產量數據:全省13個省轄市以鄉鎮為單位,建立了1996~2000年的指定作物水稻和小麥的產量資料庫。
(10)土地利用詳查分類面積數據:全省13個省轄市以鄉鎮為單位,建立了2000年土地利用詳查分類面積資料庫。
從數據格式上分,資料庫又可分為:①圖件資料庫:指空間數據以及綁定在空間數據上的相關屬性數據,本次江蘇省農用地分等建立了以分等單元為記錄的屬性資料庫,並通過關鍵欄位與空間數據關聯;②分類統計資料庫:包括全省13個省轄市以鄉鎮為單位的1996~2000年指定作物產量統計數據和全省13個省轄市以鄉鎮為單位的2000年土地利用詳查分類面積統計數據。
(二)系統資料庫管理模式
為減少數據存儲冗餘,同時提高索引速度,江蘇省農用地分等信息系統數據文件採用普遍的目錄樹形式進行管理,按省-市-縣行政體系分別存儲相關數據。全省建立13個省轄市分目錄,分目錄下按照各自所含的縣(區)建立子目錄。根據目前行政管理體系現狀,基礎資料大多來源於縣級行政單位,因此採用縣(區)為基本行政單位較為合理,在保證資料來源的同時,也利於資料的分類歸檔存儲。其相對應的空間圖件數據也按精度要求分割到縣級行政單位,既能減少系統調用數據的吞吐量,同時也滿足了系統的精度需求。空間數據、屬性數據、文本數據按照各自所屬的行政級別歸類存儲,同時設立數據文件管理器進行目錄文件的索引管理,見圖3-86。
圖3-86 江蘇省農用地分等信息系統數據文件管理模式圖
(三)系統資料庫結構
資料庫的結構設計決定了數據之間的調用及介面關系,清晰的邏輯調用關系和統一的數據介面格式有利於數據的組織、管理、調用。
1.空間資料庫
江蘇省農用地分等信息系統空間資料庫以矢量圖件的形式存在,以分圖層的方式管理,包括了全省行政界線、土壤類型、按八大類分別提取的土地利用現狀、分等單元等圖層。其中,分等單元圖層作為農用地分等的基礎,考慮到圖層本身信息量大,可能影響到系統運行效率,因此所在圖層的屬性表中只保留了ID欄位,通過ID欄位與外部屬性庫綁定,實現分等單元與外部屬性庫一一對應關系。ID欄位是本圖層的特徵代碼,表徵了單元的唯一性,能體現出單元的圖上位置和行政歸屬。《農用地分等定級規程》(國土資源大調查專用)和《中華人民共和國行政區劃代碼》(GB/T 2260-1999)為本研究分等單元代碼的編碼依據;本研究有1996年和2000年兩套行政區劃工作底圖,為此分等單元特徵代碼共設14位,依次為江蘇省代碼(2位)-市代碼(2位)-2000年縣或區代碼(2位)-2000年鄉鎮代碼(2位)-1996年縣或區代碼(2位)-1996年鄉鎮代碼(2位)-分等單元號(2位)。其中,省、市、縣(區)的行政代碼按國家統一代碼,鄉鎮級代碼在縣(區)范圍內根據劃分分等單元的需要依次編碼;分等單元編號的原則是不破鄉鎮界,即單元號是在同一鄉鎮內部自行編碼。示例:32011501210101,指1996年江蘇(32)南京(01)市江寧縣(21)由於2000年行政調整變更為南京(01)的江寧區(15)。按行政體系分級編碼的優點是有利於空間查詢和國土資源管理部門根據工作需求按行政級別分類匯總統計數據。
2.屬性資料庫
江蘇省農用地分等信息系統採用關系型資料庫來存儲數據,優點是結構清晰明了,數據的更新維護方便,通過索引能優化資料庫,建立快速的查詢瀏覽(表3-26~表3-30)。
表3-26 行政代碼數據結構表
表3-27 土壤屬性數據結構表
表3-28 農田水利設施數據結構表
表3.29 指定農作物投入-產出數據結構表
表3-30 農業耕作制度及農業區劃表
(四)系統模型庫
系統以《農用地分等定級規程》(國土資源大調查專用)中的相關技術方法和計算模型為基礎,在模型庫中預先內置了分等計算模型。模型庫是動態,它允許專家根據情況動態調整計算模型形式及其參數。系統主要模型的數學計算公式如下:
(1)農用地自然質量分值(Clij)計算公式見式(3-11)。
(2)樣點土地利用系數計算公式:
中國耕地質量等級調查與評定(江蘇卷)
式中:
Klj´——樣點的第j種指定作物土地利用系數;
Yj——樣點的第j種指定作物實際單產;
Yj,max——第j種指定作物最大標准糧單產。
(3)等值區土地利用系數計算公式:
中國耕地質量等級調查與評定(江蘇卷)
式中:
Klj——等值區內第j種指定作物土地利用系數;
Klj´——參與計算的同一等值區內合格樣點第j種指定作物土地利用系數;
n——排除異常數據後參與計算的樣點的個數。
(4)樣點土地經濟系數計算公式:
中國耕地質量等級調查與評定(江蘇卷)
式中:
Kcj′——樣點的第j種指定作物土地經濟系數;
Yj——樣點第j種指定作物實際單產;
Cj——樣點第j種指定作物實際成本;
Aj——第j種指定作物最高「產量-成本」指數。
(5)等值區土地經濟系數計算公式:
中國耕地質量等級調查與評定(江蘇卷)
式中:
Kcj——等值區內土地經濟系數;
Kcj´——參與計算的同一等值區內合格樣點第j種指定作物土地經濟系數;
n——排除異常數據後參與計算的樣點的個數。
(6)農用地自然質量等指數(Ri)計算公式見式(3-12)和式(3-13)。
(7)農用地利用等指數(Yi)計算公式見式(3-14)和式(3-15)。
(8)農用地經濟等指數(Gi)計算公式見式(3-16)和式(3-17)。
❺ 基礎資料庫
(一)數據內容
基礎資料庫包括系統運行前所採集到的所有支撐數據,數據的具體內容在數據分類與數據源章節中已描述,概括可分為以下幾類。
(1)遙感影像數據:包括歷史圖像數據,以及按照一定監測周期更新的遙感圖像數據。
(2)數字線劃圖數據:矢量數據(現狀專題圖和歷史專題圖數據)、柵格數據、元數據等。入庫前數據以ArcInfoCoverage格式分幅或整體存儲,採用地理坐標系統。
(3)數字柵格圖數據:包括1∶5萬和1∶10萬基礎地理圖形數據的掃描柵格數據。
(4)數字高程模型數據:塔里木河幹流河道1∶1萬和「四源一干」區域1∶10萬數字高程模型。
(5)多媒體數據:考察照片、錄像、錄音和虛擬演示成果等多媒體資料。
(6)屬性數據:社會經濟與水資源數據、水利工程數據、生態環境數據等。
(二)數據存儲結構
1.柵格數據
柵格數據包括遙感影像、數字柵格圖、數字正射影像圖、數字高程模型等,這些數據的存儲結構基本類似,因此可進行統一設計。遙感圖像資料庫與普通的圖像資料庫在存儲上有些差別,遙感圖像作為感測器對地理、空間環境在不同條件下的測量結果(如光譜輻射特性、微波輻射特性),必須結合同時得到的幾個圖像才可以認為是對環境在一定的時間條件下的完整的描述,也即是說,可能需要一個圖像集合才能構成一個圖像的完整的概念,並使之與語義信息產生聯系(羅睿等,2000)。因此,遙感圖像數據存儲結構模型必須能夠描述幾個圖像(波段)之間的邏輯關系。利用ArcSDE進行數據入庫時,系統可自動建立各圖像(波段)之間的關系,並按一定規則存儲在資料庫系統中。
對柵格數據在後台將採用Oracle資料庫管理系統進行存儲。Oracle系統可直接存儲影像信息,並具有較強的數據管理能力,可以實現柵格數據信息的快速檢索和提取。數據引擎採用ArcSDE,實現各類影像數據的入庫。數據存儲的關鍵是建立圖幅索引,本系統數據的存儲按圖幅號、圖名、採集時間等內容建立索引。
柵格數據依據圖形屬性一體化的存儲思想,採用大二進制格式直接存儲數據,這種方式的存儲可實現內容的快速檢索查詢,按索引表檢索出相關項後可直接打開柵格數據,提高柵格數據的管理效率。
2.矢量數據
本系統採用圖屬一體化思想即將空間數據和屬性數據合二為一,全部存在一個記錄集中的思想存儲空間數據,是目前GIS數據非常流行的存儲方法。考慮到數據的具體情況,決定採用資料庫存儲空間數據和屬性數據,部分具有少量、定型幾何信息的地理要素如水文測站、河流、湖泊等,採用圖屬一體化思想存儲其信息,而與其有關聯關系的大量、多邊化的屬性信息如水文信息,則存儲在屬性數據表中,利用唯一標識符信息建立兩表的關聯。
針對本系統空間數據的特點,系統按照「資料庫—子庫—專題(基礎數據)—層—要素—屬性」的層次框架來構築空間資料庫,按照統一的地理坐標系統來存儲空間數據,以實現對地理實體/專題要素進行分層疊加顯示。
3.多媒體數據
Oracle系統可直接存儲圖片和視頻信息,並具有較強的數據管理能力,可以實現多媒體信息的快速檢索和提取。多媒體數據存儲的關鍵是建立索引表,本系統多媒體數據的存儲按類型、時間、內容等項目建立索引,直接存儲於Oracle資料庫中。
多媒體數據存儲時,可以將多媒體內容與索引表結構合為一體,採用大二進制格式直接存儲,這種存儲方式可實現內容的快速檢索和查詢,按索引表檢索出相關項後可直接打開多媒體內容,而且多媒體資料庫也便於維護管理。
(三)空間索引設計
1.矢量空間索引
確定合適的格網級數、單元大小是建立空間格網索引的關鍵。格網太大,在一個格網內有多個空間實體,查詢檢索的准確度就低。格網太小,則索引數據量成倍增長和冗餘,檢索的速度和效率低。每一個數據層可採用不同大小、不同級別的空間索引格網單元,但每層級數最多不能超過三級。索引方式設置遵循以下基本原則:
(1)對於簡單要素的數據層,盡可能選擇單級索引格網,減少RDBMS搜索格網單元索引的級數,縮短空間索引搜索的過程;
(2)如果數據層中的要素封裝邊界大小變化比較大,應選擇2或3級索引格網;
(3)如果用戶經常對圖層執行相同的查詢,最佳格網的大小應是平均查詢范圍的1.5倍;
(4)格網的大小不能小於要素封裝邊界的平均大小。為了減少每個格網單元有多個要素封裝邊界的可能性,格網單元的大小應取要素封裝邊界平均大小的3倍;
(5)格網單元的大小不是一個確定性的問題,需要多次嘗試和努力才會得到好的結果。有一些確定格網初始值的原則,用它們可以進一步確定最佳的格網大小。
SDE(Spatial Data Engine,即空間數據引擎),從空間管理的角度看,是一個連續的空間數據模型,可將地理特徵的空間數據和屬性數據統一集成在關系型資料庫管理系統中。關系型資料庫系統支持對海量數據的存儲,從而也可實現對空間數據的海量存儲。空間數據可通過層來進行數據的劃分,將具有共同屬性的一類要素放到一層中,每個資料庫記錄對應一層中一個實際要素,這樣避免了檢索整個數據表,減少了檢索的數據記錄數量,從而減少磁碟輸入/輸出的操作,加快了對空間數據查詢的速度。
ArcSDE採用格網索引方式,將空間區域劃分成合適大小的正方形格網,記錄每一個格網內所包含的空間實體(對象),以及每一個實體的封裝邊界范圍,即包圍空間實體的左下角和右上角坐標。當用戶進行空間查詢時,首先計算出用戶查詢對象所在格網,然後通過格網號,就可以快速檢索到所需的空間實體。因此確定合適的格網級數、單元大小是建立空間格網索引的關鍵,太大或太小均不合適,這就需要進行多次嘗試,確定合適的網格大小,以保證各單元能均勻落在網格內。利用ArcSDE的索引表創建功能,記錄每一網格單元的實體分布情況,形成圖層空間索引表。根據空間索引表,ArcSDE實現了對空間數據的快速查詢。
2.柵格數據空間索引
柵格數據的空間索引通過建立多級金字塔結構來實現。以高解析度柵格數據為底層,逐級抽取數據,建立不同解析度的數據金字塔結構,逐級形成較低解析度的柵格數據。該方法通常會增加20%左右的存儲空間,但卻可以提高柵格數據的顯示速度。在資料庫查詢檢索時,調用合適級別的柵格數據,可提高瀏覽和顯示速度。
(四)入庫數據校驗
入庫數據的質量關繫到系統評價分析結果的准確性。數據在生產中就需要嚴格進行質量控制。依據數據生產流程,將數據質量控制分成生產過程式控制制和結果控制。生產過程式控制制包括數據生產前期的質量控制、數據生產過程中的實時質量控制,結果質量控制為數據生產完成後的質量控制(裴亞波等,2003)。對入庫數據的校驗主要是進行數據生產完成後的質量控制和檢查。
1.規范化檢查
(1)代碼規范化:所有地理代碼盡量採用國家標准和行業標准,例如,行政代碼採用中華人民共和國行政區劃代碼國標。
(2)數據格式規范化:所有數據採用標准交換數據格式,例如,矢量數據採用標准輸出Coverage格式和E00格式。
(3)屬性數據和關系數據欄位規范化:所有屬性數據和關系數據提前分門別類地設計欄位的內容、長短和格式,操作過程中嚴格執行。
(4)坐標系統規范化:本系統所有與空間有關的數據採用統一的空間坐標系統,即地理坐標系統。
(5)精度規范化:所有數據按照數據精度與質量控制中所要求的精度進行採集和處理。
(6)命名規范化:所有數據按照命名要求統一命名,便於系統的查詢。
(7)元數據規范化:依照元數據標准要求,進行元數據檢查。
2.質量控制
數據質量是GIS成敗的關鍵。對於關系型資料庫設計,只要能保證表的實體完整性和參照完整性,並使之符合關系資料庫的三個範式即可。對於空間資料庫設計,則不僅要考慮數據采樣、數據處理流程、空間配准、投影變換等問題,還應對數據質量做出定量分析。
數據質量一般可以通過以下幾個方面來描述(吳芳華等,2001):
(1)准確度(Accuracy):即測量值與真值之間的接近程度,可用誤差來衡量;
(2)精度(Precision):即對現象描述得詳細程度;
(3)不確定性(Uncertainty):指某現象不能精確測得,當真值不可測或無法知道時,就無法確定誤差,因而用不確定性取代誤差;
(4)相容性(Compatibility):指兩個來源不同的數據在同一個應用中使用的難易程度;
(5)一致性(Consistency):指對同一現象或同類現象表達的一致程度;
(6)完整性(Completeness):指具有同一準確度和精度的數據在類型上和特定空間范圍內完整的程度;
(7)可得性(Accessibility):指獲取或使用數據的容易程度;
(8)現勢性(Timeliness):指數據反映客觀現象目前狀況的程度。
塔里木河流域生態環境動態監測系統的所有數據在數據質量評價後,還需要從數據格式、坐標一致性等方面進行入庫質量檢驗,只有通過質量檢驗的數據才可以入庫。
3.數據檢驗
空間數據質量檢驗包括以下步驟:
(1)數據命名是否規范,是否按設計要求命名;
(2)數據是否能夠正常打開;
(3)投影方式是否正確;
(4)坐標系統是否正確;
(5)改錯是否完成,拓撲關系是否建立;
(6)屬性數據是否正確,包括欄位設置是否依據設計進行、是否有空屬性記錄、是否有屬性錯誤記錄等。
關系數據質量檢驗包括以下步驟:
(1)數據命名是否規范,是否按設計要求命名;
(2)數據是否能夠正常打開;
(3)數據欄位是否按設計要求設置;
(4)是否有空屬性記錄;
(5)是否有屬性錯誤記錄。
屬性數據的校驗,主要採用以下三種方式:
(1)兩次錄入校驗:對一些相互之間毫無關聯的數據,進行兩次的錄入,編寫程序對兩次錄入的結果進行比較,找出兩次錄入結果不一樣的數據,查看正確值,進行改正。
(2)折線圖檢驗:對一些相互之間有關聯的序列數據,如人口統計數據,對這一類數據,編寫程序把數據以折線圖的形式顯示在顯示器上,數據的序列一般都有一定規律,如果出現較大的波動,則需對此點的數據進行檢查修改。
(3)計算校驗:對一些按一定公式計算後所得結果與其他數據有關聯的數據,如某些數據的合計等於另一數據,編寫程序對這類數據進行計算,計算結果與有關聯的數據進行比較,找出結果不一樣的數據,查看正確值,進行改正。
圖形數據的校驗,主要包括以下步驟(陳俊傑等,2005):
(1)圖層校驗:圖形要素的放置圖層是唯一的。對於入庫的Coverage數據,系統將根據圖層代碼進行檢查,確保圖形要素對層入座。
(2)代碼檢查:圖形要素的代碼是唯一的。對於入庫的Coverage數據,系統將根據入庫要素代碼與特徵表中的代碼進行比較,確保入庫數據代碼存在,杜絕非法代碼入庫。
(3)類型檢查:對入庫的數據,檢查該要素的類型與特徵表中的類型是否一致,確保圖形要素對表入座。如點要素、線要素、面要素僅能賦相應的點、線、面代碼,且該代碼必須與特徵表中的數據類型代碼相同。
(4)范圍檢查:根據入庫的數據,確定該類要素的大體范圍(如X、Y坐標等),在數據入庫前,比較入庫數據與范圍數據的大小,若入庫數據在該范圍內,則入庫,否則給出提示檢查信息。
(五)數據入庫
1.遙感影像數據
利用空間數據引擎———ArcSDE可實現遙感影像數據在Oracle資料庫中的存儲和管理,在影像數據進行入庫時,應加入相應的索引和影像描述欄位。
遙感影像入庫步驟:
(1)影像數據預處理:要將塔里木河遙感影像資料庫建成一個多解析度無縫影像資料庫系統,客觀上要求資料庫中的影像數據在幾何空間、灰度空間連續一致。因此,在數據採集階段就需要對影像數據進行預處理,包括圖像幾何校正、灰度拼接(無縫鑲嵌)、正射處理、投影變換等。
幾何校正的目的是使校正後的圖像重新定位到某種地圖投影方式,以適用於各種定位、量測、多源影像的復合及與矢量地圖、DTM等的套合顯示與處理。幾何校正多採用二次多項式演算法和圖像雙線性內插重采樣法進行圖像校正。將糾正後具有規定地理編碼的圖像按多邊形圈定需要拼接的子區,逐一鑲嵌到指定模版,同時進行必要的色彩匹配,使整體圖像色調一致,完成圖像的幾何拼接,再採用金字塔影像數據結構和「從粗到精」的分層控制策略實現逐級拼接。
數字正射影像具有統一的大地坐標系、豐富的信息量和真實的景觀表達,易於製作具有「獨立於比例尺」的多級金字塔結構影像。可以採用DTM和外方位元素經過數字微分糾正方法,獲得數字正射影像,它的基本參數包括原始影像與正射影像的比例尺、采樣解析度等(方濤等,1997)。
投影變換需根據資料庫系統定義的標准轉換到統一的投影體系下。
(2)影像數據壓縮:隨著感測器空間解析度的提高和對遙感信息需求的日益增長,獲取的影像數據量成幾何級數增大,如此龐大的數據將佔用較大的存儲空間,給影像的存儲和傳輸帶來不便(葛詠等,2000)。目前,系統處理的遙感影像數據已達數百千兆,單個文件的影像數據最大達到了2G,這樣的數據量在調用顯示時速度很慢,對影像數據進行壓縮存儲,將大大提高影像訪問效率。本系統採用ArcSDE軟體提供的無損壓縮模式對入庫影像進行壓縮。
(3)影像導入:遙感影像的入庫可通過ArcSDE或入庫程序進行導入,並填寫相關的索引信息,在入庫時對大型的遙感影像數據進行自動分割,分為若乾的塊(tiles)進行存儲。
(4)圖像金字塔構建:採用ArcSDE提供的金字塔構建工具在入庫時自動生成圖像金字塔,用戶只需要選擇相應的參數設置即可。圖像金字塔及其層級圖像按解析度分級存儲與管理。最底層的解析度最高,並且數據量最大,解析度越低,其數據量越小,這樣,不同的解析度遙感圖像形成了塔式結構。採用這種圖像金字塔結構建立的遙感影像資料庫,便於組織、存儲與管理多尺度、多數據源遙感影像數據,實現了跨解析度的索引與瀏覽,極大地提高了影像數據的瀏覽顯示速度。
2.數字線劃圖
對紙圖數字化、配准、校正、分層及拼接等處理後,生成標准分幅和拼接存儲的數字矢量圖,就可以進行圖形數據入庫。
(1)分幅矢量圖形數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間、圖層等方式,通過入庫程序導入到資料庫中,同時導入與該地理信息相對應的屬性信息,建立空間信息與屬性信息的關聯。
(2)拼接矢量圖形數據:按圖形比例尺、製作時間、圖層等方式,通過入庫程序導入到資料庫中,同時導入與該地理信息相對應的屬性信息,建立空間信息與屬性信息的關聯。
3.柵格數據
對紙圖數字化、配准、校正、分層及拼接等處理後,生成標准分幅和整體存儲的數字柵格圖,然後進行圖形數據入庫。
(1)分幅柵格圖形數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間等方式,通過入庫程序導入到資料庫中。
(2)整幅柵格圖形數據:按比例尺、製作時間等方式,通過入庫程序導入到資料庫中。
4.數字高程模型
(1)分幅數字高程模型數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間等方式,通過入庫程序導入到資料庫中。
(2)拼接數字高程模型數據:按比例尺、製作時間等方式通過入庫程序導入到資料庫中。
5.多媒體數據
多媒體數據入庫可根據多媒體資料庫內容的需要對入庫數據進行預處理,包括音頻、視頻信息錄制剪接、文字編輯、色彩選配等。對多媒體信息的加工處理需要使用特定的工具軟體進行編輯。由於音頻信息和視頻信息數據量巨大,因此,對多媒體數據存儲時需採用數據壓縮技術,現在的許多商用軟體已能夠直接存儲或播放壓縮後的多媒體數據文件,這里主要考慮根據數據顯示質量要求選擇採用不同的存儲格式。圖4-2為各類多媒體數據的加工處理流程。
圖4-2 多媒體數據加工處理流程圖
6.屬性數據
將收集的社會經濟、水利工程、生態環境等屬性資料,進行分析整理,輸入計算機,最後經過程序的計算處理,存儲到資料庫中,具體流程如圖4-3所示。
圖4-3 屬性數據入庫流程圖
❻ 地質-生態環境空間資料庫建設指南
一、編寫目的
建立山東半島城市群地質-生態環境空間資料庫,是「山東半島城市群地區地質-生態環境綜合調查評價及可持續發展研究」項目的設計要求,而山東半島城市群地質-生態環境空間資料庫建設,涉及地質、環境、水文、礦產等專業,並涉及單位較多,需要提交入庫的數據也較多,為了指導和規范資料庫項目的建設,特編寫本指南,重點從建庫的數據整理與格式轉換階段規范工作流程,明確最終提交成果,同時對元數據的填寫做出了詳細規定,本指南對山東半島城市群空間資料庫建設具有指導作用。
二、適用范圍
本指南適用於山東半島城市群地質-生態環境空間資料庫建設工作。
三、編寫依據及參考標准
1.國家及行業標准
GB/T2260—1999中華人民共和國行政區劃代碼
GB/T17798—1999地球空間數據交換格式
GB/T13923—92國土基礎信息數據分類與代碼
GB/T17766—1999固體礦產資源/儲量分類
GB/T13989—92國家基本比例尺地形圖分幅和編號
GB/T9649—88地質礦產術語分類代碼
GB/T9649.16—1998地質礦產術語分類代碼礦床學
DZ/T0197—1997數字化地質圖圖層及屬性文件格式
2.部門標准
GX199900X-200X國土資源信息高層分類編碼及數據文件命名規則國土資源部省級礦產資源規劃編制指南國
國土資源部礦產資源儲量資料庫標准
中國地質調查局空間資料庫工作指南2.0版
版山東半島城市群地質-生態環境空間資料庫建庫標准(試行稿)
四、資料庫框架設計
1.資料庫需求分析
山東半島城市群資料庫是在「山東半島城市群生態環境地質」項目研究成果的基礎上研製、基於Arcinfo平台的空間資料庫系統,其總體目標是存儲和管理「山東半島城市群生態環境地質」項目研究成果的資料、信息、地圖及提供查詢服務,為山東半島城市群的空間布局管理、規劃和決策以及重大項目建設和經濟社會可持續發展提供依據。為達成這一總體目標,對資料庫建設的需求應該包括以下方面:
1)對項目成果圖件及其他數據存儲管理的需求,需要構建一個符合要求的空間資料庫。
2)提供對山東半島城市群生態環境地質研究成果的管理、查詢與展示。
3)提供山東半島城市群生態、環境的現狀與分級分布情況。
4)組織山東半島城市群生態環境專題圖件,直觀地為決策咨詢提出相應的對策和解決方案。
(1)功能需求
通過需求分析,得到軟體的功能需求。除基本的數據輸入、編輯和管理功能外,本系統還應具有以下4個方面的要求:
1)對現有地質-生態環境問題的展示、查詢;
2)地質-生態環境質量現狀的分析;
3)對地質-生態環境與可持續發展關系的分析評價;
4)保持經濟增長和地質-生態環境相協調的對策與建議。
(2)性能需求
本資料庫系統的性能需求為:
1)系統穩定性好;
2)可擴展性好;
3)操作簡單;
4)可移植性好;
5)保密性。
根據「山東半島城市群地區地質-生態環境綜合調查評價及可持續發展研究」項目需求分析,資料庫涉及的基礎圖件和數據、項目研究的成果數據如下:
1)基礎地理、地質圖件,採用1∶20萬的地理底圖和經過簡化的地質底圖。
2)各專題項目編匯的成果圖件,包括:
山東半島城市群地區地質圖;
山東半島城市群地區衛星遙感影像圖;
山東半島城市群地區區域穩定性綜合評價圖;
山東半島城市群地區土地資源環境質量評價圖;
山東半島城市群地區礦產資源綜合評價圖;
山東半島城市群地區地表水評價圖;
山東半島城市群地區地下水環境評價圖;
山東半島城市群地區海岸帶地質災害分布圖;
山東半島城市群地區生態環境綜合評價圖;
山東半島城市群地區地質災害易發區分布圖;
山東半島城市群地區地質生態與經濟可持續發展對策圖;
煙台地區地殼穩定性評價分區圖;
煙台地區地質-生態環境分析與評價圖;
煙台地區生態功能區劃與生態市建設規劃圖;
青島地區地殼穩定性評價分區圖;
青島地區海岸帶地質環境質量評價圖;
青島地區地質-生態環境評價分區圖。
3)屬性數據;
4)文字報告;
5)專題圖件數據。
2.資料庫系統架構
根據以上對資料庫需求的分析,結合目前項目的需要和經費情況,採用的系統架構見圖12-1。
圖12-1 資料庫系統架構
本項目採用 ArcGIS Desktop 來搭建系統平台,用以實現定義好的空間數據和非空間數據的存儲和管理。系統的核心採用地理資料庫 GeoDataBase 體系結構。在後台通過 ArcCat-alog 應用模塊來組織和管理所有的 GIS 信息,比如地圖、數據集、模型、元數據、服務等; 通過 ArcToolBox 工具來完成數據轉換、疊加處理、地理編碼、統計分析和投影變換等數據處理。
客戶端採用定製的 ArcMap,用以完成數據的顯示、分析和編輯。另外可以通過 Arc-GIS 的擴展模塊來實現對空間數據進行高效率的可視化和分析; 用 ArcGIS Spatial Analyst實現柵格數據的顯示和處理。ArcGIS Desktop 系統平台表現示例見圖 12 -2。
在系統資料庫建成之後,如項目的後期需要進行數據的共享和發布,可採用 ArcSDE +ArcIMS 的搭配來實現 B / S 構架的數據共享。
圖12-2 ArcGIS Desktop系統平台表現示例
3.資料庫系統功能軟體的系統功能分為基本系統數據管理功能和專業應用擴展功能兩大部分。根據需求分析,確定各部分的功能。
1)基本功能部分:包括系統管理,數據輸入、編輯、查詢和輸出,數據處理和圖形符號庫管理等。
2)擴展功能部分:包括現狀展示、分析評價、可持續發展評價和決策支持等。系統的功能模塊構成見圖12-3。
圖12-3 系統的功能模塊構成
4.系統軟體平台
在本項目的研究中,結合調查評價研究項目的工作實際,選取了美國ESRI公司的ArcGIS軟體作為資料庫開發的GIS軟體平台,同時考慮到各專題研究單位的實際情況,選取MapGIS作為電子圖件的繪制軟體。在匯總各專題研究單位提交的MapGIS數字圖件後,進行MapGIS格式數據向ArcGIS格式數據的轉換,將研究成果載入到項目統一的地質-生態環境空間資料庫中。本項目選擇的ArcGIS軟體平台包括ArcGISDesktop、ArcS-DE、ArcIMS等組件。
5.硬體平台選擇
除按系統平台的選擇原則外,硬體選擇從以下方面考慮:
1)硬體的性能:能夠滿足系統軟體平台的運行需求;
2)與其他硬體的兼容性:各種硬體設備可以協同工作;
3)與軟體的兼容性:要兼容操作系統、資料庫軟體或其他應用軟體。
可利用現有的計算機硬體,適當增設需要的硬體來構造系統的硬體環境。
6.系統實現步驟
(1)系統設計
1)總體結構設計:主要指系統中各子系統之間關系的設計。
2)系統各子系統或子功能模塊的描述:各功能模塊要劃分到軟體單元的層次,要求描述清晰,以滿足編碼、編譯和測試的需要。
3)系統外部介面設計:完成系統外部介面、各軟體單元之間的詳細設計。
4)數據結構和資料庫設計:主要指規劃數據組織與表達方式的設計。
5)界面設計:主要指應用系統的操作界面設計。
6)軟、硬體設計:主要指系統軟硬體運行環境的設計。
7)系統單元測試的詳細計劃:包括測試集、測試用例和測試步驟。
(2)軟體編程
完成程序代碼的編寫及資料庫建庫任務。
1)遵照軟體設計說明書的要求,利用編程工具編製程序代碼,並完成程序代碼的測試工作。
2)按照半島城市群項目資料庫標准及資料庫建庫規范的要求,完成數據建庫工作。
(3)系統集成與測試
完成系統集成及測試,生成可實際運行的系統,編寫用戶使用手冊。
1)系統集成。
2)系統集成測試。集成測試的步驟為:
①制定系統各單元、模塊、子系統的集成計劃和集成測試計劃,內容包括測試要求、步驟、數據和時間表等;②編寫系統集成、測試文檔;③按計劃進行系統集成與集成測試,修改錯誤,再測試,直到符合設計要求;④編寫測試報告。
3)編寫用戶使用手冊。
五、數據入庫工作流程
工作流程主要用於對規劃資料庫數據入庫方法和過程進行指導。項目資料庫的數據入庫流程見圖12-4。
圖12-4 數據入庫流程
1.資料收集
主要包括圖件、表格和文字資料等項目所涉及的數據和成果。
2.資料預處理
數據預處理就是在全面收集資料的基礎上,對資料進行系統的分析研究、綜合整理及篩選等。
3.建庫文檔准備
主要是指對建庫所需的文檔進行准備,主要為數據整理記錄表、屬性填卡表准備,MapGIS編圖的花紋符號庫、線型庫、顏色庫設定等。
4.數據採集
數據的採集主要包括圖件的輸入、建立分層文件、屬性的輸入。
5.數據整理
數據整理的主要內容為:檢查數據分層,重新命名分層文件,補充新增圖層、調整部分地理、地質和規劃專題屬性結構,增加部分屬性表格,以及整理附加文檔等,完成上述工作後要填寫元數據採集表並完成對元數據的錄入,最後,對所有文件要進行標准化命名。
6.空間數據格式轉換
按照項目建庫的統一要求,各子項目在MapGIS平台下完成的成果圖件,數據需要向ArcInfo格式進行轉換。
六、數據質量監控
1.質量監控體系
項目承擔單位和實施單位要建立完善的規劃資料庫建設質量監控體系,並制定相應的制度。
(1)自互檢
建立完整的自互檢表,每個作業人員的建庫工作都要進行100%的自檢,並將自檢所發現的問題及時改正。在自檢的基礎上,由項目負責人安排其他作業人員進行60%以上的互檢,並將互檢結果和修改處理結果如實、完整地記錄下來。
(2)抽檢
每張圖完成後,由項目負責抽取10%進行檢查,並確保檢查內容全部符合質量要求。
(3)階段性檢查
對建庫的每個階段性成果要進行嚴格檢查把關,如圖件掃描矢量化後的圖元檢查;屬性錄入後的圖元、屬性一致性檢查等。
2.數據質量監控
(1)空間數據質量檢查
空間數據質量檢查主要是對成果圖上的內容進行質量檢查,要分別對MapGIS和ArcInfo格式的所有圖層進行逐項檢查,包括入庫數據圖層套合精度、拓撲、命名的標准化規范化、分層的正確性、數據的完整性、屬性表結構的正確性、圖元與屬性的對應性、屬性代碼的准確性等。
(2)圖面質量檢查
圖面檢查是指對提交的成果數據圖進行圖面內容檢查,發現錯誤應及時修改完善,直至准確無誤。
(3)數據表數據質量檢查
是指對非空間數據表和空間屬性數據表檢查數據的正確性,檢查數據結構的一致性,並對照規劃文本檢查與規劃實施相關內容的完整性和正確性。
(4)文檔檢查
資料文檔檢查主要是檢查資料庫所要求的文本、研究報告、編制說明、附表等資料文檔是否齊全,內容是否正確,並檢查元數據採集表及入庫數據內容是否合乎要求。
3.數據質量監控指標
上述內容的檢查總錯誤率小於2%,其中,圖元(包括點、線、面、注釋)錯誤率小於1%,屬性(包括文字、代碼、ID號對應、記錄個數等)錯誤率小於2%,凡錯誤率大於該兩值的,或發生圖層缺失、附表缺失、文檔缺失以及未提交正確的元數據採集表和入庫數據的,一律不予通過。
七、提交數據要求
1.提交格式
成果圖件:MapGIS格式,含工程、圖層和系統庫文件。
文檔:包括編制說明、研究報告及其他文檔資料(Word和Html兩種格式)。表格:Access和Excel兩種格式。
元數據採集表:Word格式。
2.提交形式
匯交數據存儲介質為光碟。在提交成果之前,要進行全面查殺毒,確保數據安全。
❼ 如何使用ArcGIS Diagrammer設計空間資料庫框架
從軟體本身功能模塊來看,主要包括以下幾大功能。1.空間數據的編輯和管理功能空間數據的編輯和管理是地理信息系統軟體的基本功能之一。ArcGIS具有強大的數據編輯、版本管理、數據共享、企業級數據管理功能,還具有空間數據採集、空間資料庫創建、拓撲關系創建與管理等功能。從基本數據管理功能上看,ArcGIS的geodatabase空間資料庫可以理解為是存放在同一位置的各類型地理數據集的集合,其存放位置可以是某一文件夾(本地)、Access資料庫或者是同一個多用戶關系型資料庫管理系統(DBMS),支持Oracle,MicrosoftSQLSever,PostgreSQL,Informix及IBMDB2。而文件地理資料庫是ArcGIS中另外一種地理資料庫的類型,以文件夾形式將數據集存儲在計算機中。每個數據集作為一個文件進行存儲,文件大小可達1TB,支持跨平台使用,還可以進行壓縮和解密。文件地理數據和個人地理資料庫是專為支持地理資料庫的完整信息模型而設計的,包含拓撲、柵格目錄、網路數據、Terrain數據集、地址定位器等。而這兩種資料庫都不支持版本地理資料庫的版本管理。ArcSDE地理資料庫是為了讓多用戶的地理資料庫進行資料庫管理,在大小和用戶數量方面沒有限制,如果需要在地理資料庫中使用歷史存檔、復制數據、使用SQL訪問簡單數據或在不鎖定的情況下同時編輯數據,可以使用ArcSDE地理資料庫。同樣支持Oracle,MicrosoftSQLSever,PostgreSQL,Informix及IBMDB2等主流DBMS。當然ArcGIS具有強大的基本數據編輯功能,這個功能將在下面的章節中詳細介紹。對於開發者而言,ArcObjects(即AO)中的地理資料庫API提供對所有類型地理資料庫及其他類型的GIS數據很好地控制,提供所有從簡單資料庫創建、數據查詢到高級數據集合的構建(網路、拓撲等)及高級的地理資料庫功能,如版本管理、資料庫復制等API。使用AOAPI,開發者不僅可以在已有的桌面產品(ArcGISDesktop)中定製功能,還可以開發獨立的應用程序。ArcSDEAPI提供開發者直接控制ArcSDE地理資料庫的能力。2.制圖表達及高級制圖功能ArcGIS平台擁有完整的地圖生產體系,包括制圖符號化、地圖標注、制圖編輯、地圖輸出和列印。ArcGIS10在制圖上有較多改善,這部分內容在1.3節「ArcGIS10新功能」中詳細介紹。3.地理處理功能地理處理的基礎是數據變換,在ArcGIS中,Geoprocessing包含了幾百個空間處理工具執行對數據集的各種操作,從而生成新的數據集。ArcGIS提供了Modelbuilder對話框以支持設計這些工具所組成的操作流程,這樣就可以設計出各種模型來實現自動化工作,執行復雜問題的分析。4.空間分析等擴展模塊空間分析是GIS最具特色的一部分內容,事實上空間分析屬於數據地理處理的一部分。但鑒於其支持豐富復雜的操作,支持多種獨立信息源的融合,ArcGIS將其作為獨立的擴展模塊。基於ArcToolbox和Modelbuilder可視化建模環境的空間處理框架,空間分析功能可以得到豐富多樣的分析處理結果。鑒於其功能涵蓋面較廣,第五篇將有獨立介紹該功能模塊的詳細內容。5.三維可視化和分析擴展模塊柵格數據是GIS數據的重要來源,由衛星和航空器及其他柵格數據採集器得到。另外,數字高程模型、掃描紙質地圖、專題柵格數據等也是柵格數據的重要來源。ArcGIS可以進行影像管理、處理、發布和使用,如二三維一體化的影像顯示和瀏覽,柵格影像數據的存儲、編目、處理和分發,影像分析和動態處理,影像服務的發布及地圖緩存的製作等。三維可視化和分析是目前GIS應用重要發展方向之一,也是熱門技術之一。除以上介紹的基本GIS功能之外,ArcGIS還具備應用平台企業級GIS,CAD系統集成整合功能,以及目前流行的雲計算技術等。本書重點介紹前5個基本功能。
❽ 遙感作業空間資料庫的建立流程有那些
建模,入庫,生產。
資料庫建模過程。這一過程主要是根據行業應用特點及對其的理解,制定出比較規范的數據規范,在邏輯上建設資料庫。數據監理過程。這一過程主要是檢測數據的正確性,從而保證建庫的准確性。利用各種工具將各種數據入庫的過程。此過程主要是將可以得到的各種數據紙制數據,矢量數據,柵格數據,遙感數據等快速、准確的入到庫中。
通過設計和建database空間資料庫,掌握空間資料庫設計和建設流程,學會所學GIS知識獨立分析決問題的能力,對所學建庫知識進行一個完整的串接。需求分析,旅遊業是一個綜合性很強的信息依賴型產業,旅遊信息的獲取、加工、傳播和利用對旅遊業的發展起著舉足輕重的作用。從旅遊者和旅遊規劃管理部門的需求出發建立旅遊信息資料庫,不僅可以使旅遊者和旅遊規劃管理部門能夠快速、准確地查找和檢索自己所需要的旅遊信息,而且能夠促進旅遊信息規范化和標准化,促進旅遊信息的共享,打破對旅遊信息的封鎖;旅遊信息資料庫的建立有利於從整體上對旅遊業進行宏觀的調控和管理,有利於旅遊業協調、健康有序的發展。
❾ 如何使用ArcGIS Diagrammer設計空間資料庫框架
1
打開軟甲,新建一個新建一個Diagrammer,使用【File】下面的【New】菜單,新建一個Diagrammer。
2
新建一個Feature Dataset,並更名為道路信息:
多圖
3
新建一個point對象,並命名為道路路線,建立一個network,並命名為道路幾何網路:
多圖
4
建立連接(Link),切換成Link Mode
多圖
5
按照相同的方法,對建立道路系統所需的其他要素類和要素集進行構架,如下圖:
6
給要素類添加欄位,修改命名,並給長度賦值,添加欄位結果,最後構建的整個模型如下:
多圖
7
將當前Diagrammer保存為相應的道路模型,將結果輸出為XML架構文件。選擇【File】菜單下的【Publish】,將結果輸出為XML文檔。
多圖
8
將xml架構文件導入到File Geodatabase中啟動ArcCtalog,選擇合適位置,新建一個File Geodatabase命名為校園道路,在資料庫上右鍵,【import】,選擇XML工作空間,最終導入結果:
多圖
❿ 無縫空間資料庫設計與構建
(一)問題的提出
塔里木河流域生態環境動態監測系統的運轉需要大量的空間數據支持。在空間資料庫構建前期,採集了塔里木河流域的各尺度基礎地形圖、生態環境專題圖以及遙感影像資料等圖形、圖像數據,這些數據都是以分幅的成果進行收集和提交的,需要進入綜合資料庫中,以實現數據的共享。
我國國土版圖大,而且大部分位於中、低緯度地區,因此我國現行的大於1∶50萬比例尺的各種地形圖都採用高斯-克里格投影即橫切橢圓柱正形投影。經過高斯-克里格投影後的平面直角坐標系是以相切的經線(中央經線)的投影為X軸,以赤道的投影為Y軸。高斯-克里格投影具有以下特點:
(1)中央經線投影為直線,而且是投影的對稱軸(也是投影平面的X軸);
(2)高斯-克里格投影是等角投影,投影後具有角度不變、伸長固定的特點(即同一地點各個方向的長度比不變),滿足等角的要求;
(3)中央經線上長度沒有變形,離中央經線越遠變形越大。為了限制投影變形,必須進行分帶投影。所謂分帶就是按照一定的經度差,將橢球體按經線劃分成若干個狹窄的區域,各個區域分別按高斯投影的規律進行投影,每一個區域就稱為一個投影帶。在每一個投影帶內,位於各帶中央的子午線就是軸子午線,各帶相鄰的子午線叫邊緣子午線。分帶之後,各帶均有自己的坐標軸和原點,形成各自獨立但又相同的坐標系統。根據國際通用方法,我國投影分帶主要有兩種:在我國1∶2.5萬到1∶50萬地形圖均採用6°分帶投影,1∶1萬及更大比例尺的地形圖採用3°分帶投影,以保證投影變形誤差滿足地圖的精度要求(王密等,2001)。
本系統所採集到的數據產品的空間參考大都是以高斯投影後的平面坐標為基礎的分幅數據。塔里木河流域地域廣闊,地理坐標介於東經73°10'~94°05',北緯34°55'~43°08'之間,以1∶10萬基礎地形圖數據為例,按照高斯投影後的坐標分成了13°、14°、15°、16°四個6°高斯投影帶,每個帶的坐標都是以本帶的坐標原點為參考點,空間基準不統一,如果將這些數據直接進行入庫,將在跨帶處產生縫隙,不能形成邏輯意義上完整的河流表現,也無法完成基於整個流域的生態環境分析,因此,必須採用相應的數據處理與建庫技術,實現塔河整個流域數據的無縫集成管理,使之形成統一的整體。從基礎數據的獲取開始,進行精心設計和組織,分離出數據物理層和數據邏輯層,在統一的空間框架之下,將物理層歸化到邏輯層,以消除邏輯層的縫隙,從而實現用戶級的邏輯無縫空間資料庫。
(二)無縫資料庫
隨著GIS數據發布與共享技術的發展,無縫空間資料庫逐漸分化出兩個層次的含義:一是GIS系統內部的數據無縫,一是不同GIS實現互操作時的數據無縫。前者是通常意義的無縫,後者主要通過數據標准化與操作標准化來實現。無縫空間資料庫的最終含義體現在邏輯無縫資料庫。無論是多源還是單源、同構還是異構,跨越數據層呈現在用戶面前的GIS空間資料庫必須是邏輯無縫的。
空間數據的無縫連接是一個建立在用戶與資料庫介面基礎上的概念,意味著GIS管理的數據不再是單一、被硬性割裂的圖幅,而是范圍更加廣闊的區域,這個區域小可到一個城市,大可到一個國家甚至整個地球(王卉、王家耀,2004)。由於硬軟體條件的限制,計算機系統尚不能同時處理海量的空間數據,因此從具體技術的實施上,可採用將空間數據分塊存儲於資料庫中,資料庫提供相應的圖塊拼接信息。物理上空間數據是有縫隙的,但空間資料庫提供圖塊之間的接圖信息及相應的拼接訪問手段,保障了空間數據在使用上的空間連貫性,即數據在邏輯使用上是無縫的(王密等,2001)。
(三)縫隙產生原因
在現實世界中,地理空間是由地貌、地物組成的連續的表層空間,地理信息則是有關地理空間的一切有用的知識。在計算機世界中,地理信息通過抽象、建模形成數字化的表示形式,通過空間資料庫來進行表達、存儲和管理(朱欣焰等,2002)。空間地理數據縫隙是在數據的獲取、表示與處理過程中產生的數據不連續現象。
1.數據源
由於歷史和現實的原因,地圖是絕大多數GIS系統直接的數據源。地圖是地球三維橢球面的二維平面表達,本身對真實世界有扭曲;地圖是對連續空間的割裂表達,實體被分割到不同的地圖空間中去;高斯投影是基本比例尺地形圖經常選用的投影,也是絕大多數GIS系統的數學基礎,由於分帶的原因,使得投影後帶有高斯投影平面坐標的地圖無法實現無縫拼接。
2.數據表達與組織方式
空間地理幾何數據的表示主要有柵格和矢量兩種不同的形式。柵格形式是將地理表層空間劃分為一系列網格,空間目標由這些網格的位置及其量化值來表示,這些網格本身就是連續空間信息的離散表達。矢量形式則是將地理空間的一切事物、概念進行抽象,形成點、線、面,由點、線、面來組成各類空間目標。按點、線、面來分類和按分層的思想來組織空間數據,也割裂了實體之間內在的聯系。
在空間資料庫組織與管理上,目前主要有文件型、文件與關系資料庫混合型、全關系型以及對象關系型。傳統的文件型空間資料庫、文件與關系混合型空間資料庫,按圖幅或一定的區域范圍以文件的形式來組織與存儲空間幾何數據,不同的圖幅或區域之間存在縫隙。在文件與關系資料庫混合型的空間資料庫中,空間幾何數據貯存在文件中,屬性數據貯存在關系資料庫中,屬性數據和幾何數據之間通過內部標識來鏈接,空間幾何數據和屬性數據之間存在縫隙。
3.數據處理
數據處理的過程中也會引入縫隙,產生這種縫隙的原因有:①數據處理過程的順序不一致;②選擇的處理參數不一致;③數字化的精度不一致。
4.多源異構數據共享
數據屬性(數學基礎、比例尺、用途、時間、精度等)的不同,導致了數據的差異,這些差異是多層次和多方面的,它們集中體現了數據的異構。數據異構和多源往往是一體的,多源異構是系統內部和系統之間數據裂隙的主要原因(劉仁峰,2005)。
(四)數據縫隙類別和表現
數據縫隙基本可以分為物理縫隙和邏輯縫隙兩類。物理縫隙是地理空間的分離存儲,本來連續的實體空間被分離到不同的存儲空間和存儲單元中去,例如空間數據的分幅、分層存儲。邏輯縫隙是指邏輯上本身連續的信息不能以邏輯連續的方式呈現,例如跨越多幅圖的一條河流,在圖幅內查詢河流屬性(如長度)時只能獲取其在本圖幅內的相關信息而不是實體整體的信息。顯然,由於空間信息本身的海量特性,要完全意義上的實現物理無縫的空間資料庫目前還是不可能的,也沒有必要。GIS用戶關心的不是空間數據是物理無縫,因為GIS呈現給用戶的是數據邏輯層,只需要保證用戶看到的數據是邏輯無縫的。
物理有縫的資料庫向邏輯無縫資料庫的轉換是無縫空間資料庫構建的重要一環。
(五)無縫鑲嵌技術
數據的無縫連接包含以下幾個問題:投影、坐標系統、比例尺、數據精度等。對不同投影和坐標系統的空間數據在投影和坐標系統上統一採用相同的標准,當空間數據具有多尺度時,無縫連接尋找數據集之間連續的表達方式,它表現為不同尺度數據之間的集成。建立無縫空間數據的關鍵在於在合適的空間信息框架上實現多源異構空間數據的融合,框架是基礎,融合是手段。
1.合適的空間框架選擇
(1)適合多尺度信息表達。地球是一個開放的非常復雜的巨大系統,隨著觀察視角的變化,我們希望空間地理信息比例尺也自動增減。由於地圖的自動綜合受諸多因素的影響,目前比較可行的是採用多尺度空間數據支持來達到目的。所謂多尺度就是指系統內包含幾種不同比例尺(或解析度)的空間數據,其目的是為了適度地反映系統所關心區域的空間地理信息,以避免地物信息的過粗、失真或地物信息的負載量過大而無法使用。無縫空間資料庫也應該符合多尺度空間資料庫要求。
(2)適合大區域表達。各種自然和人文現象的空間分布,有其內在的原因和規律,這些原因和規律的獲得,往往需要研究大區域多因素的綜合作用;另一方面,對於全球范圍的環境變異和氣候變遷的研究需要基於數字地球的空間框架。大區域的表達,還涉及空間尺度問題,不應繼續採用歐氏空間尺度,而應該採用大地線尺度空間。
2.多源異構空間數據的融合
(1)GIS的迅速發展和廣泛應用導致了多源空間數據的產生。如何實現不同的GIS軟體共享並操作不同來源的地理數據,即GIS多源空間數據的集成,成為GIS發展的關鍵。目前GIS多源空間數據的集成主要朝著三個方向發展,一是通過建立統一的數據交換標准來約束並規范已有的各類地理信息系統,採用數據交換標准來進行空間數據交換;二是建立開放式地理數據互操作規范,進行地理信息系統互操作;三是GIS數據中間件技術。
(2)統一數據交換標准存在很多實現上的困難。互操作是一個重要發展趨勢,是在異構分布式資料庫中實現信息共享的途徑,它需要將GIS技術、分布處理技術、面向對象方法、資料庫設計及實時信息獲取方法更有效地結合起來。所謂GIS數據中間件技術是指能夠嵌入各類GIS系統的軟體,GIS開發者通過中間件開發商提供的介面,訪問和操作特定的數據源。
(3)在多源異構數據集成技術尚未成熟的時候,人們再次把目光投向數據本身,如果可以提供關於數據的詳細描述,是否可以提高融合數據的能力呢?於是,對於「關於數據的數據」的研究,即對於元數據的研究便普遍展開。從DublinCore到CSDGM與OGC,都提出了相應的元數據標准體系,有了完整而完善的元數據描述,必將提高數據的效能,從而最終促進多源異構資料庫向無縫空間資料庫的歸化。
為實現塔河整個流域數據的無縫集成管理,使之形成統一的整體,設計從縫隙產生的地方開始,分離出數據物理層和數據邏輯層,在統一的空間框架之下,將物理層歸化到邏輯層,以消除邏輯層的縫隙,從而實現用戶級的邏輯無縫空間資料庫;同時制定統一的數據提交規范,如所有矢量數據在入庫前統一採用經緯度坐標,柵格數據統一提供兩套數據,即高斯坐標和經緯度坐標,以滿足不同用戶的管理需求和精度要求。