空间数据库设计
❶ 建立空间数据库的原理、方法和步骤
一、目标任务
1.主要工作任务
《1∶25万内陆干旱区地下水资源评价塔里木盆地地下水勘查空间数据库》是在综合研究已有资料的基础上,补充野外实际工作,建立了58个标准图幅的1∶25万空间数据库。
2.技术要求
采用中国地质大学开发的MAPGIS软件平台,完全依照中国地质调查局提出的各项技术标准,执行中国地质调查局最新修订的《西北地下水资源勘查评价空间数据库工作指南》2.0版及其他相关标准。对选定的58幅1∶25万标准图幅综合水文地质图、地质图、生态环境水文地质图、地貌图、地下水开发利用规划图、地下水水化学类型图、地下水资源分布图、平原区地下水质量分区图、综合水文地质剖面图、重点流域等水位线图等图件进行数字化处理和空间数据库的建立。
参考标准或引用标准:
GB 2260中华人民共和国行政区划代码
GB 9649地质矿产术语分类代码
GB/14157水文地质术语
GB/T 14538-93综合水文地质图图例及色标(1∶200000~1∶500000)
GB/T 14848地下水质量标准
GB/T 13923-92,国土基础信息数据分类与代码(中国标准出版社,1992)
DZ/T 0197-1997数字化地质图图层及属性文件格式(国家行业标准)
西北地下水资源勘查评价空间数据库工作指南
3.提交成果
1)数据库成果(光盘汇交):见表6-1。
2)文档:属性表、图幅基本概况表、工作日志、自检表、互检表、质检组检查表、图面检查表。
表6-1 成果汇交光盘物理存储结构
3)塔里木盆地地下水勘查包括58个标准图幅的水文地质专业图件共7张彩色喷墨全要素图各1张、重点流域等水位线图3张和综合水文地质剖面图1张。
4)《1∶25万内陆干旱区地下水资源评价塔里木盆地地下水勘查空间数据库》建库报告一份。
二、工作方法及流程
(一)项目组织与实施
项目由新疆地质调查院组织,由水文地质工程地质、绘图、计算机等专业技术骨干组成,严格按照规范和技术要求实施。
(二)工作方法
概据任务书的要求,收集、购买已出版的塔里木盆地58幅图的地理信息数字化成果数据,采用中国地质大学开发的MAPGIS6.1软件平台,将此数据在经纬秒格式下进行拼接,按《西北地下水资源勘查评价空间数据库工作指南》标准对地理属性进行了修改。各类专业图件经过专业人员的编图,经审查合格后,采用彩色或灰度扫描,进行图形数字化,做到图元丢失率为0,误差小于0.02mm,其精度均达到设计要求。数据在矢量化过程中以作者原图为主的原则,属性内容以报告和图面内容相结合的方法采集,成果资料中没有的不予反映。
(三)工作流程
本次数据库建设完全按照《西北地下水资源勘查评价空间数据库工作指南》的具体要求,对相关数据资料进行整理。在MAPGIS支持环境下完成图形数据的输入和编辑,利用Access系统下创建的满足《西北地下水资源勘查评价空间数据库工作指南》数据结构要求的数据表,完成外挂属性数据的录入,并实现图层与属性数据的连接。
1.数据信息组成
根据新疆塔里木盆地地下水勘查总体设计书的要求,确定此次工作数据信息的内容为基础地理、基础地质、社会经济信息、水文地质信息(含水文地质条件、水文地质观测、地下水资源等)、环境地质信息、元数据信息,具体的数据信息与内容见表6-2。
表6-2 主要数据类型与数据特征
2.图层划分
新疆塔里木盆地空间数据库的建设,从基础资料图件到成果表达图件,多数内容涉及大量的矢量图形。因此,标准化处理必须确定各种图件的图层划分、图元、属性等方面的内容,以使图形库最大限度地达到共享。图形分层主要考虑到便于图形的操作、管理和计算,同时考虑数据本身的专业数据特点。图层划分详见表6-3 。
表6-3 塔里木盆地地下水勘查空间数据库图层划分
续表
注:#代表含水层编号,含水层未分时,#用“0”替代。
图6-1 工作流程示意图
3.数据准备阶段
作者原图及简单图件用二值或灰度,以300dpi精度扫描,复杂图件用彩色以300DPI精度扫描。所有图件的图式图例参数说明文件放入README文件夹中。
4.数据矢量化阶段
放大70倍进行图件的数字化处理。点线数字化时,要保证其准确性和自然光滑,有坐标的点采用单点展绘的方法直接投影到1∶25万图中,保证了精度。线数字化时,为确保拓扑时弧段不变形,未采用MAPGIS系统提供的线圆滑功能。
5.检查矢量化图件
喷绘数字化图件,对照原图进行自检、互检、抽检,并由水文地质专家进行100%的检查,确保矢量化后的图形数据与原图件一致性和完整性。
6.误差校正
塔里木盆地面积大,横跨4个带。各带图件经检查无误后,生成基于原图高斯北京投影带方式的理论图框,进行误差校正。每标准图幅采集13个控制点,除4个角点外,其余点均匀分布在图幅内。
7.无投影格式下重新拓扑
将检查无误的数据投影到经纬度格式。在经纬度下再进行各带各类图件的拼接,为确保套合精度,重新进行拓扑,录入面属性,再将参与做面的线从整体拓扑图层中弧转线中分离出来,做线属性。
8.喷绘图件
对参与整体拓扑的图层进行拓扑处理、错误检查、修改,然后编辑区颜色。将各图层形成工程文件后,彩喷出图。再由绘图专业人员和水文地质专家对照原图检查,检查出错误进行修改,再出图,再次检查,直至完全无误,最后彩喷成果图件。
9.填写属性卡片
属性卡片的内容以原图和原报告为主要依据。
10.录入属性
在MAPGIS属性库管理模块中将各图层ID号和图元编号做唯一。
11.转换文件格式
将经纬度格式下的属性文件,生成E00文件,转入ARCINFO中,形成最终的ARCINFO格式数据。
工作流程见图6-1。
❷ 地质-生态环境空间数据库建库标准
一、范围
本标准定义了山东半岛城市群地质-生态环境空间数据库的数据结构框架、数据实体及实体之间的相互关系,定义了成果图件空间数据的要素集、要素类、要素分类代码及属性数据项,可用于山东半岛城市群项目数据的采集、存储、管理、共享及数据库建设。
二、规范性引用文件
下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。
GB / T 1. 1—2000 标准化工作导则 第 1 部分: 标准的结构和编写规则
GB / T 13923—92 国土基础信息数据分类代码
GB / T 2260—1999 中华人民共和国行政区划代码
GB / T 2659 世界各国和地区名称代码
GB / T 9649—88 地质矿产术语分类代码
DZ / T 0160—95 1∶ 200000 地质图地理底图编绘规范及图式
DZ / T 0197—1997 数字化地质图图层及属性文件格式
GB 958—99 区域地质图图例 ( 1∶ 50000)
DZ / T 0179—1997 地质图用色标准及用色原则
DDB 9702 GIS 图层描述数据内容标准
GB 17108—1997 海洋功能区划技术导则
中国地质调查局 地质图空间数据库建设工作指南 ( 2. 0 版)
中国地质调查局 1∶ 20 万区域水文地质图空间数据库图层及属性文件格式工作指南
三、术语和定义
本标准涉及的主要术语如下:
1. 地理信息数据库 ( geodatabase)
采用标准关系数据库技术来管理、表现地理信息的空间数据库。
2. 数据包 ( data package)
逻辑相关数据实体的集合,本标准中将山东半岛城市群项目数据整体视作一个数据包。
3. 数据实体 ( data entity)
描述专业领域同一类型数据的数据元素的集合,如地质构造数据实体,概念上等同于UML 的类。数据实体可通过一个或多个相关的数据元素及相关的数据实体定义。
4. 数据集 ( dataset)
逻辑相关数据组成的数据集合,如一幅地图可视作一个数据集,数据集是一个逻辑上的整体。
5. 数据子集 ( subdataset)
按一定规则划分的数据集中逻辑相关数据的集合,本标准中的一个数据子集对应一个地图要素类,数据子集类别对应地图上的图层划分。
6. 空间数据 ( spatial data)
用来表示空间实体的位置、形状、大小和分布特征诸方面信息的数据。空间数据不仅具有实体本身的空间位置及形态信息,而且还有实体属性和空间关系 ( 如拓扑关系)信息。
7. 空间参照系 ( spatial reference)
对地理信息数据的空间范围和投影的描述。
8. 地图 ( map)
地理信息的图形描述,包括地理信息数据和地图元素,如标题、图例和比例尺等。本标准中将一幅地图视作一个数据集进行管理,并通过一组要素集 ( 要素类、关系类、属性表的集合) 、空间参照系、地图样式定义地图的数据内容及显示方式。
9. 图层 ( layer)
地图上特定区域范围内按一定规则划分的相似要素类的集合,如水系、城镇。图层为要素类的专题组合及表现,一个图层定义了它包含地理信息数据的地理位置和显示方法。
10. 要素 ( feature)
现实世界中的对象在地图图层中的表示,如地图中表示道路的一条线。
……
四、缩略语和符号
1. 缩略语
ARD 图外整饰要素 ( Elements Around Map)
BMAP 地理底图 ( Basemap)
BOU 境界、边界 ( Bourn)
CD 代码 ( Code)
COL 综合柱状图 ( Colomnar Chart)
DT 日期 ( Date)
ELE 地形高程 ( Elevation)
……
2. UML 类图符号
山东半岛城市群地区地质-生态环境与可持续发展研究
3. ER 图符号
山东半岛城市群地区地质-生态环境与可持续发展研究
五、基于 UML 的 Geodatabase 的空间数据模型
构建地质数据的空间数据模型是建立地质信息数据库的一项关键工作,是数据库建设的基础。Geodatabase 数据模型作为 ArcGIS 软件平台的一种通用数据形式,目前已被国内外众多地质空间数据库的建设所采用。数据建模也已经成为地质数据库建立的一项主要内容。
目前针对地质、水文、矿产、海洋等多个领域的专业 Geodatabase 数据模型都已存在,国内目前应用于区域地质 - 生态环境调查的综合地质 - 生态环境空间数据模型还比较少见。因此,本项目在分析国内外目前比较通用的各专业数据模型的基础上,提出了专门面向山东半岛城市群地质 - 生态环境空间数据库建设的 Geodatabase 数据模型。
在 Geodatabase 数据模型中,允许定义要素之间类型的关联,Geodatabase 对空间数据管理以关系数据库为基础,利用商用关系数据库成熟的数据处理能力对空间数据和非空间数据进行统一管理。Geodatabase 使用面向对象的方法,使得要素可以具有自己的行为和属性,并且要素类具有继承性、多态性和封装性。这样,以更加适合自然的行为和人的思维方式去组织数据,更精确地模拟真实世界。
1. Geodatabase 数据模型的结构体系
Geodatabase 数据模型作为一种新型的面向对象的数据模型,融入了面向对象的核心技术,如类 ( Class) 、对象 ( Object) 、封装 ( Encapsulation) 、继承 ( Inheritance) 和多态( Polymorphism) 等思想和技术。Geodatabase 数据模型的目的就是为了让用户能更容易、更自然地表示 GIS 数据特征和更容易地建立特征之间的各种关系。Geodatabase 空间数据库数据模型如表 12 -1 所示。
表 12 -1 Geodatabase 内部结构
续表
2. Geodatabase 数据库模型的特点
Geodatabase 有两种,即个人与多用户 Geodatabase。
1) 个人 Geodatabase 支持内置于 ArcGIS 系统并提供对本地数据的访问,适用于面向项目的 GIS,在 Microsoft Access 数据库平台上实现,提供生成和更新 Access 数据库的服务,可处理小型或适中的 Access 数据库。但个人 Geodatabase 的存储容量有不能超过 2GB的限制。
2) 多用户的 Geodatabase 是通过 ArcSDE ( ARC 空间数据库引擎) 实现的。ArcSDE可以生成和访问从小型到大型的 Geodatabase 并提供关系型数据的开放界面。
与标准的关系数据库相比,Geodatabase 简化了地理数据建模的工作,因为它包含有用于建模地理信息的通用模型。
此外,Geodatabase 还同时支持两个视图,即对象视图和关系视图。这样就综合了对象视图和关系视图两者的优点。对象视图在 Geodatabase 中占据主导地位,其目的是提供一个接近于逻辑数据模型的数据模型,因而更接近于现实。关系视图则用于一些 Geodata-base 数据的常规处理,它表示的是一些简单地理对象的特征。
3. 基于 UML 的 Geodatabase 数据模型的设计
( 1) Geodatabase 数据库设计的方法
在 ArcGIS 中,建立地理数据库可以有多种方法。借助 ArcCatalog,可以通过 3 种方式建立新的地理数据库。
第一种方法是建立一个新的地理数据库。
第二种方法是移植已经存在的数据到地理数据库中去。
第三种方式是用 CASE 工具来建立地理数据库。
( 2) 面向对象和 UML ( 统一建模语言)
面向对象是软件程序设计中的一种新思想,它能使程序设计更加贴近现实,并且花费更小的精力。面向对象方法学包含了对象 ( object) 、类 ( classification) 、继承 ( inherit-ance) 、聚集和消息 ( messages) 的概念。
UML ( Unified Modeling Language,统一建模语言) 是一种基于面向对象方法的建模语言,具有创建系统的静态结构和动态行为等多种结构模型的能力,是一种通用的建模语言。在 Geodatabase 的设计中,主要用到描述系统静态结构的类图。类图的节点表示系统中的类及其属性和操作。类图的边表示类之间的联系,包括继承、关联、依赖、聚合等。
类的表示由 3 个部分方框组成,上面部分给出了类的名称; 中间部分给出了该类的单个对象的属性; 下面部分给出了一些可以应用到这些对象的操作。类的表示如图 12 -5。
图 12 -5 类的表示
关联是对类的实例之间联系的命名,与关联有关的内容有关联元数 ( Degree) 、关联角色 ( Role) 和重复度 ( Multiplicity) 。
UML 中有 3 种类型的类: 抽象类 ( abstract class) 、可创建化类 ( creatable class) 和可实例化类 ( instantiable class) 。
UML 类图的符号见本节第四部分内容。
( 3) 面向对象的地理数据模型的设计方法
利用 CASE 工具进行 Geodatabase 数据模型设计的步骤具体为:
1) 在 CASE 工具中进行 UML 建模。
2) 将设计好的 UML 模型载入资料库 ( repositry) 。
3) 利用 GIS 软件提供的 CASE 接口,根据资料库中的 UML 模型生成空间数据库结构。至此,Geodatabase 空间数据库结构初具雏形。在 GIS 软件环境中,现在可以将新生成的数据或已有的数据进行格式转换后载入到设计好的 Geodatabase 空间数据库中,由空间数据库统一管理。利用 CASE 工具来建立 Geodatabase 地理数据库的工作流程见图12 - 6。
图 12 -6 利用 CASE 工具来建立 Geodatabase 地理数据库的工作流程
六、地质 - 生态环境 Geodatabase 数据模型的建立
( 一) 数据模型设计的依据
根据山东半岛城市群地质 - 生态环境调查评价研究工作的需要和山东半岛城市群地质 - 生态环境 GIS 数据库系统的整体设计要求,结合各地质 - 生态环境要素的成果图件和文本报告资料,利用 UML 设计工具 Microsoft Visio 完成了山东半岛城市群地质 - 生态环境Geodatabase 数据模型的设计 ( 图 12 - 7) 。
图 12 -7 山东半岛城市群地质 - 生态环境 Geodatabase 数据模型的设计依据
( 二) 山东半岛城市群地质 - 生态环境数据库的 UML 类图
1. 数据集管理
山东半岛城市群项目数据包中的数据以数据集为单元统一组织管理,数据集管理方式就是将一份文字报告或一幅成果图件视作逻辑上的整体,用 “数据集编号”唯一标识,通过数据集实体统一管理。同一数据集的不同实体,例如成果图中的图层,通过实体中的“数据集编号”元素关联。
2. 空间数据管理
山东半岛城市群项目数据包由文字报告及成果图件两大类数据组成,并以成果图件为主,成果图件是一空间数据实体,统一存储在面向对象的地理信息数据库中,以图幅为单元进行管理。
3. 数据包总体结构
本标准中山东半岛城市群项目数据包总体结构用 UML 模型来体现,山东半岛城市群项目数据包由 “成果报告”、“元数据”及 “存档文件”3 个数据实体 ( UML 类) 组成,通过 “数据集”实体统一组织管理。“成果报告”由它的继承类 “文字报告”及 “成果图件”定义,为研究成果数据包的主体数据。“元数据”及 “存档文件”为数据集的辅助数据,“元数据”存放文字报告或成果图件的元数据; “存档文件”存放文字报告或成果图件的相关存档文件,供数据集数据的整体下载与利用。
一个 “数据集”实体对应一个项目的 “文字报告”或一幅 “成果图件”; 每一个数据集必须有一个而且只能有一个 “元数据”文件; “存档文件”是 “数据集”的可选聚合实体。
“成果图件”是一空间数据实体,由特定的面向对象地理信息数据库 ( Geodatabase)统一存储、管理。一幅 “成果图件”数据内容由一组空间要素集 ( 基础地理要素集、地质要素集、地球物理要素集、地球化学要素集、辅助要素集) 组成,空间要素集数据类型包括矢量 ( Feature Dataset,简称要素集) 、栅格 ( Raster Dataset) 和 TIN ( TIN Dataset)3 种。
4. 数据集编号的编码规则
数据集编号由数据库管理方统一编码,必须保证编号在数据库中唯一,编号中的英文字母全部大写。
山东半岛城市群项目数据集按 “项目或图幅—提交单位—提交年份—成果序号”编码。数据集编号的字符串长度不得超过 22 位,以保证 “数据集编号 + 要素类名”的字符串总长度不超过 30 位。
5. 成果图件要素类命名规则
要素类名字符串总长度不得超过 8 位。
矢量要素类按 “要素集类型 + 要素类名 + 要素类型”命名,全部用大写英文字母表示。“要素集类型”用一位代码表示,如 “L”表示基础地理要素集。栅格数据集数据以“要素集类型 + 要素类型”命名,要素类型用代码 RAS 表示,如 “DRSRAS”表示遥感栅格数据。TIN 数据集数据以 “要素集类型 + 要素类型”命名,要素类型用代码 TIN 表示,如 “LELETIN”表示地面高程 TIN。
6. 成果图件要素分类编码规则
要素分类编码用以标识不同的要素类要素,保证地图要素存储、交换、显示的一致性。
( 1) 分类编码原则
1) 科学性、系统性;
2) 相对稳定性;
3) 不受地图比例尺的限制;
4) 完整性和可扩展性;
5) 适用性。
( 2) 分类编码方法
成果图件要素类中不同要素的分类编码采用中华人民共和国国家标准 《国土基础信息数据分类与代码》的编码结构,结构如下:
山东半岛城市群地区地质-生态环境与可持续发展研究
大类码、小类码、一级代码和二级代码分别用数字顺序排列。识别位由用户自行定义,以便于扩充。在本项目中编码分两类: ①基础地理要素编码; ②地质专业要素编码( 地质、地球物理、地球化学等) 。
( 三) 山东半岛城市群项目数据实体及实体关系
山东半岛城市群项目数据实体类及其代码见表 12 -2,实体类名代码按实体类的英文名缩略语编码,本标准中山东半岛城市群项目数据实体及实体间关系用 UML 及实体关系图 ( ERD) 来体现。
表 12 -2 山东半岛城市群项目数据实体类及其代码
1. 数据集实体 ( MGRD_Dataset)
山东半岛城市群项目数据包中的 “数据集”实体用来统一组织管理 “文字报告”、“成果图件”、“元数据”及 “存档文件”数据实体,“数据集”实体中的数据项包含数据集的归属项目、提交日期、提交单位、主题类别及地理范围等可用于数据集检索的信息。一个 “数据集”实体对应一个项目的 “文字报告”或一幅 “成果图件”,“数据集”实体与 “元数据”实体间为一一对应关系,与 “存档文件”实体间为一对多的对应关系。“数据集”实体的数据内容及其存储表通过 “数据子集”实体分类定义,主键 [数据集编号]可用于同一数据集中不同 “数据子集”的关联,也可用于数据集对应的 “元数据”及“存档文件”的关联。
2. 成果报告数据实体 ( MGRD SumTmaryReport)
研究成果报告数据实体包括项目的最终综合文字报告及相应的成果图件。
( 1) 文字报告数据实体 ( SR_WordReport)
文字报告数据实体包括 “文字报告”及图像格式的 “报告附图”数据实体,文字报告及附图均以二进制大对象存储。数据实体之间通过 [数据集编号] 关联。
( 2) 成果图件数据实体 ( SR_hemeMapSet)
“成果图件”数据实体是一空间数据实体,主要以矢量图形格式存储在地理信息数据库中,其中也包括栅格数据及 TIN 数据用于数据的空间分析。
1) 要素集: “成果图件” 数据实体以图幅为数据集单元进行管理; 图幅内容以分属不同空间要素集 ( 基础地理要素集、地质要素集、地球物理要素集、地球化学要素集、辅助要素集) 的要素类组合,同一个要素集内的要素类享有同一空间参照系,相互具有拓扑关系。
2) 要素类: 一个要素类的存储单元为关系数据库中的一个数据表,要素类图元类型有点、线、面、注记 4 种,一个要素类只能包含一种图元类型。本标准中基础地理要素集、地质要素集、地球物理要素集、地球化学要素类、辅助要素集的要素类用 UML 类图体现。
3) 图层: 图层为要素类的专题组合及表现,不同图层的组合即构成了可视化 “成果图件”。本项目通过对数据来源的分析,提出并建立了适合山东半岛城市群地区地质 - 生态环境调查与评价特点的空间数据库数据图层。考虑到空间数据的应用和相互转换,每一图层均应建立相应的内部属性表,属性表必须包含一些基本字段内容,根据具体任务的不同,需灵活扩充内部属性表字段内容。 “成果图件”数据实体的图层划分及其代码见表 12 -3。
4) 要素类属性: 要素类的要素特征由属性表定义,属性表每一行对应一个要素,每一列包含要素的一个特征信息。
表 12 -3 成果图件数据实体的图层划分及其代码
5) 要素类要素分类: 同一要素类中不同类型的要素用不同的代码标识,通过属性表中的 “编码” ( GEO_CODE) 数据项体现,以便地图中同一要素类要素的分类显示,并保证地图要素存储、交换、显示的一致性。在本项目中成果图件的基础地理要素分类代码采用中华人民共和国国家标准 《国土基础信息数据分类与代码》,并根据需要进行了扩充,地质专业要素分类代码全部由本标准定义,见表 12 -4 和表 12 -5。
表 12 -4 基础地理要素分类代码
表 12 -5 地质专业要素分类代码
图12 -8 山东半岛城市群项目数据包UML类图
图层编码中,第一位为图类代码,L 代表基础地理类图层; D 代表基础地质类图层;G 代表国土资源图层; W 代表地壳稳定性图层; S 代表水资源图层; H 代表海岸带图层;T 代表生态环境图层; R 代表人类工程活动图层; F 代表分析评价图层; Y 代表预测与防治图层; Z 代表辅助图层。第二位为比例尺代码,图件均采用 1∶ 50 万比例尺,代码为 B。第三位到第五位为图名的汉语拼音首字母缩写。第六位为图层数字编号。
( 四) 山东半岛城市群项目 UML 类图
1. 山东半岛城市群项目数据包 UML 类图
UML 类图见图 12 - 8。
2. 成果图件要素集 UML 类图
1) 基础地理要素集实体 UML 类图 ( FD_Geography) 。本项目将基础地理要素分为地理网格、居民地、境界、交通网、地貌地形、水系、海洋海岸带、行政区划、栅格数据等 9个抽象要素类,建立了 “各市基本情况”对象类,与表明各地区域的 “城市群”类相连接,将山东半岛城市群8 个地级市的地理位置数据与地区的基本资料数据有机地联系起来。
2) 地质要素集实体 UML 类图 ( FD_Geology) 。
3) 国土资源要素集实体 UML 类图 ( FD_LandResource) 。
4) 水资源要素集实体 UML 类图 ( FD_WaterResource) 。
5) 生态环境要素集实体 UML 类图 ( FD_Environment) 。
6) 辅助要素集实体 UML 类图 ( FD_Ancillary) 。
3. 山东半岛城市群项目数据实体关系图
1) 数据集实体 ER 图 ( MGRD_DataSet) 。
2) 研究成果报告数据实体 ER 图 ( MGRD_SummaryReport) ( 图 12 - 9) 。
图 12 -9 研究成果报告数据实体 ER 图 ( MGRD_SummaryReport)
七、山东半岛城市群项目数据包数据字典
( 一) 数据集实体 ( MGRD_DataSet)
山东半岛城市群地区地质-生态环境与可持续发展研究
( 二) 研究成果报告数据实体 ( MGRD_SummaryReport)
1. 文字报告数据实体 ( SR_WordReport)
山东半岛城市群地区地质-生态环境与可持续发展研究
2. 成果图件数据实体 ( SR_ThemeMapSet)
( 1) 基础地理要素集实体 ( FD_Geography)
山东半岛城市群地区地质-生态环境与可持续发展研究
( 2) 地质要素集实体 ( FD_Geology)
山东半岛城市群地区地质-生态环境与可持续发展研究
( 3) 水资源要素集实体 ( FD_HydroResource)
山东半岛城市群地区地质-生态环境与可持续发展研究
❸ 空间数据库的空间数据库的特点
1、数据量庞大。
空间数据库面向的是地理学及其相关对象,而在客观世界中它们所涉及的往往都是地球表面信息、地质信息、大气信息等及其复杂的现象和信息,所以描述这些信息的数据容量很大,容量通常达到 GB级。
2、具有高可访问性 。
空间信息系统要求具有强大的信息检索和分析能力, 这是建立在空间数据库基础上的,需要高效访问大量数据。
3、空间数据模型复杂
空间数据库存储的不是单一性质的数据,而是涵盖了几乎所有与地理相关的数据类型,这些数据类型主要可以分为 3 类:
(1)属性数据:与通用数据库基本一致,主要用来描述地学现象的各种属性,一般包括数字、文本、日期类型。
(2)图形图像数据:与通用数据库不同,空间数据库系统中大量的数据借助于图形图像来描述。
(3)空间关系数据:存储拓扑关系的数据,通常与图形数据是合二为一的。
4、属性数据和空间数据联合管理。
5、空间实体的属性数据和空间数据可随时间而发生相应变化。
6、空间数据的数据项长度可变,包含一个或多个对象,需要嵌套记录。
7、一种地物类型对应一个属性数据表文件。多种地物类型共用一个属性数据表文件。
8、具有空间多尺度性和时间多尺度性。
9、应用范围广泛。
空间数据库的设计
❹ 系统数据库和模型库设计
(一)系统数据库类型
数据库是整个农用地分等信息系统的基础,是系统开发设计要考虑的重中之重。在数据形式上,系统数据库包括两大块:一是空间数据库,二是属性数据库。目前的空间数据技术已从以MapInfo为代表的混合型数据库(空间数据库+关系型数据库)发展到以ArcInfo的Coverage为代表的拓展型数据库。鉴于农用地分等属性数据量庞大,为减少数据冗余,提高数据检索的速度,本研究采用空间数据和属性数据分开管理的模式,依据关键字段进行绑定,进行科学索引,从而实现空间数据和属性动态链接和高效整合。
1.空间数据库
江苏省农用地分等信息系统空间数据库内容包括以下方面:
(1)土地利用现状图层:全省13个省辖市以1996年土地利用现状图为基础,经变更调绘形成以2000年为基准年的土地利用现状图,以现行的土地分类标准按八大类分类进行信息提取并分层存储,系统分别存储为耕地、林地、水域、未利用地、建设用地等图层。
(2)全省土壤类型图层:以土属为分类单位,比例尺为1:20万。
(3)1996年和2000年全省行政区划图层:在行政区划中精确到乡镇级别,分别提取存储了市名图层、县(区)名图层、乡(镇)名图层、全省行政界线图层、市级行政界线图层、县(区)级行政界线图层、乡(镇)级行政界线图层。
(4)评价单元图层:通过GIS空间叠加功能,利用土地利用现状图、行政区划图和土壤类型图叠加产生的评价单元图层,建立分等评价单元数据库。
2.属性数据库
江苏省农用地分等信息系统属性数据库内容包括以下方面:
(1)土壤属性数据:以全国第二次土壤普查为基础,结合全省土壤监测样点数据,建立土壤质量状况数据库,最小单位为土种,包括pH值、有机质含量、表层土壤质地、耕层厚度、障碍层深度、水土侵蚀程度、盐渍化程度数据。
(2)农田水利环境数据:建立了1996~2000年间各乡镇农田水利环境基础数据库,包括灌溉保证率、排水条件数据。
(3)土地利用现状数据:建立了全省13个省辖市的以1996年土地利用现状图为基础,经变更调绘形成的以2000年为基准年的土地利用现状数据库,区分耕地中的详细用地类型差异,标示水田、旱地、荒草地等纳入本次评价范围的用地内容。
(4)全省地形地貌数据库。
(5)农业区划数据:输入了江苏省农业区划数据,把江苏全省划分为6大区划,以乡镇为最小级别,建立全省乡镇的区划归属数据库。
(6)农业耕作制度数据:建立了全省各市、县、乡镇的农业耕作制度数据库,包括指定作物水稻和小麦的播种空间分布状况数据库。
(7)光温生产潜力数据:建立了全省各市、县指定作物水稻和小麦的光温生产潜力和气候生产潜力数据库。
(8)农业投入-产出数据:全省13个省辖市以乡镇为单位,建立了1996~2000年农业生产投入-产出数据库。
(9)作物产量数据:全省13个省辖市以乡镇为单位,建立了1996~2000年的指定作物水稻和小麦的产量数据库。
(10)土地利用详查分类面积数据:全省13个省辖市以乡镇为单位,建立了2000年土地利用详查分类面积数据库。
从数据格式上分,数据库又可分为:①图件数据库:指空间数据以及绑定在空间数据上的相关属性数据,本次江苏省农用地分等建立了以分等单元为记录的属性数据库,并通过关键字段与空间数据关联;②分类统计数据库:包括全省13个省辖市以乡镇为单位的1996~2000年指定作物产量统计数据和全省13个省辖市以乡镇为单位的2000年土地利用详查分类面积统计数据。
(二)系统数据库管理模式
为减少数据存储冗余,同时提高索引速度,江苏省农用地分等信息系统数据文件采用普遍的目录树形式进行管理,按省-市-县行政体系分别存储相关数据。全省建立13个省辖市分目录,分目录下按照各自所含的县(区)建立子目录。根据目前行政管理体系现状,基础资料大多来源于县级行政单位,因此采用县(区)为基本行政单位较为合理,在保证资料来源的同时,也利于资料的分类归档存储。其相对应的空间图件数据也按精度要求分割到县级行政单位,既能减少系统调用数据的吞吐量,同时也满足了系统的精度需求。空间数据、属性数据、文本数据按照各自所属的行政级别归类存储,同时设立数据文件管理器进行目录文件的索引管理,见图3-86。
图3-86 江苏省农用地分等信息系统数据文件管理模式图
(三)系统数据库结构
数据库的结构设计决定了数据之间的调用及接口关系,清晰的逻辑调用关系和统一的数据接口格式有利于数据的组织、管理、调用。
1.空间数据库
江苏省农用地分等信息系统空间数据库以矢量图件的形式存在,以分图层的方式管理,包括了全省行政界线、土壤类型、按八大类分别提取的土地利用现状、分等单元等图层。其中,分等单元图层作为农用地分等的基础,考虑到图层本身信息量大,可能影响到系统运行效率,因此所在图层的属性表中只保留了ID字段,通过ID字段与外部属性库绑定,实现分等单元与外部属性库一一对应关系。ID字段是本图层的特征代码,表征了单元的唯一性,能体现出单元的图上位置和行政归属。《农用地分等定级规程》(国土资源大调查专用)和《中华人民共和国行政区划代码》(GB/T 2260-1999)为本研究分等单元代码的编码依据;本研究有1996年和2000年两套行政区划工作底图,为此分等单元特征代码共设14位,依次为江苏省代码(2位)-市代码(2位)-2000年县或区代码(2位)-2000年乡镇代码(2位)-1996年县或区代码(2位)-1996年乡镇代码(2位)-分等单元号(2位)。其中,省、市、县(区)的行政代码按国家统一代码,乡镇级代码在县(区)范围内根据划分分等单元的需要依次编码;分等单元编号的原则是不破乡镇界,即单元号是在同一乡镇内部自行编码。示例:32011501210101,指1996年江苏(32)南京(01)市江宁县(21)由于2000年行政调整变更为南京(01)的江宁区(15)。按行政体系分级编码的优点是有利于空间查询和国土资源管理部门根据工作需求按行政级别分类汇总统计数据。
2.属性数据库
江苏省农用地分等信息系统采用关系型数据库来存储数据,优点是结构清晰明了,数据的更新维护方便,通过索引能优化数据库,建立快速的查询浏览(表3-26~表3-30)。
表3-26 行政代码数据结构表
表3-27 土壤属性数据结构表
表3-28 农田水利设施数据结构表
表3.29 指定农作物投入-产出数据结构表
表3-30 农业耕作制度及农业区划表
(四)系统模型库
系统以《农用地分等定级规程》(国土资源大调查专用)中的相关技术方法和计算模型为基础,在模型库中预先内置了分等计算模型。模型库是动态,它允许专家根据情况动态调整计算模型形式及其参数。系统主要模型的数学计算公式如下:
(1)农用地自然质量分值(Clij)计算公式见式(3-11)。
(2)样点土地利用系数计算公式:
中国耕地质量等级调查与评定(江苏卷)
式中:
Klj´——样点的第j种指定作物土地利用系数;
Yj——样点的第j种指定作物实际单产;
Yj,max——第j种指定作物最大标准粮单产。
(3)等值区土地利用系数计算公式:
中国耕地质量等级调查与评定(江苏卷)
式中:
Klj——等值区内第j种指定作物土地利用系数;
Klj´——参与计算的同一等值区内合格样点第j种指定作物土地利用系数;
n——排除异常数据后参与计算的样点的个数。
(4)样点土地经济系数计算公式:
中国耕地质量等级调查与评定(江苏卷)
式中:
Kcj′——样点的第j种指定作物土地经济系数;
Yj——样点第j种指定作物实际单产;
Cj——样点第j种指定作物实际成本;
Aj——第j种指定作物最高“产量-成本”指数。
(5)等值区土地经济系数计算公式:
中国耕地质量等级调查与评定(江苏卷)
式中:
Kcj——等值区内土地经济系数;
Kcj´——参与计算的同一等值区内合格样点第j种指定作物土地经济系数;
n——排除异常数据后参与计算的样点的个数。
(6)农用地自然质量等指数(Ri)计算公式见式(3-12)和式(3-13)。
(7)农用地利用等指数(Yi)计算公式见式(3-14)和式(3-15)。
(8)农用地经济等指数(Gi)计算公式见式(3-16)和式(3-17)。
❺ 基础数据库
(一)数据内容
基础数据库包括系统运行前所采集到的所有支撑数据,数据的具体内容在数据分类与数据源章节中已描述,概括可分为以下几类。
(1)遥感影像数据:包括历史图像数据,以及按照一定监测周期更新的遥感图像数据。
(2)数字线划图数据:矢量数据(现状专题图和历史专题图数据)、栅格数据、元数据等。入库前数据以ArcInfoCoverage格式分幅或整体存储,采用地理坐标系统。
(3)数字栅格图数据:包括1∶5万和1∶10万基础地理图形数据的扫描栅格数据。
(4)数字高程模型数据:塔里木河干流河道1∶1万和“四源一干”区域1∶10万数字高程模型。
(5)多媒体数据:考察照片、录像、录音和虚拟演示成果等多媒体资料。
(6)属性数据:社会经济与水资源数据、水利工程数据、生态环境数据等。
(二)数据存储结构
1.栅格数据
栅格数据包括遥感影像、数字栅格图、数字正射影像图、数字高程模型等,这些数据的存储结构基本类似,因此可进行统一设计。遥感图像数据库与普通的图像数据库在存储上有些差别,遥感图像作为传感器对地理、空间环境在不同条件下的测量结果(如光谱辐射特性、微波辐射特性),必须结合同时得到的几个图像才可以认为是对环境在一定的时间条件下的完整的描述,也即是说,可能需要一个图像集合才能构成一个图像的完整的概念,并使之与语义信息产生联系(罗睿等,2000)。因此,遥感图像数据存储结构模型必须能够描述几个图像(波段)之间的逻辑关系。利用ArcSDE进行数据入库时,系统可自动建立各图像(波段)之间的关系,并按一定规则存储在数据库系统中。
对栅格数据在后台将采用Oracle数据库管理系统进行存储。Oracle系统可直接存储影像信息,并具有较强的数据管理能力,可以实现栅格数据信息的快速检索和提取。数据引擎采用ArcSDE,实现各类影像数据的入库。数据存储的关键是建立图幅索引,本系统数据的存储按图幅号、图名、采集时间等内容建立索引。
栅格数据依据图形属性一体化的存储思想,采用大二进制格式直接存储数据,这种方式的存储可实现内容的快速检索查询,按索引表检索出相关项后可直接打开栅格数据,提高栅格数据的管理效率。
2.矢量数据
本系统采用图属一体化思想即将空间数据和属性数据合二为一,全部存在一个记录集中的思想存储空间数据,是目前GIS数据非常流行的存储方法。考虑到数据的具体情况,决定采用数据库存储空间数据和属性数据,部分具有少量、定型几何信息的地理要素如水文测站、河流、湖泊等,采用图属一体化思想存储其信息,而与其有关联关系的大量、多边化的属性信息如水文信息,则存储在属性数据表中,利用唯一标识符信息建立两表的关联。
针对本系统空间数据的特点,系统按照“数据库—子库—专题(基础数据)—层—要素—属性”的层次框架来构筑空间数据库,按照统一的地理坐标系统来存储空间数据,以实现对地理实体/专题要素进行分层叠加显示。
3.多媒体数据
Oracle系统可直接存储图片和视频信息,并具有较强的数据管理能力,可以实现多媒体信息的快速检索和提取。多媒体数据存储的关键是建立索引表,本系统多媒体数据的存储按类型、时间、内容等项目建立索引,直接存储于Oracle数据库中。
多媒体数据存储时,可以将多媒体内容与索引表结构合为一体,采用大二进制格式直接存储,这种存储方式可实现内容的快速检索和查询,按索引表检索出相关项后可直接打开多媒体内容,而且多媒体数据库也便于维护管理。
(三)空间索引设计
1.矢量空间索引
确定合适的格网级数、单元大小是建立空间格网索引的关键。格网太大,在一个格网内有多个空间实体,查询检索的准确度就低。格网太小,则索引数据量成倍增长和冗余,检索的速度和效率低。每一个数据层可采用不同大小、不同级别的空间索引格网单元,但每层级数最多不能超过三级。索引方式设置遵循以下基本原则:
(1)对于简单要素的数据层,尽可能选择单级索引格网,减少RDBMS搜索格网单元索引的级数,缩短空间索引搜索的过程;
(2)如果数据层中的要素封装边界大小变化比较大,应选择2或3级索引格网;
(3)如果用户经常对图层执行相同的查询,最佳格网的大小应是平均查询范围的1.5倍;
(4)格网的大小不能小于要素封装边界的平均大小。为了减少每个格网单元有多个要素封装边界的可能性,格网单元的大小应取要素封装边界平均大小的3倍;
(5)格网单元的大小不是一个确定性的问题,需要多次尝试和努力才会得到好的结果。有一些确定格网初始值的原则,用它们可以进一步确定最佳的格网大小。
SDE(Spatial Data Engine,即空间数据引擎),从空间管理的角度看,是一个连续的空间数据模型,可将地理特征的空间数据和属性数据统一集成在关系型数据库管理系统中。关系型数据库系统支持对海量数据的存储,从而也可实现对空间数据的海量存储。空间数据可通过层来进行数据的划分,将具有共同属性的一类要素放到一层中,每个数据库记录对应一层中一个实际要素,这样避免了检索整个数据表,减少了检索的数据记录数量,从而减少磁盘输入/输出的操作,加快了对空间数据查询的速度。
ArcSDE采用格网索引方式,将空间区域划分成合适大小的正方形格网,记录每一个格网内所包含的空间实体(对象),以及每一个实体的封装边界范围,即包围空间实体的左下角和右上角坐标。当用户进行空间查询时,首先计算出用户查询对象所在格网,然后通过格网号,就可以快速检索到所需的空间实体。因此确定合适的格网级数、单元大小是建立空间格网索引的关键,太大或太小均不合适,这就需要进行多次尝试,确定合适的网格大小,以保证各单元能均匀落在网格内。利用ArcSDE的索引表创建功能,记录每一网格单元的实体分布情况,形成图层空间索引表。根据空间索引表,ArcSDE实现了对空间数据的快速查询。
2.栅格数据空间索引
栅格数据的空间索引通过建立多级金字塔结构来实现。以高分辨率栅格数据为底层,逐级抽取数据,建立不同分辨率的数据金字塔结构,逐级形成较低分辨率的栅格数据。该方法通常会增加20%左右的存储空间,但却可以提高栅格数据的显示速度。在数据库查询检索时,调用合适级别的栅格数据,可提高浏览和显示速度。
(四)入库数据校验
入库数据的质量关系到系统评价分析结果的准确性。数据在生产中就需要严格进行质量控制。依据数据生产流程,将数据质量控制分成生产过程控制和结果控制。生产过程控制包括数据生产前期的质量控制、数据生产过程中的实时质量控制,结果质量控制为数据生产完成后的质量控制(裴亚波等,2003)。对入库数据的校验主要是进行数据生产完成后的质量控制和检查。
1.规范化检查
(1)代码规范化:所有地理代码尽量采用国家标准和行业标准,例如,行政代码采用中华人民共和国行政区划代码国标。
(2)数据格式规范化:所有数据采用标准交换数据格式,例如,矢量数据采用标准输出Coverage格式和E00格式。
(3)属性数据和关系数据字段规范化:所有属性数据和关系数据提前分门别类地设计字段的内容、长短和格式,操作过程中严格执行。
(4)坐标系统规范化:本系统所有与空间有关的数据采用统一的空间坐标系统,即地理坐标系统。
(5)精度规范化:所有数据按照数据精度与质量控制中所要求的精度进行采集和处理。
(6)命名规范化:所有数据按照命名要求统一命名,便于系统的查询。
(7)元数据规范化:依照元数据标准要求,进行元数据检查。
2.质量控制
数据质量是GIS成败的关键。对于关系型数据库设计,只要能保证表的实体完整性和参照完整性,并使之符合关系数据库的三个范式即可。对于空间数据库设计,则不仅要考虑数据采样、数据处理流程、空间配准、投影变换等问题,还应对数据质量做出定量分析。
数据质量一般可以通过以下几个方面来描述(吴芳华等,2001):
(1)准确度(Accuracy):即测量值与真值之间的接近程度,可用误差来衡量;
(2)精度(Precision):即对现象描述得详细程度;
(3)不确定性(Uncertainty):指某现象不能精确测得,当真值不可测或无法知道时,就无法确定误差,因而用不确定性取代误差;
(4)相容性(Compatibility):指两个来源不同的数据在同一个应用中使用的难易程度;
(5)一致性(Consistency):指对同一现象或同类现象表达的一致程度;
(6)完整性(Completeness):指具有同一准确度和精度的数据在类型上和特定空间范围内完整的程度;
(7)可得性(Accessibility):指获取或使用数据的容易程度;
(8)现势性(Timeliness):指数据反映客观现象目前状况的程度。
塔里木河流域生态环境动态监测系统的所有数据在数据质量评价后,还需要从数据格式、坐标一致性等方面进行入库质量检验,只有通过质量检验的数据才可以入库。
3.数据检验
空间数据质量检验包括以下步骤:
(1)数据命名是否规范,是否按设计要求命名;
(2)数据是否能够正常打开;
(3)投影方式是否正确;
(4)坐标系统是否正确;
(5)改错是否完成,拓扑关系是否建立;
(6)属性数据是否正确,包括字段设置是否依据设计进行、是否有空属性记录、是否有属性错误记录等。
关系数据质量检验包括以下步骤:
(1)数据命名是否规范,是否按设计要求命名;
(2)数据是否能够正常打开;
(3)数据字段是否按设计要求设置;
(4)是否有空属性记录;
(5)是否有属性错误记录。
属性数据的校验,主要采用以下三种方式:
(1)两次录入校验:对一些相互之间毫无关联的数据,进行两次的录入,编写程序对两次录入的结果进行比较,找出两次录入结果不一样的数据,查看正确值,进行改正。
(2)折线图检验:对一些相互之间有关联的序列数据,如人口统计数据,对这一类数据,编写程序把数据以折线图的形式显示在显示器上,数据的序列一般都有一定规律,如果出现较大的波动,则需对此点的数据进行检查修改。
(3)计算校验:对一些按一定公式计算后所得结果与其他数据有关联的数据,如某些数据的合计等于另一数据,编写程序对这类数据进行计算,计算结果与有关联的数据进行比较,找出结果不一样的数据,查看正确值,进行改正。
图形数据的校验,主要包括以下步骤(陈俊杰等,2005):
(1)图层校验:图形要素的放置图层是唯一的。对于入库的Coverage数据,系统将根据图层代码进行检查,确保图形要素对层入座。
(2)代码检查:图形要素的代码是唯一的。对于入库的Coverage数据,系统将根据入库要素代码与特征表中的代码进行比较,确保入库数据代码存在,杜绝非法代码入库。
(3)类型检查:对入库的数据,检查该要素的类型与特征表中的类型是否一致,确保图形要素对表入座。如点要素、线要素、面要素仅能赋相应的点、线、面代码,且该代码必须与特征表中的数据类型代码相同。
(4)范围检查:根据入库的数据,确定该类要素的大体范围(如X、Y坐标等),在数据入库前,比较入库数据与范围数据的大小,若入库数据在该范围内,则入库,否则给出提示检查信息。
(五)数据入库
1.遥感影像数据
利用空间数据引擎———ArcSDE可实现遥感影像数据在Oracle数据库中的存储和管理,在影像数据进行入库时,应加入相应的索引和影像描述字段。
遥感影像入库步骤:
(1)影像数据预处理:要将塔里木河遥感影像数据库建成一个多分辨率无缝影像数据库系统,客观上要求数据库中的影像数据在几何空间、灰度空间连续一致。因此,在数据采集阶段就需要对影像数据进行预处理,包括图像几何校正、灰度拼接(无缝镶嵌)、正射处理、投影变换等。
几何校正的目的是使校正后的图像重新定位到某种地图投影方式,以适用于各种定位、量测、多源影像的复合及与矢量地图、DTM等的套合显示与处理。几何校正多采用二次多项式算法和图像双线性内插重采样法进行图像校正。将纠正后具有规定地理编码的图像按多边形圈定需要拼接的子区,逐一镶嵌到指定模版,同时进行必要的色彩匹配,使整体图像色调一致,完成图像的几何拼接,再采用金字塔影像数据结构和“从粗到精”的分层控制策略实现逐级拼接。
数字正射影像具有统一的大地坐标系、丰富的信息量和真实的景观表达,易于制作具有“独立于比例尺”的多级金字塔结构影像。可以采用DTM和外方位元素经过数字微分纠正方法,获得数字正射影像,它的基本参数包括原始影像与正射影像的比例尺、采样分辨率等(方涛等,1997)。
投影变换需根据数据库系统定义的标准转换到统一的投影体系下。
(2)影像数据压缩:随着传感器空间分辨率的提高和对遥感信息需求的日益增长,获取的影像数据量成几何级数增大,如此庞大的数据将占用较大的存储空间,给影像的存储和传输带来不便(葛咏等,2000)。目前,系统处理的遥感影像数据已达数百千兆,单个文件的影像数据最大达到了2G,这样的数据量在调用显示时速度很慢,对影像数据进行压缩存储,将大大提高影像访问效率。本系统采用ArcSDE软件提供的无损压缩模式对入库影像进行压缩。
(3)影像导入:遥感影像的入库可通过ArcSDE或入库程序进行导入,并填写相关的索引信息,在入库时对大型的遥感影像数据进行自动分割,分为若干的块(tiles)进行存储。
(4)图像金字塔构建:采用ArcSDE提供的金字塔构建工具在入库时自动生成图像金字塔,用户只需要选择相应的参数设置即可。图像金字塔及其层级图像按分辨率分级存储与管理。最底层的分辨率最高,并且数据量最大,分辨率越低,其数据量越小,这样,不同的分辨率遥感图像形成了塔式结构。采用这种图像金字塔结构建立的遥感影像数据库,便于组织、存储与管理多尺度、多数据源遥感影像数据,实现了跨分辨率的索引与浏览,极大地提高了影像数据的浏览显示速度。
2.数字线划图
对纸图数字化、配准、校正、分层及拼接等处理后,生成标准分幅和拼接存储的数字矢量图,就可以进行图形数据入库。
(1)分幅矢量图形数据、图幅接合表:按图形比例尺、图幅号、制作时间、图层等方式,通过入库程序导入到数据库中,同时导入与该地理信息相对应的属性信息,建立空间信息与属性信息的关联。
(2)拼接矢量图形数据:按图形比例尺、制作时间、图层等方式,通过入库程序导入到数据库中,同时导入与该地理信息相对应的属性信息,建立空间信息与属性信息的关联。
3.栅格数据
对纸图数字化、配准、校正、分层及拼接等处理后,生成标准分幅和整体存储的数字栅格图,然后进行图形数据入库。
(1)分幅栅格图形数据、图幅接合表:按图形比例尺、图幅号、制作时间等方式,通过入库程序导入到数据库中。
(2)整幅栅格图形数据:按比例尺、制作时间等方式,通过入库程序导入到数据库中。
4.数字高程模型
(1)分幅数字高程模型数据、图幅接合表:按图形比例尺、图幅号、制作时间等方式,通过入库程序导入到数据库中。
(2)拼接数字高程模型数据:按比例尺、制作时间等方式通过入库程序导入到数据库中。
5.多媒体数据
多媒体数据入库可根据多媒体数据库内容的需要对入库数据进行预处理,包括音频、视频信息录制剪接、文字编辑、色彩选配等。对多媒体信息的加工处理需要使用特定的工具软件进行编辑。由于音频信息和视频信息数据量巨大,因此,对多媒体数据存储时需采用数据压缩技术,现在的许多商用软件已能够直接存储或播放压缩后的多媒体数据文件,这里主要考虑根据数据显示质量要求选择采用不同的存储格式。图4-2为各类多媒体数据的加工处理流程。
图4-2 多媒体数据加工处理流程图
6.属性数据
将收集的社会经济、水利工程、生态环境等属性资料,进行分析整理,输入计算机,最后经过程序的计算处理,存储到数据库中,具体流程如图4-3所示。
图4-3 属性数据入库流程图
❻ 地质-生态环境空间数据库建设指南
一、编写目的
建立山东半岛城市群地质-生态环境空间数据库,是“山东半岛城市群地区地质-生态环境综合调查评价及可持续发展研究”项目的设计要求,而山东半岛城市群地质-生态环境空间数据库建设,涉及地质、环境、水文、矿产等专业,并涉及单位较多,需要提交入库的数据也较多,为了指导和规范数据库项目的建设,特编写本指南,重点从建库的数据整理与格式转换阶段规范工作流程,明确最终提交成果,同时对元数据的填写做出了详细规定,本指南对山东半岛城市群空间数据库建设具有指导作用。
二、适用范围
本指南适用于山东半岛城市群地质-生态环境空间数据库建设工作。
三、编写依据及参考标准
1.国家及行业标准
GB/T2260—1999中华人民共和国行政区划代码
GB/T17798—1999地球空间数据交换格式
GB/T13923—92国土基础信息数据分类与代码
GB/T17766—1999固体矿产资源/储量分类
GB/T13989—92国家基本比例尺地形图分幅和编号
GB/T9649—88地质矿产术语分类代码
GB/T9649.16—1998地质矿产术语分类代码矿床学
DZ/T0197—1997数字化地质图图层及属性文件格式
2.部门标准
GX199900X-200X国土资源信息高层分类编码及数据文件命名规则国土资源部省级矿产资源规划编制指南国
国土资源部矿产资源储量数据库标准
中国地质调查局空间数据库工作指南2.0版
版山东半岛城市群地质-生态环境空间数据库建库标准(试行稿)
四、数据库框架设计
1.数据库需求分析
山东半岛城市群数据库是在“山东半岛城市群生态环境地质”项目研究成果的基础上研制、基于Arcinfo平台的空间数据库系统,其总体目标是存储和管理“山东半岛城市群生态环境地质”项目研究成果的资料、信息、地图及提供查询服务,为山东半岛城市群的空间布局管理、规划和决策以及重大项目建设和经济社会可持续发展提供依据。为达成这一总体目标,对数据库建设的需求应该包括以下方面:
1)对项目成果图件及其他数据存储管理的需求,需要构建一个符合要求的空间数据库。
2)提供对山东半岛城市群生态环境地质研究成果的管理、查询与展示。
3)提供山东半岛城市群生态、环境的现状与分级分布情况。
4)组织山东半岛城市群生态环境专题图件,直观地为决策咨询提出相应的对策和解决方案。
(1)功能需求
通过需求分析,得到软件的功能需求。除基本的数据输入、编辑和管理功能外,本系统还应具有以下4个方面的要求:
1)对现有地质-生态环境问题的展示、查询;
2)地质-生态环境质量现状的分析;
3)对地质-生态环境与可持续发展关系的分析评价;
4)保持经济增长和地质-生态环境相协调的对策与建议。
(2)性能需求
本数据库系统的性能需求为:
1)系统稳定性好;
2)可扩展性好;
3)操作简单;
4)可移植性好;
5)保密性。
根据“山东半岛城市群地区地质-生态环境综合调查评价及可持续发展研究”项目需求分析,数据库涉及的基础图件和数据、项目研究的成果数据如下:
1)基础地理、地质图件,采用1∶20万的地理底图和经过简化的地质底图。
2)各专题项目编汇的成果图件,包括:
山东半岛城市群地区地质图;
山东半岛城市群地区卫星遥感影像图;
山东半岛城市群地区区域稳定性综合评价图;
山东半岛城市群地区土地资源环境质量评价图;
山东半岛城市群地区矿产资源综合评价图;
山东半岛城市群地区地表水评价图;
山东半岛城市群地区地下水环境评价图;
山东半岛城市群地区海岸带地质灾害分布图;
山东半岛城市群地区生态环境综合评价图;
山东半岛城市群地区地质灾害易发区分布图;
山东半岛城市群地区地质生态与经济可持续发展对策图;
烟台地区地壳稳定性评价分区图;
烟台地区地质-生态环境分析与评价图;
烟台地区生态功能区划与生态市建设规划图;
青岛地区地壳稳定性评价分区图;
青岛地区海岸带地质环境质量评价图;
青岛地区地质-生态环境评价分区图。
3)属性数据;
4)文字报告;
5)专题图件数据。
2.数据库系统架构
根据以上对数据库需求的分析,结合目前项目的需要和经费情况,采用的系统架构见图12-1。
图12-1 数据库系统架构
本项目采用 ArcGIS Desktop 来搭建系统平台,用以实现定义好的空间数据和非空间数据的存储和管理。系统的核心采用地理数据库 GeoDataBase 体系结构。在后台通过 ArcCat-alog 应用模块来组织和管理所有的 GIS 信息,比如地图、数据集、模型、元数据、服务等; 通过 ArcToolBox 工具来完成数据转换、叠加处理、地理编码、统计分析和投影变换等数据处理。
客户端采用定制的 ArcMap,用以完成数据的显示、分析和编辑。另外可以通过 Arc-GIS 的扩展模块来实现对空间数据进行高效率的可视化和分析; 用 ArcGIS Spatial Analyst实现栅格数据的显示和处理。ArcGIS Desktop 系统平台表现示例见图 12 -2。
在系统数据库建成之后,如项目的后期需要进行数据的共享和发布,可采用 ArcSDE +ArcIMS 的搭配来实现 B / S 构架的数据共享。
图12-2 ArcGIS Desktop系统平台表现示例
3.数据库系统功能软件的系统功能分为基本系统数据管理功能和专业应用扩展功能两大部分。根据需求分析,确定各部分的功能。
1)基本功能部分:包括系统管理,数据输入、编辑、查询和输出,数据处理和图形符号库管理等。
2)扩展功能部分:包括现状展示、分析评价、可持续发展评价和决策支持等。系统的功能模块构成见图12-3。
图12-3 系统的功能模块构成
4.系统软件平台
在本项目的研究中,结合调查评价研究项目的工作实际,选取了美国ESRI公司的ArcGIS软件作为数据库开发的GIS软件平台,同时考虑到各专题研究单位的实际情况,选取MapGIS作为电子图件的绘制软件。在汇总各专题研究单位提交的MapGIS数字图件后,进行MapGIS格式数据向ArcGIS格式数据的转换,将研究成果加载到项目统一的地质-生态环境空间数据库中。本项目选择的ArcGIS软件平台包括ArcGISDesktop、ArcS-DE、ArcIMS等组件。
5.硬件平台选择
除按系统平台的选择原则外,硬件选择从以下方面考虑:
1)硬件的性能:能够满足系统软件平台的运行需求;
2)与其他硬件的兼容性:各种硬件设备可以协同工作;
3)与软件的兼容性:要兼容操作系统、数据库软件或其他应用软件。
可利用现有的计算机硬件,适当增设需要的硬件来构造系统的硬件环境。
6.系统实现步骤
(1)系统设计
1)总体结构设计:主要指系统中各子系统之间关系的设计。
2)系统各子系统或子功能模块的描述:各功能模块要划分到软件单元的层次,要求描述清晰,以满足编码、编译和测试的需要。
3)系统外部接口设计:完成系统外部接口、各软件单元之间的详细设计。
4)数据结构和数据库设计:主要指规划数据组织与表达方式的设计。
5)界面设计:主要指应用系统的操作界面设计。
6)软、硬件设计:主要指系统软硬件运行环境的设计。
7)系统单元测试的详细计划:包括测试集、测试用例和测试步骤。
(2)软件编程
完成程序代码的编写及数据库建库任务。
1)遵照软件设计说明书的要求,利用编程工具编制程序代码,并完成程序代码的测试工作。
2)按照半岛城市群项目数据库标准及数据库建库规范的要求,完成数据建库工作。
(3)系统集成与测试
完成系统集成及测试,生成可实际运行的系统,编写用户使用手册。
1)系统集成。
2)系统集成测试。集成测试的步骤为:
①制定系统各单元、模块、子系统的集成计划和集成测试计划,内容包括测试要求、步骤、数据和时间表等;②编写系统集成、测试文档;③按计划进行系统集成与集成测试,修改错误,再测试,直到符合设计要求;④编写测试报告。
3)编写用户使用手册。
五、数据入库工作流程
工作流程主要用于对规划数据库数据入库方法和过程进行指导。项目数据库的数据入库流程见图12-4。
图12-4 数据入库流程
1.资料收集
主要包括图件、表格和文字资料等项目所涉及的数据和成果。
2.资料预处理
数据预处理就是在全面收集资料的基础上,对资料进行系统的分析研究、综合整理及筛选等。
3.建库文档准备
主要是指对建库所需的文档进行准备,主要为数据整理记录表、属性填卡表准备,MapGIS编图的花纹符号库、线型库、颜色库设定等。
4.数据采集
数据的采集主要包括图件的输入、建立分层文件、属性的输入。
5.数据整理
数据整理的主要内容为:检查数据分层,重新命名分层文件,补充新增图层、调整部分地理、地质和规划专题属性结构,增加部分属性表格,以及整理附加文档等,完成上述工作后要填写元数据采集表并完成对元数据的录入,最后,对所有文件要进行标准化命名。
6.空间数据格式转换
按照项目建库的统一要求,各子项目在MapGIS平台下完成的成果图件,数据需要向ArcInfo格式进行转换。
六、数据质量监控
1.质量监控体系
项目承担单位和实施单位要建立完善的规划数据库建设质量监控体系,并制定相应的制度。
(1)自互检
建立完整的自互检表,每个作业人员的建库工作都要进行100%的自检,并将自检所发现的问题及时改正。在自检的基础上,由项目负责人安排其他作业人员进行60%以上的互检,并将互检结果和修改处理结果如实、完整地记录下来。
(2)抽检
每张图完成后,由项目负责抽取10%进行检查,并确保检查内容全部符合质量要求。
(3)阶段性检查
对建库的每个阶段性成果要进行严格检查把关,如图件扫描矢量化后的图元检查;属性录入后的图元、属性一致性检查等。
2.数据质量监控
(1)空间数据质量检查
空间数据质量检查主要是对成果图上的内容进行质量检查,要分别对MapGIS和ArcInfo格式的所有图层进行逐项检查,包括入库数据图层套合精度、拓扑、命名的标准化规范化、分层的正确性、数据的完整性、属性表结构的正确性、图元与属性的对应性、属性代码的准确性等。
(2)图面质量检查
图面检查是指对提交的成果数据图进行图面内容检查,发现错误应及时修改完善,直至准确无误。
(3)数据表数据质量检查
是指对非空间数据表和空间属性数据表检查数据的正确性,检查数据结构的一致性,并对照规划文本检查与规划实施相关内容的完整性和正确性。
(4)文档检查
资料文档检查主要是检查数据库所要求的文本、研究报告、编制说明、附表等资料文档是否齐全,内容是否正确,并检查元数据采集表及入库数据内容是否合乎要求。
3.数据质量监控指标
上述内容的检查总错误率小于2%,其中,图元(包括点、线、面、注释)错误率小于1%,属性(包括文字、代码、ID号对应、记录个数等)错误率小于2%,凡错误率大于该两值的,或发生图层缺失、附表缺失、文档缺失以及未提交正确的元数据采集表和入库数据的,一律不予通过。
七、提交数据要求
1.提交格式
成果图件:MapGIS格式,含工程、图层和系统库文件。
文档:包括编制说明、研究报告及其他文档资料(Word和Html两种格式)。表格:Access和Excel两种格式。
元数据采集表:Word格式。
2.提交形式
汇交数据存储介质为光盘。在提交成果之前,要进行全面查杀毒,确保数据安全。
❼ 如何使用ArcGIS Diagrammer设计空间数据库框架
从软件本身功能模块来看,主要包括以下几大功能。1.空间数据的编辑和管理功能空间数据的编辑和管理是地理信息系统软件的基本功能之一。ArcGIS具有强大的数据编辑、版本管理、数据共享、企业级数据管理功能,还具有空间数据采集、空间数据库创建、拓扑关系创建与管理等功能。从基本数据管理功能上看,ArcGIS的geodatabase空间数据库可以理解为是存放在同一位置的各类型地理数据集的集合,其存放位置可以是某一文件夹(本地)、Access数据库或者是同一个多用户关系型数据库管理系统(DBMS),支持Oracle,MicrosoftSQLSever,PostgreSQL,Informix及IBMDB2。而文件地理数据库是ArcGIS中另外一种地理数据库的类型,以文件夹形式将数据集存储在计算机中。每个数据集作为一个文件进行存储,文件大小可达1TB,支持跨平台使用,还可以进行压缩和解密。文件地理数据和个人地理数据库是专为支持地理数据库的完整信息模型而设计的,包含拓扑、栅格目录、网络数据、Terrain数据集、地址定位器等。而这两种数据库都不支持版本地理数据库的版本管理。ArcSDE地理数据库是为了让多用户的地理数据库进行数据库管理,在大小和用户数量方面没有限制,如果需要在地理数据库中使用历史存档、复制数据、使用SQL访问简单数据或在不锁定的情况下同时编辑数据,可以使用ArcSDE地理数据库。同样支持Oracle,MicrosoftSQLSever,PostgreSQL,Informix及IBMDB2等主流DBMS。当然ArcGIS具有强大的基本数据编辑功能,这个功能将在下面的章节中详细介绍。对于开发者而言,ArcObjects(即AO)中的地理数据库API提供对所有类型地理数据库及其他类型的GIS数据很好地控制,提供所有从简单数据库创建、数据查询到高级数据集合的构建(网络、拓扑等)及高级的地理数据库功能,如版本管理、数据库复制等API。使用AOAPI,开发者不仅可以在已有的桌面产品(ArcGISDesktop)中定制功能,还可以开发独立的应用程序。ArcSDEAPI提供开发者直接控制ArcSDE地理数据库的能力。2.制图表达及高级制图功能ArcGIS平台拥有完整的地图生产体系,包括制图符号化、地图标注、制图编辑、地图输出和打印。ArcGIS10在制图上有较多改善,这部分内容在1.3节“ArcGIS10新功能”中详细介绍。3.地理处理功能地理处理的基础是数据变换,在ArcGIS中,Geoprocessing包含了几百个空间处理工具执行对数据集的各种操作,从而生成新的数据集。ArcGIS提供了Modelbuilder对话框以支持设计这些工具所组成的操作流程,这样就可以设计出各种模型来实现自动化工作,执行复杂问题的分析。4.空间分析等扩展模块空间分析是GIS最具特色的一部分内容,事实上空间分析属于数据地理处理的一部分。但鉴于其支持丰富复杂的操作,支持多种独立信息源的融合,ArcGIS将其作为独立的扩展模块。基于ArcToolbox和Modelbuilder可视化建模环境的空间处理框架,空间分析功能可以得到丰富多样的分析处理结果。鉴于其功能涵盖面较广,第五篇将有独立介绍该功能模块的详细内容。5.三维可视化和分析扩展模块栅格数据是GIS数据的重要来源,由卫星和航空器及其他栅格数据采集器得到。另外,数字高程模型、扫描纸质地图、专题栅格数据等也是栅格数据的重要来源。ArcGIS可以进行影像管理、处理、发布和使用,如二三维一体化的影像显示和浏览,栅格影像数据的存储、编目、处理和分发,影像分析和动态处理,影像服务的发布及地图缓存的制作等。三维可视化和分析是目前GIS应用重要发展方向之一,也是热门技术之一。除以上介绍的基本GIS功能之外,ArcGIS还具备应用平台企业级GIS,CAD系统集成整合功能,以及目前流行的云计算技术等。本书重点介绍前5个基本功能。
❽ 遥感作业空间数据库的建立流程有那些
建模,入库,生产。
数据库建模过程。这一过程主要是根据行业应用特点及对其的理解,制定出比较规范的数据规范,在逻辑上建设数据库。数据监理过程。这一过程主要是检测数据的正确性,从而保证建库的准确性。利用各种工具将各种数据入库的过程。此过程主要是将可以得到的各种数据纸制数据,矢量数据,栅格数据,遥感数据等快速、准确的入到库中。
通过设计和建database空间数据库,掌握空间数据库设计和建设流程,学会所学GIS知识独立分析决问题的能力,对所学建库知识进行一个完整的串接。需求分析,旅游业是一个综合性很强的信息依赖型产业,旅游信息的获取、加工、传播和利用对旅游业的发展起着举足轻重的作用。从旅游者和旅游规划管理部门的需求出发建立旅游信息数据库,不仅可以使旅游者和旅游规划管理部门能够快速、准确地查找和检索自己所需要的旅游信息,而且能够促进旅游信息规范化和标准化,促进旅游信息的共享,打破对旅游信息的封锁;旅游信息数据库的建立有利于从整体上对旅游业进行宏观的调控和管理,有利于旅游业协调、健康有序的发展。
❾ 如何使用ArcGIS Diagrammer设计空间数据库框架
1
打开软甲,新建一个新建一个Diagrammer,使用【File】下面的【New】菜单,新建一个Diagrammer。
2
新建一个Feature Dataset,并更名为道路信息:
多图
3
新建一个point对象,并命名为道路路线,建立一个network,并命名为道路几何网络:
多图
4
建立连接(Link),切换成Link Mode
多图
5
按照相同的方法,对建立道路系统所需的其他要素类和要素集进行构架,如下图:
6
给要素类添加字段,修改命名,并给长度赋值,添加字段结果,最后构建的整个模型如下:
多图
7
将当前Diagrammer保存为相应的道路模型,将结果输出为XML架构文件。选择【File】菜单下的【Publish】,将结果输出为XML文档。
多图
8
将xml架构文件导入到File Geodatabase中启动ArcCtalog,选择合适位置,新建一个File Geodatabase命名为校园道路,在数据库上右键,【import】,选择XML工作空间,最终导入结果:
多图
❿ 无缝空间数据库设计与构建
(一)问题的提出
塔里木河流域生态环境动态监测系统的运转需要大量的空间数据支持。在空间数据库构建前期,采集了塔里木河流域的各尺度基础地形图、生态环境专题图以及遥感影像资料等图形、图像数据,这些数据都是以分幅的成果进行收集和提交的,需要进入综合数据库中,以实现数据的共享。
我国国土版图大,而且大部分位于中、低纬度地区,因此我国现行的大于1∶50万比例尺的各种地形图都采用高斯-克里格投影即横切椭圆柱正形投影。经过高斯-克里格投影后的平面直角坐标系是以相切的经线(中央经线)的投影为X轴,以赤道的投影为Y轴。高斯-克里格投影具有以下特点:
(1)中央经线投影为直线,而且是投影的对称轴(也是投影平面的X轴);
(2)高斯-克里格投影是等角投影,投影后具有角度不变、伸长固定的特点(即同一地点各个方向的长度比不变),满足等角的要求;
(3)中央经线上长度没有变形,离中央经线越远变形越大。为了限制投影变形,必须进行分带投影。所谓分带就是按照一定的经度差,将椭球体按经线划分成若干个狭窄的区域,各个区域分别按高斯投影的规律进行投影,每一个区域就称为一个投影带。在每一个投影带内,位于各带中央的子午线就是轴子午线,各带相邻的子午线叫边缘子午线。分带之后,各带均有自己的坐标轴和原点,形成各自独立但又相同的坐标系统。根据国际通用方法,我国投影分带主要有两种:在我国1∶2.5万到1∶50万地形图均采用6°分带投影,1∶1万及更大比例尺的地形图采用3°分带投影,以保证投影变形误差满足地图的精度要求(王密等,2001)。
本系统所采集到的数据产品的空间参考大都是以高斯投影后的平面坐标为基础的分幅数据。塔里木河流域地域广阔,地理坐标介于东经73°10'~94°05',北纬34°55'~43°08'之间,以1∶10万基础地形图数据为例,按照高斯投影后的坐标分成了13°、14°、15°、16°四个6°高斯投影带,每个带的坐标都是以本带的坐标原点为参考点,空间基准不统一,如果将这些数据直接进行入库,将在跨带处产生缝隙,不能形成逻辑意义上完整的河流表现,也无法完成基于整个流域的生态环境分析,因此,必须采用相应的数据处理与建库技术,实现塔河整个流域数据的无缝集成管理,使之形成统一的整体。从基础数据的获取开始,进行精心设计和组织,分离出数据物理层和数据逻辑层,在统一的空间框架之下,将物理层归化到逻辑层,以消除逻辑层的缝隙,从而实现用户级的逻辑无缝空间数据库。
(二)无缝数据库
随着GIS数据发布与共享技术的发展,无缝空间数据库逐渐分化出两个层次的含义:一是GIS系统内部的数据无缝,一是不同GIS实现互操作时的数据无缝。前者是通常意义的无缝,后者主要通过数据标准化与操作标准化来实现。无缝空间数据库的最终含义体现在逻辑无缝数据库。无论是多源还是单源、同构还是异构,跨越数据层呈现在用户面前的GIS空间数据库必须是逻辑无缝的。
空间数据的无缝连接是一个建立在用户与数据库接口基础上的概念,意味着GIS管理的数据不再是单一、被硬性割裂的图幅,而是范围更加广阔的区域,这个区域小可到一个城市,大可到一个国家甚至整个地球(王卉、王家耀,2004)。由于硬软件条件的限制,计算机系统尚不能同时处理海量的空间数据,因此从具体技术的实施上,可采用将空间数据分块存储于数据库中,数据库提供相应的图块拼接信息。物理上空间数据是有缝隙的,但空间数据库提供图块之间的接图信息及相应的拼接访问手段,保障了空间数据在使用上的空间连贯性,即数据在逻辑使用上是无缝的(王密等,2001)。
(三)缝隙产生原因
在现实世界中,地理空间是由地貌、地物组成的连续的表层空间,地理信息则是有关地理空间的一切有用的知识。在计算机世界中,地理信息通过抽象、建模形成数字化的表示形式,通过空间数据库来进行表达、存储和管理(朱欣焰等,2002)。空间地理数据缝隙是在数据的获取、表示与处理过程中产生的数据不连续现象。
1.数据源
由于历史和现实的原因,地图是绝大多数GIS系统直接的数据源。地图是地球三维椭球面的二维平面表达,本身对真实世界有扭曲;地图是对连续空间的割裂表达,实体被分割到不同的地图空间中去;高斯投影是基本比例尺地形图经常选用的投影,也是绝大多数GIS系统的数学基础,由于分带的原因,使得投影后带有高斯投影平面坐标的地图无法实现无缝拼接。
2.数据表达与组织方式
空间地理几何数据的表示主要有栅格和矢量两种不同的形式。栅格形式是将地理表层空间划分为一系列网格,空间目标由这些网格的位置及其量化值来表示,这些网格本身就是连续空间信息的离散表达。矢量形式则是将地理空间的一切事物、概念进行抽象,形成点、线、面,由点、线、面来组成各类空间目标。按点、线、面来分类和按分层的思想来组织空间数据,也割裂了实体之间内在的联系。
在空间数据库组织与管理上,目前主要有文件型、文件与关系数据库混合型、全关系型以及对象关系型。传统的文件型空间数据库、文件与关系混合型空间数据库,按图幅或一定的区域范围以文件的形式来组织与存储空间几何数据,不同的图幅或区域之间存在缝隙。在文件与关系数据库混合型的空间数据库中,空间几何数据贮存在文件中,属性数据贮存在关系数据库中,属性数据和几何数据之间通过内部标识来链接,空间几何数据和属性数据之间存在缝隙。
3.数据处理
数据处理的过程中也会引入缝隙,产生这种缝隙的原因有:①数据处理过程的顺序不一致;②选择的处理参数不一致;③数字化的精度不一致。
4.多源异构数据共享
数据属性(数学基础、比例尺、用途、时间、精度等)的不同,导致了数据的差异,这些差异是多层次和多方面的,它们集中体现了数据的异构。数据异构和多源往往是一体的,多源异构是系统内部和系统之间数据裂隙的主要原因(刘仁峰,2005)。
(四)数据缝隙类别和表现
数据缝隙基本可以分为物理缝隙和逻辑缝隙两类。物理缝隙是地理空间的分离存储,本来连续的实体空间被分离到不同的存储空间和存储单元中去,例如空间数据的分幅、分层存储。逻辑缝隙是指逻辑上本身连续的信息不能以逻辑连续的方式呈现,例如跨越多幅图的一条河流,在图幅内查询河流属性(如长度)时只能获取其在本图幅内的相关信息而不是实体整体的信息。显然,由于空间信息本身的海量特性,要完全意义上的实现物理无缝的空间数据库目前还是不可能的,也没有必要。GIS用户关心的不是空间数据是物理无缝,因为GIS呈现给用户的是数据逻辑层,只需要保证用户看到的数据是逻辑无缝的。
物理有缝的数据库向逻辑无缝数据库的转换是无缝空间数据库构建的重要一环。
(五)无缝镶嵌技术
数据的无缝连接包含以下几个问题:投影、坐标系统、比例尺、数据精度等。对不同投影和坐标系统的空间数据在投影和坐标系统上统一采用相同的标准,当空间数据具有多尺度时,无缝连接寻找数据集之间连续的表达方式,它表现为不同尺度数据之间的集成。建立无缝空间数据的关键在于在合适的空间信息框架上实现多源异构空间数据的融合,框架是基础,融合是手段。
1.合适的空间框架选择
(1)适合多尺度信息表达。地球是一个开放的非常复杂的巨大系统,随着观察视角的变化,我们希望空间地理信息比例尺也自动增减。由于地图的自动综合受诸多因素的影响,目前比较可行的是采用多尺度空间数据支持来达到目的。所谓多尺度就是指系统内包含几种不同比例尺(或分辨率)的空间数据,其目的是为了适度地反映系统所关心区域的空间地理信息,以避免地物信息的过粗、失真或地物信息的负载量过大而无法使用。无缝空间数据库也应该符合多尺度空间数据库要求。
(2)适合大区域表达。各种自然和人文现象的空间分布,有其内在的原因和规律,这些原因和规律的获得,往往需要研究大区域多因素的综合作用;另一方面,对于全球范围的环境变异和气候变迁的研究需要基于数字地球的空间框架。大区域的表达,还涉及空间尺度问题,不应继续采用欧氏空间尺度,而应该采用大地线尺度空间。
2.多源异构空间数据的融合
(1)GIS的迅速发展和广泛应用导致了多源空间数据的产生。如何实现不同的GIS软件共享并操作不同来源的地理数据,即GIS多源空间数据的集成,成为GIS发展的关键。目前GIS多源空间数据的集成主要朝着三个方向发展,一是通过建立统一的数据交换标准来约束并规范已有的各类地理信息系统,采用数据交换标准来进行空间数据交换;二是建立开放式地理数据互操作规范,进行地理信息系统互操作;三是GIS数据中间件技术。
(2)统一数据交换标准存在很多实现上的困难。互操作是一个重要发展趋势,是在异构分布式数据库中实现信息共享的途径,它需要将GIS技术、分布处理技术、面向对象方法、数据库设计及实时信息获取方法更有效地结合起来。所谓GIS数据中间件技术是指能够嵌入各类GIS系统的软件,GIS开发者通过中间件开发商提供的接口,访问和操作特定的数据源。
(3)在多源异构数据集成技术尚未成熟的时候,人们再次把目光投向数据本身,如果可以提供关于数据的详细描述,是否可以提高融合数据的能力呢?于是,对于“关于数据的数据”的研究,即对于元数据的研究便普遍展开。从DublinCore到CSDGM与OGC,都提出了相应的元数据标准体系,有了完整而完善的元数据描述,必将提高数据的效能,从而最终促进多源异构数据库向无缝空间数据库的归化。
为实现塔河整个流域数据的无缝集成管理,使之形成统一的整体,设计从缝隙产生的地方开始,分离出数据物理层和数据逻辑层,在统一的空间框架之下,将物理层归化到逻辑层,以消除逻辑层的缝隙,从而实现用户级的逻辑无缝空间数据库;同时制定统一的数据提交规范,如所有矢量数据在入库前统一采用经纬度坐标,栅格数据统一提供两套数据,即高斯坐标和经纬度坐标,以满足不同用户的管理需求和精度要求。