GIS数据的标准化与数据共享范志坚1,2,⽅源敏1,汪虹 2
(1.昆明理⼯⼤学国⼟资源⼯程学院昆明 650093;2.云南省基础地理信息中⼼昆明 650034)
摘要:地理信息系统的核⼼是数据。数据的标准化是实现数据共享的关键,也是促进地理信息产业形成和发展的必要条件;数据共享是国家空间数据基础设施建设需要解决的核⼼问题,数据的标准化和数据共享是地理信息系统的关键技术。关键词:GIS;数据的标准化;数据共享Data standardization and Data sharing in GISFan Zhi-jian1,2,Fang Yuan-min1,Wang-Hong2
(1.Faculty of Land Resources Engineering,Kunming University of Science and Technology,Kunming
650093,China;2.Yunnan Provincial Geomatics center,Kunming 650034,China) Abstract:The core of GeographicInformation System is data.Data standardization is the key to
carry out data sharing and also is the necessary condition to promote formation and development of geographic informationindustry;data sharing is the core problem that National Spatial Data Infrastructure Construction needs to be resolved,datastandardization and data sharing are the key technology of Geographic Information System.Key words:GIS;data standardization;data sharing0 前⾔
过去⼏年我国GIS在各种领域得到⼴泛应⽤。⽬前,我国已经建成⼤量的地理信息数据库,这些数据资源分散在各个部门和⾏业中。由于历史和机制的原因,各个部门基于各⾃的部门利益,不愿意对外共享数据;另外,由于不同的⾏业部门采⽤不同的GIS软件,各部门数据采集和管理的⽅法各不相同,同时,各部门在使⽤同⼀商业GIS软件时,⼜做了不同程度的⼆次开发,于是形成了许多独⽴、封闭的系统,对数据的共享造成了很⼤的障碍;再就是不同⽤户提供的数据可能来⾃不同的途径,其数据内容、数据格式和数据质量千差万别,因⽽给数据共享带来了很⼤困难,有时甚⾄会遇到数据格式不能转换或数据格式转换后丢失信息的棘⼿问题,严重地阻碍了数据在各部门和各软件系统中的流动与共享。造成上述现象的原因主要是由于缺乏数据的标准化,以⾄于数据资源难以共享与利⽤,导致重复投资和信息资源浪费。降低采集、处理数据的成本,促进数据的共享,已经成为各界的共识。随着“数字中国”、“数字省区”、“数字城市”的兴起,GIS 正⾛向社会化、⼤众化,并且融于主流的信息技术。国家有关部门正逐步将GIS 嵌⼊到电⼦政务系统中,使之成为信息社会和信息基础设施的重要组成部分。1 数据的标准化1.1 数据标准化的定义
数据标准是指数据的名称、代码、分类编码、数据类型、精度、单位、格式等的标准形式。数据标准的制定对于GIS的发展具有重要意义、但⽬前数据标准的研究仍然落后于GIS的发展。
数据的标准化是在数据应⽤实践中,对重复性事物和概念通过制定、发布和实施标准,达到统⼀,以获得最佳秩序和社会效益。
数据标准化不但是⼀个系统与另⼀个系统实现数据共享的需要,⽽且是在⼀个系统内保持数据的连贯性、持续有效性的需要。GIS数据的标准化直接影响地理信息的共享,⽽地理信息共享⼜直接影响到GIS的经济效益和社会效益。数据共享的实现除了由国家颁布⼀定的法律规范来保障外,最需要的是要有统⼀的数据标准。数据标准的统⼀是实现数据共享的前提条件。在数据标准化建设还不是⼗分成熟的情况下,为了尽可能满⾜数据共享,在数据⽣产和数据库建设过程中应尽量满⾜GIS数据标准化所包含的基本内容。1.2 数据标准化所包含的内容
(1) 统⼀的地理坐标系统:地理坐标系统⼜称数据参考系统或空间坐标系,具有公共地理定位基准是地理空间数据的主要特点。通过投影⽅式、地理坐标、⽹格坐标对数据进⾏定位,可使各种来源的地理信息和数据在统⼀的地理坐标系统上反映出它们的空间位置和四⾄关系特征。统⼀的地理坐标系统是各类地理信息收集、存储、检索、相互配准及进⾏综合分析评价的基础。所以说统⼀的地理坐标系统是保障数据共享的前提。
(2) 统⼀的分类编码:GIS数据必须有明确的分类体系和分类编码。只有将GIS数据按科学的规律进⾏分类和编码,使其有序地存⼊计算机,才能对它们进⾏存储、管理、检索分析、输出和交换等,从⽽实现信息标准化、数据资源共享等应⽤需求,并⼒
求实现数据库的协调性、稳定性、⾼效性。分类过粗会影响将来分析的深度,分类过细则采集⼯作量太⼤,在计算机中的存储量也很⼤。分类编码应遵循科学性、系统性、实⽤性、统⼀性、完整性和可扩充性等原则,既要考虑数据本⾝的属性,⼜要顾及数据之间的相互关系,保证分类代码的稳定性和惟⼀性。
(3) 统⼀通⽤的数据交换格式标准:数据交换格式标准是规定数据交换时采⽤的数据记录格式,主要⽤于不同系统之间的数据交换。⼀个完善的数据交换标准必须能完成两项任务:⼀是能从源系统向⽬标系统实现数据的转换,尽管它们之间在数据模型、数据格式、数据结构和存储结构⽅⾯存在差别;⼆是能按⼀定⽅法转换空间数据,该⽅法要跨越两系统硬件结构之间的不同。GIS软件或数据并不是⼀次性的“消耗品”,也不是⼀个专题系统单独使⽤,⽽是可多次使⽤,相互共享。⼀般属性数据库仅有⼏种固定的数据类型,因此数据转换问题⽐较简单。但是空间数据与之不同,除了起说明作⽤的属性数据外,还有起定位作⽤的空间数据,因此数据共享⽐较复杂。但是总的原则是制定的数据交换格式应尽量简单实⽤,能独⽴于数据提供者和⽤户的数据格式、数据结构及软硬件环境,数据格式应便于修改、扩充和维护,便于同国内外重要的GIS软件数据格式进⾏交换,保证较强的通⽤性。在当前GIS软件数据格式较多的情况下,应制定⼀套稳定的数据交换格式标准,并将国家的基础空间数据⾯向成这⼀标准,逐步向各⾏业推⼴。
(4) 统⼀的数据采集技术规程:GIS数据库中涉及到多源数据集,它具有数据量⼤、数据种类繁多,空间定位数据和统计调查数据并存的特点。数据随时更新且有共享性、利于数据传输、交换等需求。根据空间数据库的⽬标和功能,要求数据库全⾯⽽准确地拥有尽可能多的有⽤数据。作业规程中对设备要求、作业步骤、质量控制、数据记录格式、数据库管理及产品验收都应作详细规定。所采集的数据应具有权威性、科学性和现势性的特点。(5) 统⼀的数据质量标准
①数据质量标准:GIS数据质量标准是⽣产、使⽤和评价数据的依据,数据质量是数据整体性能的综合体现,对数据⽣产者和⽤户来说都是⼀个⾮常重要的参考因⼦,它可以使数据⽣产者正确描述他们的数据集符合⽣产规范的程度,也是⽤户决定数据集是否符合他们应⽤⽬的的依据。其内容包括:执⾏何规范及作业细则;数据情况说明;位置精度或精度评定;属性精度;时间精度;逻辑⼀致性;数据完整性;表达形式的合理性等。
②数据质量控制:由于⽣产部门数字化作业⼈员⽔平、数据⽣产所采⽤的各种数据源(地形图、各种遥感影像等)、航摄及解析仪器、数字化设备的精度不同,最终导致对GIS数据的精度和质量差异。另外,对地理特征的识别质量与作业⼈员的专业训练也有很⼤的关系。为了提⾼GIS数据的质量,需要对GIS数据质量进⾏控制。其内容包括:完整的技术⽅案;优化的⼯艺流程;严密的⽣产组织管理;各环节的质量评价及过程控制等。
(6) 统⼀的元数据标准:随着GIS数据共享的⽇益普遍,管理和访问⼤型数据集正成为数据⽣产者和⽤户⾯临的突出问题。数据⽣产者需要有效的数据管理、维护和发布办法,⽤户需要找到快捷、全⾯和有效的⽅法,以便发现、访问、获取和使⽤现势性强、精度⾼、易于管理和易于访问的GIS数据。在这种情况下,数据的内容、质量、状况等元数据信息变得更加重要,成为数据资源有效管理和应⽤的重要⼿段。数据⽣产者和⽤户都已认识到元数据的重要价值。其内容包括:基本识别信息;空间数据组织信息;空间参考信息;实体和属性信息;数据质量信息;数据来源信息;其他参考信息。1.3 数据的标准化所⾯临的问题
⾸先,GIS数据的标准化仍受到传统地理学习惯的制约,存在专业定义与描述上的相悖,例如⼟壤分类、地貌分类、森林分类、⼟地利⽤分类等等,分类问题未形成兼顾交叉学科的标准体系,则制定数据标准也失去了基础。其次,GIS 数据⾯临的另⼀个重要问题是数据模型的不标准化。⽬前市场上流⾏的GIS商业软件数据模型是不统⼀的,例如ArcGIS,MapInfo,MapGIS以及GeoStar等。2 数据共享2.1 数据共享的定义
数据共享就是让不同⾏业、不同部门在不同地⽅使⽤不同计算机、不同软件的⽤户能够读取他⼈数据并进⾏各种操作运算和分析。数据共享的程度反映了⼀个地区、⼀个国家的信息发展⽔平,数据共享程度越⾼,信息发展⽔平越⾼。2.2 数据共享的解决⽅案
数据共享是现代信息社会的⼀个最基本的特点,是国家空间数据基础设施(National Spatial Data Infrastructure,简称NSDI)建设需要解决的核⼼问题,除了和⾏政协调⽅⾯需要解决的问题外,技术层⾯的共享上仍有⼤量的难题需要解决。但是由于不同的GIS软硬件平台、数据格式、数据标准、参考系统、数据的组织⽅法及学术、经济和⽴法的障碍等因素,实现数据的共享并⾮易事。尽管如此,⽬前还是有多种⽅法可以解决⼀般的数据共享问题,其中最简单的⽅法是通过数据转换技术来实现数据的共享,即不同的部门分别建⽴不同的系统,当要进⾏数据集成或综合应⽤时,先将数据进⾏格式转换转为本系统的内部数据格式再进⾏应⽤。但是这种数据共享⽅法是低级的,它是间接的延时共享,不是直接的实时共享。建⽴国家空间数据基础设施以及“数字中国”应该追求直接的实时的数据共享,就是说⽤户可以任意调⼊国家空间数据基础设施各系统的数据,进⾏查询和分析,实现不同数据类型、不同系统之间的互操作。
⽬前,实现GIS数据共享⼤体上有三种⽅案:数据格式转换⽅案、数据直接访问⽅案和数据互操作⽅案。
(1) 数据格式转换:数据格式转换就是通过设计数据转换⼯具,将⼀种格式的数据转换为另外的⼀种格式。这种数据共享的实现
⽅式⼜可分为两种情况:
①通过数据转换器转换:转换器是⼀个内部数据模型,通过对输⼊数据类型及值按照转换规则进⾏转换,得到指定的数据模型及值(如图1)。这种转换发⽣在两个数据⽂件之间,系统之间的数据转换是单向的,即转换后的数据b可能不能在系统A中使⽤。例如ArcGIS软件中的ArcToolbox模块,它的数据转换功能就是应⽤数据转换器⽅式转换数据格式。
图1通过数据转换器转换
②基于空间数据转换标准转换:采⽤空间数据的转换标准来实现GIS数据的转换,转换标准是⼀个⼤家都遵守,并且很全⾯的⼀系列规则。通过这个中间桥梁,将所有不同系统中的数据转换成统⼀的标准格式,供其它系统调⽤(如图2)。空间数据的转换标准必须能够表⽰现实世界实体的⼀系列属性和关系,同时它必须提供转换机制,以保证对这些属性和关系的描述结构不会改变,并能被接收者正确地调⽤。系统A 系统B 系统…空间数据转换标准系统1 系统2 系统…
图2 基于空间数据转换标准转换
数据格式转换是传统GIS实现数据共享的主要⽅法,通过专门的数据转换程序把其他数据格式进⾏格式转换,复制到当前系统的数据库或⽂件中。当前由主要GIS软件⼚商和组织提出并得到公认的空间数据转换格式有:ESRI的E00、AutoDESK的DXF等。这些格式各有特⾊,但由于缺乏对空间对象统⼀的描述⽅法,从⽽使得不同数据格式描述空间对象时采⽤的数据模型不同,因⽽转换后不能完全准确地表达源数据的信息,导致转换中源数据的信息有部分丢失。
(2) 数据直接访问:直接数据访问是指在⼀个GIS软件中实现对其他软件数据格式的直接访问,⽤户可以使⽤单个GIS软件存取多种数据格式。直接数据访问不仅避免了繁琐的数据转换,⽽且在⼀个GIS软件中访问某个软件的数据格式不要求⽤户拥有该数据格式的宿主软件,更不需要该软件运⾏。直接数据访问提供了⼀种更为经济实⽤的多源数据共享模式。
直接数据访问同样要建⽴在对要访问的数据格式的充分了解的基础上,如果要访问的数据格式不公开,就⾮破译该格式不可,还要保证破译完全正确,这样才能真正与该格式的宿主软件实现数据共享。如果宿主软件数据格式发⽣变化,各数据集成软件不得不重新研究该宿主软件数据格式,提供升级版本,⽽宿主软件的数据格式发⽣变化时往往不对外声明,这样其他数据集成软件对基于这种GIS软件数据格式的数据处理必定存在滞后性。⽬前ESRI的ArcGIS软件已能通过数据直接访问⽅式调⽤多种数据格式。
(3) 数据互操作:互操作是指异构环境下两个或两个以上的实体,尽管它们实现的语⾔、执⾏的环境和基于的模型不同,但它们可以相互通讯和协作,以完成某⼀特定任务。这些实体包括应⽤程序、对象、系统运⾏环境等。互操作是⼀个信息系统的各构件的⾃由的组合及匹配,⽽不是全⾯成功的折中⽅案。
数据转换⽅法仅仅是从数据⾓度考虑互操作,是数据的集成,⽽没有考虑数据处理⽅⾯。因此还不能达到真正的互操作。GIS互操作是在异构数据库和分布计算下出现的。对系统⽽⾔,系统能彼此更安全地获取和处理对⽅的消息;对⽤户⽽⾔,⽤户能⽅便地查询到所需的信息,并能⽅便地使⽤各种不同类型和格式的数据;对信息管理者来说,他们能很好地管理信息,为⽤户服务,并将资源充分地提供给⽤户。
数据互操作是⾃由交换信息,以及协作运⾏地理信息处理软件。为了实现数据的互操作,便通过共同接⼝来实现。接⼝相当于⼀种规程(互操作协议,它的功能类似于⽹络协议,是对地学数据处理的相互响应的协议),它是⼤家都遵守并达成统⼀的标准。在接⼝中不仅要考虑数据格式、数据处理,还要提供对数据处理应采⽤的协议,各个系统通过公共的接⼝相互联系,⽽且允许各⾃系统内部数据结构和数据处理可互为不同(如图3)。图3 基于公共接⼝的数据互操作(4) 数据互操作与数据转换的⽐较
数据互操作强调将具有不同数据结构和数据格式的软件系统集成在⼀起操作,与数据转换相⽐,互操作不仅考虑数据,还要考虑处理过程,它是在更⾼层次上不同系统之间的相互合作。它不仅是对数据的集成,还是对处理过程的集成。互操作与数据转换的差异如表1所⽰。表1 互操作与数据转换的差异
2.3 OGC 与数据互操作
数据互操作模式是Open GIS Consortium(OGC)制定的规范。OGC 是为了发展开放式地理数据系统、研究地学空间信息标准化以及处理⽅法的⼀个⾮盈利性组织。OGC 为数据互操作制定了统⼀的规范,从⽽使得⼀个系统同时⽀持不同的空间数据格式成为可能。根据OGC 颁布的规范,可以把提供数据源的软件称为数据系统A 公共接⼝ 系统B 公共接⼝ 系统… 公共接⼝ 协议及分布式计算环境系统1 公共接⼝ 系统2 公共接⼝ 系统… 公共接⼝
服务器(Data Servers),把使⽤数据的软件称为数据客户(Data Clients),数据客户使⽤某种数据的过程就是发出数据请求,由数据服务器提供服务的过程,其最终⽬的是使数据客户能够读取任意数据服务器提供的空间数据。为实现不同平台间服务器和客户端之间数据请求和服务提供了统⼀的协议。OGC规范正得到⼀些国际标准化组织的承认,从⽽逐渐成为⼀种国际标准,将被越来越多的GIS软件以及研究者所接受和采纳。⽬前,还没有商业化GIS软件完全⽀持这⼀规范。
数据互操作为多源数据集成提供了崭新的思路和规范,它将GIS带⼊了Open GIS时代,从⽽为空间数据集中式管理、分布式存储与共享提供了操作的依据。OGC标准将计算机软件领域的⾮空间数据处理标准成功地应⽤到空间数据上,但是它更多地采⽤了Open GIS协议的空间数据服务软件和空间数据客户软件,对于那些已经存在的⼤量⾮Open GIS标准的空间数据格式的处理办法还缺乏标准的规范。从⽬前来看,⾮Open GIS标准的空间数据格式仍然占据已有数据的主体,⽽且⾮Open GIS标准的GIS软件仍在产⽣⼤量⾮Open GIS标准的空间数据,如何继续使⽤这些GIS软件和共享这些空间数据成为Open GIS标准不可解决的问题。
数据互操作规范为多源数据集成带来了新的模式,但这⼀模式在应⽤中存在⼀定局限性:⾸先,为真正实现各种格式数据之间的互操作,需要每种格式的宿主软件都按照统⼀的规范实现数据访问接⼝,在⼀定时期内还不现实;其次,⼀个软件访问其他软件的数据格式时是通过数据服务器实现的,这个数据服务器实际上就是被访问数据格式的宿主软件,也就是说,⽤户必须同时拥有这两个GIS 软件,并且同时运⾏,才能完成数据互操作过程。最后,即使以后新建的GIS 软件都⽀持Open GIS,现有的GIS软件⽣产出来的空间数据也要转化到Open GIS 标准2.4 数据共享存在的问题
GIS数据共享有三个基本要求:⼀是GIS数据所表达的地理信息正确;⼆是⽤户⽆歧义、⽆错误的接收并正确使⽤信息;三是要保障数据供需双⽅的权⼒不受侵害。⽬前,由于缺乏数据标准,数据共享存在的主要问题如下:(1)语义共享问题(语义:也叫词义,指词语的意义)。要保持在GIS数据共享过程中语义稳定性和⼀致性。
(2)数据质量不稳定。包括:①数据⽣产的质量控制,例如空间数据的位置精度控制和⾮空间属性的编码以及录⼊的正确性;②数据质量评价⽅法的稳定性和⼀致性。
(3)数据库设计不规范。包括数据模型设计、数据库结构及功能设计、数据建库的⼯艺流程设计⽅⾯的标准化问题。(4)标准化数据档案问题。包括:①描述GIS数据库开发及GIS数据共享活动的各种⽂档性资料的标准化;②对所⽣产或共享的GIS数据集的描述⽂档的标准化。
(5)数据格式不⼀致。包括:①不同GIS系统之间数据格式转换问题;
②通⽤数据交换标准出现后,由于这种标准太多,增加了⽤户选择的难度及GIS 软件系统开发的开销,反⽽使标准不标准了。(6)数据的可视化问题。包括:①⽤于GIS的制图符号的标准化和标准制图符号库的开发;②研究⾮制图符号的GIS可视化(图⽚符号、声⾳符号等)。
(7)缺乏GIS软件产品及数据产品测评⼿段及规范。由于缺乏相应的标准及⼀套规范化的⼯艺流程,因此使现在实际的测评⼯作具有较浓重的实验⾊彩,在这⽅⾯仍然存在着⼤量急待解决的问题。3 实现数据的标准化和数据共享的现实意义
数据的标准化能使各部门的数据基于统⼀的地理框架或标准,便于管理和使⽤,并保持数据的⼀致性;数据共享可以使更多的部门能使⽤⾮⼰有的数据和更加充分、有效地利⽤已有的数据,减少重复劳动和数据采集的费⽤;可减少数据的维护和管理费⽤;使GIS系统更容易集成;能够使GIS开发的重点集中在开发新的应⽤上。4 结束语
数据的标准化是实现数据共享的关键问题之⼀,也是促进地理信息产业形成和发展的必要条件。数据的标准化和数据共享是当前空间信息研究领域的⼀个重要研究⽅向。随着空间信息技术和⽹络技术的发展,⼈们对空间信息及其服务有了更⾼的需求,提出了诸如“数字地球”、全球空间数据基础设施、国家空间数据基础设施等⼤型应⽤需求。这些⼤型应⽤项⽬能否成功实现,数据的标准化和数据共享是必须要⾸先解决的问题。参考⽂献:
[1] 中国GIS协会标准化与质量控制专业委员会.GIS标准化综述.地理信息世界,2004,(5):11-15
[2] 李新通,何建邦.GIS互操作与OGC规范.地理信息世界,2003,(5):23-28[3] 杨正华.城市GIS空间数据共享初探.测绘通报,2003,(5):55-57
[4] 胡诚,陈⽅林,刘俊亮.空间数据共享与互操作技术探讨.现代测绘,2003,(12):31-33[5] 李琦,曾澜,苗前军等编著.空间信息基础设施与互操作.北京:科学出版社,2003年7⽉[6] 陈常松著.地理信息共享的理论与研究.北京:科学出版社,2003年1⽉[7] 李满春,任建武,陈刚等著.GIS设计与实现.北京:科学出版社,2003年8⽉
[8] 毕硕本,王桥,徐秀华著.地理信息系统软件⼯程的原理与⽅法.北京:科学出版社,2003年7⽉[9] 龚健雅,杜道⽣,李清泉等著.当代地理信息技术.北京:科学出版社,2004年7⽉[10] 龚建雅著.地理信息系统基础.北京:科学出版社,2001年2⽉
[11] 吴信才著.地理信息系统原理与⽅法.北京:电⼦⼯业出版社,2002年3⽉[12] 冯学智,都⾦康著.数字地球导论.北京:商务印书馆,2004年5⽉
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- shangjiatang.cn 版权所有 湘ICP备2022005869号-4
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务