美章网 资料文库 地理信息系统数据模型探讨范文

地理信息系统数据模型探讨范文

本站小编为你精心准备了地理信息系统数据模型探讨参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

地理信息系统数据模型探讨

摘要:数据模型是地理信息系统(GIS)的核心。目前,人们提出了许多GIS数据模型,出现很多容易混淆的概念。本文对地理信息系统领域数据模型的基本概念和理论进行梳理、归纳与总结,并对数据模型及一些相关概念进行了比较和分析。对数据建模的概念进行了讨论,分析了其包含的3种含义。对数据模型的3个抽象层次进行了说明和分析,按照不同的划分规则对地理信息系统数据模型进行了分类,并对空间数据模型进行了分析。

关键词:地理信息系统;数据模型;分析;分类

0引言

地理信息系统(GIS)是以计算机技术为基础,对与地理空间位置有关的数据进行采集、存储、管理、分析、应用、输出的技术系统。要发挥GIS的作用,就要对现实世界进行表达和抽象,把它变成计算机能够处理的0和1。以计算机能接受的形式表达、存储地理信息是用计算机做地理信息自动化分析和处理的前提。把客观世界中受关注的事物和现象用数据描述出来,进行数字化表达,就涉及数据建模和数据模型问题[1]。数据模型以及空间数据模型是地理信息系统的理论基础和核心理论,因此,对地理信息系统数据模型的认识和研究在设计GIS和发展GIS系统的过程中起着重要作用。目前,GIS界对于地理信息系统数据模型的概念认识并不统一,分类不明确,出现很多容易混淆的概念,本文对地理信息系统中数据模型相关概念进行了梳理。

1几个数据模型相关概念的辨析

要对现实世界进行研究和分析,就要对现实世界进行科学的认知和表达。表达可采用各种方式,模型是其中一种。表达和模型是有重叠的,表达用于描述概念和事物,而模型则多用在实践和数据库环境下[1]。

1.1模型与模式模型是对现实世界的简化表达或描述,是对现实世界的模拟,是现实世界本质的反映或科学的抽象。模型这个术语因为用在许多不同的学科描述许多不同的事物,所以可以做多种解释。模型不一定都是数字形式的,抽象方法不同就构成了不同的模型,如语言模型、数学模型、实物模型等。在GIS中,模型是经常出现的技术术语,它具有不同的含义,这里主要讨论基于计算机的模型。一幅地图就是一个模型,表示空间要素的矢量和栅格数据模型与表示数据库系统的关系数据库模型也都是模型。模式是事物的标准样式,经过检验有效的模型如果被广泛接受,便成为一个模式。模型与模式这两个概念既有联系又有区别,首先加以必要的区分,然后在不引起混乱的情况下等价的使用。

1.2数据模型———通用数据模型与专用数据模型在数字化表达中,我们通过数据模型、数据结构和规则来形式化各种概念,这些概念和数据模型一起构成了我们的认知。数据模型也是一种模型,它是现实世界数据特征的抽象[2],是用来描述数据的一组概念和定义。它是数据集的特殊结构,例如GIS把空间数据集组织成层的集合,数据库把数据集组织成表的集合。利用数据模型便于一些特性的早期分析,如存储费用、查询能力、冗余、一致性、存储空间要求等,便于在多个应用中共享数据的再使用,跨组织的数据交换,向新软件或环境进行数据转换等。数据模型可分为通用数据模型与专用数据模型,通用数据模型为商业数据处理而开发,支持简单抽象数据类型,不便于特殊领域的应用;专用数据模型为特殊应用领域开发,如空间数据模型开发地理信息科学中的概念集,适于不同GIS应用的共同的空间抽象数据类型。数据库领域主要研究通用数据模型,如关系模型、层次模型、网状模型,其是数据库系统的理论基础。在这里,数据模型是一个严格定义的概念的集合。这些概念精确地描述了系统的静态特性、动态特性和完整性约束条件。因此,数据模型通常由数据结构、数据操作和完整性约束3部分组成[2],这指的是传统意义上的数据库的数据模型,有时简称数据库模型,GIS中讨论空间数据管理时会涉及。随着计算机技术的不断发展,应用领域不断扩展,数据模型的应用领域也在拓展。广义的讲,数据模型是对象的表达和管理方法,是按一定方案建立的数据逻辑组织方式。在GIS领域,数据模型是一条或一组用于标识和表示空间参照对象的规则。它是一个模板,是一个用来存储与地表相关的特定信息的框架,是计算机中描述和表达现实世界的一组结构集合,如栅格数据模型是将地球表面的信息,以属性的方式表示在规则格网单元中。

1.3空间数据模型与地理信息系统数据模型空间数据模型是整个GIS理论中最为核心的内容[3]。空间数据模型是人们对现实世界地理空间实体、现象,以及它们之间相互关系的认识和理解,及其在计算机中的抽象与表达。空间数据模型的目的是提供正式的方法或手段,用来描述和操作空间参照信息,它是一种抽象的和良好定义的概念系统,定义了对地理对象进行描述和推理的术语,也定义其自身的一组概念和关系,这些概念和关系与在一个计算机系统中如何表示地理信息有关。地理信息系统的数据模型与空间数据模型这两个概念有什么区别和联系呢,在GIS领域,广义的空间数据模型就是指地理信息系统的各种数据模型,涉及GIS数据采集、存储、管理、分析、输出各个阶段,以及空间数据表达的各个抽象层次,从地理空间认知模型、数字化表达模型到空间数据管理的数据库模型和空间索引等。狭义的空间数据模型特指地理空间认知和表达的场模型、对象模型以及对应的数字化表达的栅格数据模型和矢量数据模型,和相应实现该模型的空间数据结构和编码等,不同的语境下涵盖的内容不同。

1.4数据模型与数据结构数据模型与数据结构是什么关系呢,数据模型处于数据表达的概念层次,数据结构是数据表达的具体实现,前者是基础,后者是实现[4]。从数据库领域来分析,数据结构是数据模型的组成部分,是所研究的对象类型的集合,是对系统静态特性的描述。数据结构是刻画一个数据模型性质的最重要的方面[2]。从现实世界的地理空间现象或事物到计算机世界,一般也要有概念模型、数据模型、数据结构和文件格式几个层次。这个过程有时统称为地理空间数据建模,在这个过程中,数据模型和文件格式之间需要中间媒介,这个媒介就是数据结构。

1.5空间数据模型与空间数据结构从地理信息系统领域来分析,有空间数据模型和空间数据结构的概念。这里所说的空间数据结构是指适合于计算机系统存储、管理和处理的地学图形的逻辑结构。空间数据模型和空间数据结构研究地理空间数据组织和管理,是关于空间数据建模不同层次的概念。前者是对现实世界的抽象与表达,后者是对前者的一种有效的内部数据表示。空间数据结构是指空间数据模型描述的数据的组织方法、编排方式和相互关系。两者之间的关系,与一般的数据模型和数据结构的关系有相似之处。其一,空间数据模型涉及到空间数据表达的概念层次,而空间数据结构所作的数据组织工作比空间数据模型更底层些,它偏重数据表达的物理实现。比如,对象模型可以采用矢量数据结构将其映射到计算机中,场模型用栅格数据结构来实现,具体又有很多编码方法。其二,同普通数据的数据模型一样,空间数据模型的命名通常与相应的空间数据结构相同,所以很多时候矢量数据模型和矢量数据结构,栅格数据模型和栅格数据结构混用,并不严格区分。这里讨论的数据结构与计算机专业课程“数据结构”是什么关系呢,后者是抽象的、是基础,前者是具体的、是应用,后者为前者提供支撑。

1.6数据模型与数据模式数据模型和数据模式不应混淆,正像不应把程序设计语言和用程序设计语言所写的一段程序混为一谈一样。数据模型是描述数据的方法,数据模式则是用给定数据模型对特定数据集合的描述[5]。也就是说,数据模式是基于选定的数据模型对数据进行的“型”的方面的刻画。另外要注意的是,在进行GIS应用时,利用GIS进行空间建模或地理建模,建立空间模型或地理模型,以进行各种空间分析或表达一系列地理过程,它们都是计算模型,模型的操作在计算机中完成,并以0和1的计算机语言表达。这些模型和数据模型是有区别的,本文不做讨论。

2数据建模的含义

为了利用计算机系统来描述现实世界,并分析和解决其中的问题,必须对现实世界进行建模。建模就是建立模型的意思。由于模型可以有多种解释,所以建立模型也可以有多种解释,可以是建立语言模型、数学模型、实物模型或数字模型等。这里主要是讨论基于计算机的数据建模,它也具有多种含义,可以是建立数据模型、建立数据模式、建立数字模型等。GIS数据建模也就是空间数据建模,从以上论述看,实际上空间数据建模也可以包含多层含义。一种含义是建立空间数据模型。在此理解为,将我们对客观世界中的空间现象和事物的模型化认知,以一定的形式描述出来,以便把数据按照这种形式组织起来,由计算机存储、管理。实际就是进行数据模型的研究,设计、提出新的数据模型,涉及概念数据模型、逻辑数据模型、物理数据模型。一种含义是设计GIS空间数据库模式。这项工作是以空间数据模型的理论为指导,针对所研究的空间现象或问题,以了解用户需求开始,包括概念建模、逻辑建模、物理建模,对应数据库概念设计、逻辑设计、物理设计。这包括定义空间实体及其相互间关系,描述GIS的空间数据组织和数据库结构,设计在计算机中的物理组织、存储路径等,所以可以看作是建立数据模式。还有一种含义是建立数字化模型,就是把现实世界中想要表达的事物或现象,用数据描述出来,并把数据组织为有用,且能反映真实信息的数据集的过程,实际就是把数据按数据模型组织起来的过程,这是很多定义里主要表达的含义。

3数据模型抽象的不同层次

数据模型的抽象要经历从现实世界到人为理解,再从人为理解到计算机实现的过程,也就是数据模型应尽可能反映人对现实世界的认知。但从另一方面来看,数据模型应便于计算机实现,可以采用多级抽象的办法来解决这个问题。根据抽象阶段的不同,数据模型可分为概念数据模型、逻辑数据模型和物理数据模型[6],有时会被简称为概念模型、逻辑模型和物理模型。现在遇到的问题是不同的领域都有这样的层次划分,但各个层次的模型对应的内容会有不同,比如GIS领域与数据库领域。而且即使是相同的领域,不同学者划分的3个层次模型也有不同,有的是讨论GIS的3个抽象层次,或是讨论空间实体抽象的3个层次,还有的是讨论GIS数据模型的3个抽象层次,或是空间数据模型的3个层次。这里面有的是提法不同内容相同,有的是提法相同内容不同,感觉有些混乱。在数据库领域中,概念数据模型面向现实世界、面向用户,用于信息世界的建模,是数据库设计的有力工具,例如E-R模型。逻辑数据模型是用户从数据库所看到的数据模型,通常所指的数据模型就是这类模型。它与数据库管理系统(DBMS)的设计有关,数据库管理系统的分类一般按照其所用的逻辑数据模型。关系数据模型是目前最常用的逻辑数据模型,物理数据模型反映数据的存储结构,如物理块、索引等,物理数据模型不但与DBMS有关,还与操作系统和硬件有关。在GIS中有一种观点,当利用计算机对现实世界进行表达时,分别采用4种不同的抽象层次来观察现实世界[1]。首先,现实世界是各种事物组成的;其次,概念模型是面向人类认知的模型,建模对象是与某个特定领域相关的对象和过程;第三,逻辑模型是一种能够实现的关于现实世界的表达,通常是以图表和目录的形式存在;最后,物理模型描绘了GIS中实际使用的模型,通常由存储在文件或数据库中的数据表组成。从上面的描述可以看出,从GIS的角度和从数据库的角度都有这样的层次划分,但各层次对应的内容有不同,实际上这是两个概念体系。在计算机中对具有持久性的数据进行存储和管理,有两种基本方式,文件方式和数据库方式。空间数据管理如果用数据库方式管理时,就是要研究怎么“调和”这两个概念体系。如果从地理表达,到空间数据表达、空间数据的数据库管理以及空间数据在硬件上的存储方式和存取方法,这一GIS的数据抽象过程来分析,我们认为,GIS数据模型可由概念模型、概念数据模型、逻辑数据模型和物理数据模型多个有机联系的层次组成。概念模型这个层次讨论的模型是面向人类认知的模型,用不同的方法或从不同的角度对地理空间进行认知和抽象,可能产生不同的地理空间认知模型[7],所以很多时候这个层次的模型就称为是概念模型。在GIS中,概念模型层可分为基于场的模型和基于对象的模型。对应的这些概念模型又可采用不同的模型进行数字化表达,就形成了概念数据模型,如这两种模型通常分别用栅格和矢量数据模型来实现。逻辑数据模型是GIS描述概念数据模型中实体及其关系的逻辑结构,主要指空间数据用数据库方式管理时采用的数据模型,如对象关系数据模型。物理数据模型则是描述数据在计算机中的存储路径、物理组织,即在物理磁盘上如何存放和存取。

4地理信息系统数据模型分类

要把客观事物抽象成计算机可以表示的形式就涉及数据模型问题,但由于现实世界纷繁复杂、千变万化,地理事物和现象也有其复杂性,用一种数据模型反映现实世界的所有方面是不可能的。而且,对于同样的地理现象,不同的用户基于不同的应用需求,会设计出不同的数据模型,所以在GIS领域存在种类繁多的数据模型。数据模型大体有两种类型。一种是通用的数据模型,支持简单抽象数据类型,如numbers,strings,date,不适合空间抽象数据类型,如polygons,要支持空间数据需用空间概念来扩展,这类模型为便于计算机上实现,有严格的形式化定义,也就是前面讨论的逻辑数据模型,如当前主流的关系数据模型等。另一种是特殊应用领域的数据模型,如空间数据模型。空间数据模型指的是空间数据从源域到目标域的映射方式,而通用的数据模型(如关系数据模型)指的是映射到目标域的数据以哪种结构进行组织[8]。采用空间数据模型的做法是从数据建模所涉及的空间领域本质的概念角度来说明的。传统的数据建模方法是从数据库设计的角度来说明的[9],空间数据库研究的一个主要目标是“调和”这两个概念体系。地理空间认知模型可以分为对象模型、场模型和网络模型等,连续场和离散对象定义了两种看待地理现象的观点,但还没有解决其数字化表达的问题。栅格和矢量是计算机用以表达地理数据的两种方法。理论上,这两种方法都可以用于进行场和离散对象的编码,但是,在实际操作中,一般用栅格表示场,用矢量表示离散对象,形成了栅格数据模型、矢量数据模型。这两种模型各有优缺点,有学者进行了矢量栅格一体化模型的研究[10]。按空间数据的管理方式有:混合数据模型,它用文件系统管理几何图形数据,利用关系数据库管理系统来管理属性数据;全关系数据模型,其图形和属性数据都用关系数据库管理系统进行管理,图形数据要么按关系数据模型进行组织,或利用二进制大对象字段实现存储与管理;对象关系数据模型,把面向对象技术与关系数据模型相结合,提供对空间数据类型、空间数据函数和空间索引等的支持;面向对象数据模型支持变长记录,支持对象的嵌套、信息的继承和聚集,可以将所有空间地物以对象的形式封装,可以用一系列简单对象构成复杂对象,但还不成熟。

5结束语

数据模型作为GIS的理论基础和核心,其理论、方法和技术的研究已经取得了很多成果,推动了GIS的发展。但也还存在一些问题,如地理空间认知、复杂空间对象的表达能力、动态多维地理现象的建模等都需进一步完善和提高。随着计算机硬件和软件技术的不断进步,GIS应用层次不断深入,GIS对空间数据模型提出了更高的要求,空间数据模型的设计越来越复杂。但要认清一点,任何一个问题都可以用多种不同的数据模型来表达,解决某问题最优的数据模型,可能对于其他问题而言则是次优的。

参考文献

[2]萨师煊,王珊.数据库系统概论[M].第三版.北京:高等教育出版社,2000.

作者:张山山1;2 单位:1.中南大学地球科学与信息物理学院,2.中南大学有色金属成矿预测教育部重点实验室