美章网 资料文库 数据仓库模型下的水文数据挖掘范文

数据仓库模型下的水文数据挖掘范文

本站小编为你精心准备了数据仓库模型下的水文数据挖掘参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

数据仓库模型下的水文数据挖掘

摘要:以水文决策和服务社会需求为导向,运用数据仓库技术,构建面向主题的水文数据仓库结构模型,并对其结构、功能、逻辑模型和数据分析等进行设计,挖掘水文数据在经济社会中运用的价值和实现。

关键词:数据仓库;水文数据;逻辑模型;价值挖掘

水文数据在水利行业数据中占有重要位置,它通过水文测验收集各种水文要素的原始记录,经过统一的标准和规格,整理成简明、系统的水文数据及数据库。新世纪以来,水文遥感、水文示踪、地理信息系统和云计算等新技术的快速发展,为深入挖掘水文时间、空间变化规律提供了技术可能。借助于神经网络、决策树方法、统计分析方法等,再配合前端数据可视化技术,让我们可以有目的、有组织地去发现水文数据内在的规律和价值,提供面向主题的快速数据分析、预测预报等功能,实现支持决策和服务社会的目标。

1需求分析

水文数据按决策、服务对象和适用范围可分为通用数据库和专用数据库,原始实测数据是基础。通用数据库主要存储历年基本水文数据,如简单加工数据、资料整编后的数据等,为社会各行业和其他用户提供基础服务。专用数据库主要存储实时数据、二次加工处理和分析计算数据,为政府、水利专业和特定用户提供服务,如水文情报预报专用库、工程水文计算专用库等。水文原始实测数据本身难以满足复杂多样的水文决策和服务需求,需要充分利用数据挖掘技术对水文数据进行分析和发现,提取出在水资源管理、防灾减灾等经济社会科学发展方面有用的信息。

1.1洪水周期性

洪水由自然和人为因素共同作用形成,洪灾是我国发生频率高、危害范围广、对国民经济影响最为严重的自然灾害,亦是威胁人类生存的十大自然灾害之一。以贵州省遵义市为例:2015年汛期共出现暴雨过程18次,造成12个县(市、区)77个乡(镇)遭受不同程度的洪涝灾害,受灾人口12.6656万人,损坏房屋226间,农作物受灾面积8.471万亩,直接经济损失12888.305万元。面对洪灾造成的巨大损失,只有了解洪水、掌握洪水、利用洪水,才能把损失降到最低。通过对洪水周期性的研究,从水文序列数据中找出洪水重复出现的概率和路径,进而对洪水进行预测预报预防。

1.2水文相似性

水文相似性是指找出与给定序列最接近的其它水文序列。找出与给定序列相似的所有数据序列称为子序列匹配,找出彼此间相似的序列称为整体序列匹配。查找水文序列相似性就是要在水文序列中,找出各类相似的子序列。可用于洪水过程预测、环境演变分析、水文过程规律分析等方面,最为直接的支持决策应用,如:防汛指挥中“当前洪水相当于历史上哪一次洪水?”。

2水文数据仓库模型设计

2.1总体结构

水文数据主要表现为水文时间序列,水文数据仓库由水文时间序列元数据集合而成,按对象的主题要求形成水文基本数据层,随时间变化转为历史数据,通过对历史水文数据集合进行分析,建立单一或者一组模型,由所建立的模型对新数据集合的可能行为做出预测预报。水文数据仓库模型设计采用三层结构体系,由仓库数据库服务器、OLAP服务器和前端客户层组成。

2.2逻辑模型

基于星形模式组织的多维数据模型适用于面向预测预报的水文数据模型,水文数据仓库包含1个事实表(即一个大的中心表)和5个维表(即附属表)。事实表中包含时间、行政区划、流域、河流、地理信息5个维表和降雨量、水位、流量、水温、含沙量等属性。其中,每个维表包含1组由底层映射到一般高层的属性概念,如行政区划维表由属性省、市、县形成一种层次,即:省-市-县;地理信息维表由属性地形、地貌、地质形成一种层次,即:地形—地貌—地质。水文数据仓库星形逻辑模型如图2所示。建立逻辑模型后,其中的水文数据是随着时间变量动态变化的,降水量、水位、流量、水温等会有不同的变化,实际操作中,可根据不同预测预报模型的应用需求,采取不同的数据分析方式。若对河道来水量进行预报,就要重点考虑水位、流量等属性在空间维度上的变化情况,以及河流上游、下游一定距离间的水位、流量相关关系,建立对应函数关系。若做中长期水文预报,就要对各水文测站的历史数据在多层次的时间维度上,根据所建立的回归分析函数,选择合适的预报因子进行分析。若对降雨径流过程进行预报,就需要对流域的全面属性,如降雨、径流量、地理信息等在时间维度和属性维度上进行多维立体分析,得到模型对应函数关系,确定计算参数,进行计算和验证。

2.3创建数据仓库

2.3.1元数据库

在水文数据仓库中,定义仓库对象的水文监测数据就是元数据。在水文时间、空间信息中用于描述水文数据集的内容、质量、表示方式、空间参考、管理方式以及数据集的其他特征。由目录信息和详细信息两个层组成。

2.3.2创建水文数据仓库

数据库水文数据仓库数据库可以在关系数据库中按照通用的建立数据库的方法进行创建。把水文数据仓库数据库中设计的表创建好,数据类型依据原始数据库中的各个表和字段的数据类型设置。将从业务系统或外部系统中获得的数据,转换和清洗成数据仓库需要的格式和形态,并在规定的时间内装入数据仓库。

2.4水文数据分析

水文数据通过联机分析处理可以用不同的格式组织和提供数据,以满足水文数据分析的需求。基于多维数据模型,通过分析对象主题来对数据进行组织,并根据需求添加不同的数据集市的数据。其结果可以作为简单数据挖掘的结果,也可以作为深度数据挖掘需要的预处理数据集合。

3结语

由于水文数据量大,影响预测的因素多,相比传统的水文预测方法,数据挖掘技术可以智能地从大量的、不完全的、有噪声的、模糊的数据中提取出有用信息,建立起误差小、精度高的水文预测模型。利用数据仓库从历史数据中挖掘水文现象所隐含的价值,完全可以满足水文决策和服务的需求,但是水文数据仓库模型的应用也需要我们在实践中反复的试验和验证,根据河流的不同特性,找到符合实际的参数设置,最终得到接近真实的预测预报结果。

参考文献

[1]艾萍,宋海波,冯鹏.一种支持水文信息组织数据仓库的模型[J].信息技术,2013,27(07),27-30.

[2]尹涛,关兴中,万定生.数据挖掘技术在水文数据分析中的应用[J].计算机工程与设计,2012,33(12),4721-4725.

[3]陈德清,王问宇,杨海坤.数据仓库技术在水文数据综合分析中的应用研究[J].水利信息化,2010,18(02),18-21.

作者:何可 单位遵义市水政监察支队