美章网 资料文库 油井技术数据库的建构与运用范文

油井技术数据库的建构与运用范文

本站小编为你精心准备了油井技术数据库的建构与运用参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

油井技术数据库的建构与运用

引言

随着石油工业的发展和信息科学的进步,钻井信息的应用越来越显示出它的重要性。钻井数据资源的管理和应用是否有效,直接影响到钻井的效果和效益。随着钻井工艺技术的复杂多样、钻井数量的急剧增加、以及先进测量仪器和手段的引入,钻井数据资源海量增加,加强对这些数据资源的存储、管理和应用,提高钻井信息化建设的水平已成为一项紧迫而又艰巨的任务。数据仓库是一种信息系统的数据存储理论,它强调利用某些特殊数据存储方式,让所包含的数据,特别有利于分析处理,以产生有价值的信息并依此作决策。

1数据库理论

1.1数据仓库

数据仓库对多个分布式的数据库提供统一管理,是支持管理决策过程、面向主题的、集成的、相对稳定的、随时间变化的数据集合。它从多个传统数据库中获取原始数据,先按决策的主题形成当前基础数据,再按综合决策要求形成综合数据,通过数据仓库访问工具向用户提供统一、集成的信息环境,为决策者提供完整、及时而准确的决策信息。数据仓库的四个主要特性:

(1)面向主题(Subject-Oriented)

有别于一般OLTP(联机事务处理,on-linetransactionprocessing)系统,数据仓库的数据模型设计,着重将数据按其意义归类至相同的主题区(subjectarea),因此称为主题导向。

(2)集成性(Integrated)

数据来自企业各OLTP系统,在数据仓库中是集成且一致的。

(3)随时间变化(Time-Variant)

数据的变动,在数据仓库中是能够被记录以及追踪变化的,能反映出随着时间变化的数据轨迹。

(4)相对稳定性(Nonvolatile)

数据一旦确认写入后是不会被取代或删除的,即使数据是错误的亦同。(i.e.错误的后续修正,便可因上述时间差异性的特性而被追踪)。

1.2数据挖掘(DataMining)

数据挖掘是从海量数据中,提取隐含在其中的、人们事先不知道的但又可能有用的信息和知识的过程。数据挖掘的数据有多种来源,包括数据仓库、数据库或其他数据源。所有的数据都需要再次进行选择,具体的选择方式与任务相关。挖掘的结果需要进行评价才能最终成为有用的信息,按照评价结果的不同,数据可能需要反馈到不同的阶段,重新进行分析计算。

数据挖掘分为描述性和预测性两类。描述性数据挖掘提供数据的一般规律;预测性数据挖掘产生关于数据的预测。数据仓库与数据挖掘的关系如图1所示。

2应用现状

2.1国外应用现状

国外钻井服务商早在20世纪80年代开始就将信息技术应用到生产指挥中,取得了巨大经济效益。到90年代,开始研究建立集钻井数据采集、数据信息传输、钻井数据库、钻井工程设计、钻井施工监测和钻井生产指挥为一体的钻井信息系统,作用是钻井参数自动采集,生产信息及时送入现场计算机,通过通讯网络实时传送到总部信息中心,经过专家会诊做出决策,反馈到钻井现场进行实时监督,指挥钻井生产。下面以Schlumberger公司的产品为例,介绍一下国外的应用现状。

生产数据监测和数据分析软件,包含了基于数据挖掘的生产优化软件,以及桌面数据挖掘和数据驱动模型。

ProSource是斯伦贝谢新的信息管理应用软件,提供信息管理工作流程,具有利用一个易于使用的单一控制台从多个数据仓库浏览、创建、编辑和删除数据的能力,它能够在ArcSDE中创建并管理空间索引,用于对多个内容来源的信息进行直观聚合和管理。

DrillDB可以简化数据挖掘任务,支持决策过程并能访问正在进行的钻井作业的数字信息。Drill-DB支持SISDrillingOffice以及其它流行的钻井信息采集系统,可以集成多个钻井信息系统,使建立公司统一的钻井信息解决方案成为现实。

2.2国内应用现状

目前,国内还没有完整的或在用数据仓库,也还没有成型的数据挖掘软件,因此从期刊发表的情况来说明。表1数据来自《中国学术文献网络出版总库》关键词查询。

3面向钻井工程的数据仓库应用

3.1主题设计

数据仓库是面向主题的,因此数据仓库设计的第一步就是确定其主题。主题是在较高层次上将数据归类的标准,通常反映决策者最关心的问题。根据钻井决策的实际需求,主题设计如表2所示。

3.3钻井数据ETL

数据抽取Extraction:建立钻井数据规则化过滤器,去除潜在的不符合实际的错误数据。通过审计规则来确保数据的有效性。

①数据转换Transformation

通过建立钻井数据间的映射和转换关系,使源数据能够适应新的逻辑模型,统一转换后的数据名称和定义。

②数据加载Loading实时加载、快速加载。

3.4钻井数据统计分析

数据统计分析方法如表4所示。

3.5钻井数据多维分析处理

维是将一类数据组织到具有明细数据级别的分层结构中的字段。包含OLAP数据的数据结构,按维和数据字段进行组织,则称为多维数据集。多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。例如钻头喷嘴数据结构,它可以逐级提供越来越详细的数据,形成井、井眼、钻头、喷嘴四个级别,既可以高层汇总又可以关注明细。多维数据查询流程如图2所示。

在对多维数据的统计分析中,传统的SQL查询语言显露了其局限性。一般的SQL语句查询方式,虽然也可以通过GroupBy来进行分组统计,但如果要对多维数据进行处理,形成一个既有小计又用总采用数据透视技术无疑是非常恰当的解决方案。

3.6钻井数据挖掘模型

①神经网络(Hopfield网络、Kohonen网络、BP网络、ART1网络、RBF网络、贝叶斯网络)模拟人脑神经元结构,建立三大神经网络模型即自馈式、反馈式、自组织。神经网络的知识体现在网络连接的权值上,属分布式矩阵结构。通过神经网络的逐步计算来实现KDD的价值。

②遗传算法

模拟生物进化过程,由三个“算子”组成,选择:从旧种群父代选出生命力强的个体,产生新种群后代。交叉:选择两个不同个体(如染色体)的一部分(如基因)交换,形成新个体。变异:对个体的某些基因进行变化(如1变0,0变1)。遗传算法的根本是产生优良的后代。应用于数据挖掘中,是在庞大的数据库中对知识的发现。目前已取得了显著的成效。

③可视化法

把数据库中的数据转化为可视的各种图形,对揭示庞大数据的状况、规律性等作用极大,使用户对数据“看”得更清晰、直观。大大拓宽了图表、文字的功能。

④决策树

将数据库中可能具有最大信息量的“字段”作为决策树的身躯,然后根据不同的“字段”建成树的分支,由此可建立决策树。决策树方法中尤以方法应用效果良好。

⑤关联规则:经典关联规则、序列模式、单维关联规则、多维关联规则。

⑥模糊聚类

根据模糊是客观存在的,形成了一整套模糊理论。数据挖掘就能利用此理论对实际问题以模糊研讨,直至达到模糊决策。

⑦粗糙集

⑧支持向量机

⑨孤立点分析

根据“数据挖掘”的上述方法可以对应得到数据挖掘的工具如神经网络工具、可视化工具、“模糊发现”工具、决策树工具等。实践证明,这些工具适用于大规模数据挖掘系统和开发环境,也适用于最终用户和开发人员的数据挖掘系统。面向钻井工程的数据仓库与数据挖掘应用过程如图3所示。

4结束语

因此,面向钻井工程技术的数据仓库与数据挖掘系统对实现远程、智能化的现场作业过程监控和信息化网络办公;提高钻井工程技术人员的工作效率和技术决策水平;最终提高钻井作业质量和经济效益、提高企业的工程技术管理水平,增强企业在国内外市场中的生存能力和竞争能力等,都具有十分重要的现实意义和应用价值。