美章网 资料文库 SVM模型对大坝变形分析的影响范文

SVM模型对大坝变形分析的影响范文

本站小编为你精心准备了SVM模型对大坝变形分析的影响参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

SVM模型对大坝变形分析的影响

《科技广场杂志》2015年第二期

1PCA模型

以往采用相关性分析可以提取出重要的影响因子,但却忽略了其他影响因子的影响,而其余影响因子对大坝的变形也会起到一定的作用,经过相关性的分析,可以提取出样本数据中大量的部分有用信息,但是它只是线性的确定大坝位移影响与大坝变形量之间的关系,并没有实现大坝变形影响因子之间相关性的判断。大坝位移影响因子之间的信息会产生重叠,并且阻碍样本在计算机中的训练速度,降低预测的精度,同时还会造成数据的柔余,而利用主成分分析可以对大量的影响因子进行预处理,使得样本变量数据之间不再重叠,同时减少了数据样本的量数,对样本数据的信息又没有丢失,有效地解决了变形影响因子之间多重相关性的问题。将处理后的变量作为svm的输入因子,对其进行训练,利用训练得到的参数再对大坝进行预测,便可得到比较精确的大坝变形预测值,从而实现对大坝变形分析的研究。主成分分析是一种研究多个变量之间关系的多元统计分析方法,通过对整个样本数据的主成分分析,提取少数几个主成分量,从而达到降维的目的,又完整的保留了原始的样本变量的信息,而且样本彼此之间不存在任何相关性,实现了样本数据的简化。根据式(3)便可获得输入因子的所有主分量,在选择因子特征过程中,会选择主要特征的因子,而舍弃无关的因子,从而实现降维的目的。当方差贡献率φ(p)足够大时,便可将前P的特征向量V1,V2,…,VP构成的空间作为维度较低的投影空间,从而完成降低维数的处理。

2PCA-SVM模型

2.1SVM模型参数的选取利用PCA对主变量提取完后,需要将主变量输入到SVM模型中,而模型参数的确定对预测精度有很大的影响[7],其中包括嵌入维数m、时间延迟τ、惩罚因子C、损失函数参数ε等。(1)对于嵌入维数m,其决定了是否重构非线性系统的相空间,其取值范围为3~20。(2)对于时间延迟τ,为了平衡柔余误差,其一般取值范围为1~15。(3)损失函数参数ε,该参数控制着回归结果误差的大小,也控制着支持向量的数目和泛化能力,其取值范围一般为0.0001~0.1。(4)惩罚因子C,该因子在确定的特征子空间中调节学习置信范围和经验风险的比例,从而使得学习机器的推广更好。该值的选取取决于噪声的数量。在确定空间中,学习机器的复杂度比较小而经验风险值比较大,如果要使C满足所有条件,需要对训练样本进行分类[8]。一般惩罚因子C与模型正确率的关系如表一所示。

2.2预测模型的计算SVM模型主要是为了解决非线性预测的问题。本文主要是在SVM基本原理的基础上,采用SVM回归方法进行大坝变形分析。而变形预测的目标函数为。训练样本可以在精度ε下用线性函数进行拟合,在考虑拟合误差的情况下,回归估计的问题即转为约束条件下最小化的问题。最小化表示的是凸二次优化问题,引入拉格朗日函数的情况下,可以把一个问题简化为一个二次优化的问题,最大化的二次型即为待求目标函数,其最终表示为。将拉格朗日乘子代入式(10)中,就可以根据预测样本得到大坝的变形预测量。

2.3PCA-SVM模型建立过程利用PCA模型对输入变量进行主成分分析后,便可将其变量输入到SVM模型中,作为SVM模型的输入因子,其PCA-SVM观测模型的计算过程为:(1)对原始的观测数据进行预处理,输入需要练的样本数据作为SVM模型的学习样本数据。(2)根据实际的需要,选择合适的样本观测数据。(3)将样本数据输入到PCA模型中,利用PCA模型对原始的样本因子进行重组。(4)选择适当的SVM模型的惩罚因子、损失函数、核函数及相关参数,进行整个模型的训练,并对样本数据进行拟合。(5)计算SVM模型中输入数据的误差。(6)计算最后输出的精度指标体系,如果精度没有满足要求,则重新转向第四步,重新进行训练样本,优化训练的参数,重新对支持向量机模型进行改进。如果精度能够满足精度要求,则继续第七步。(7)输出所需要的结果并且绘制出预测数据及实际数据或和其他数据进行对比分析。

3实例分析

利用小浪底水利枢纽大坝的坝顶某点在2006—2009年观测的51组数据作为实验样本数据,本文首先对一样进行分解,需要先定义训练集、确认集和测试集。选择不同的正则化参数和核参数。利用训练集进行训练,利用确认样本对训练好的SVM模型进行验证,提取误差最小的SVM模型,最后通过测试的样本进行测试。大坝的变形主要是受温度、扬压力、时效影响,因此,将h,h2,h3,h4,h5,θ,θ2,θ3,θ4,θ5,sinG,cosG,T0(h为上游观测水位值,为当天到起测日之间的总天数除以100,G=2πt/365,t为观测时刻离初始时的天数)作为大坝位移的影响因子,利用主成分对其进行分析,各成分因子的贡献率如表二所示。一般将累积贡献率大于85%的成分作为主成分,代表原始的信息,因此,本文选择前3个主成分作为大坝位移的影响因子,利用前30组样本作为训练样本,后10组样本作为确认样本,最后11组作为测试样本对其进行分析预报,将其预测结果和SVM,BP进行对比分析,训练样本拟合结果如表三所示,确认样本的拟合结果如表四所示。根据表三训练样本及表四确认样本所确定的SVM模型的参数,对预测样本进行预测,并得到预测结果的精度,结果如图一所示。根据图一预测结果的误差,计算总体均方差及平均绝对误差,如图二所示。从图二不同方法的预测精度对比分析可以明显发现,PCA-SVM预测精度明显高于SVM和BP方法,其预测结果的稳定性也最好。因此,经过主成分分析的SVM模型,对大坝变形的预测效果最好。

4结束语

由于支持向量机具有很好的非线性特性和泛化性特征,已经在很多预测领域得到了广泛的应用,而主成分分析是对原始输入样本进行主要变量提取的有效方法,经过主成分分析后,可以对大坝变形的影响因子进行主要分量的提取,并且不会对原始变量的信息产生任何影响。经过主成分分析后提取的主变量,相互变量之间没有任何重叠影响,同时又可以达到降维的目的,使得输入因子的样本变少,减少了数据的柔余,提高了预测效率,将经过主成分分析后的变量输入到支持向量机中,可以实现准确的大坝变形预测。

作者:吴波单位:中国地质科学研究院探矿工艺研究所