本站小编为你精心准备了随机森林的燃气轮机故障检测方法研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
摘要:本文提出一种通过随机森林算法训练组合分类器,对燃气轮机进行故障检测诊断的方法,以提升故障检测的精度,避免过拟合现象,保障燃气轮机稳定安全运行。
关键词:燃气轮机;故障检测;随机森林
引言
燃气轮机作为新型的动力能源设备,具有热效率较高、运行安全可靠、污染较低等优点[1]。但燃气轮机结构复杂,一旦出现故障就会给电厂带来严重影响。因此避免或及时诊断处理燃气轮机运行故障尤为重要。燃气轮机状态监控和故障诊断可以大大提高机组运行的可靠性和安全性[3],大幅降低燃气轮机维护和维修成本。分类是故障诊断中的一个重要思路,近年来,燃气轮机的故障诊断也开始运用分类,但仍存在对单一分类器诊断精度不高,过拟合等问题。本文提出运用随机森林算法建立组合分类器,提升故障诊断精度,避免过拟合,同时拥有更好的泛化能力。
1基于Autoencoder的故障特征
压缩由于燃气轮机部件繁多,在故障检测阶段需逐一排查,自编码网络通过学习发现并去掉诊断数据中的冗余信息。Autoencoder是一个恒等函数,如图1所示。Antoen-coder的中间“隐藏层”,通过对输入向量的良好表示,起到了压缩降维的作用。假设固定样本集{(x(1),y(1)),...(x(m),y(m))}有m个样例,对于单个样例(x,y),其代价函数为:针对参数W和b来求其函数J(W,b)的最小值。对于梯度下降法都按照如下公式对参数W和b进行更新:
2决策树与随机森林原理
随机森林的基分类器为决策树,其可用于分类问题和回归问题[2]。随机森林的决策树构建过程主要包括:
(1)随机选取待选特征。该特征的构建过程并未用到所有的待选特征,而是从待选特征集合中随机地选取一定数量的特征,利用选取的特征来构建决策树。这样便使随机森林各个子树之间具有一定的差异性并提升了随机森林的分类性能。
(2)选择决策树的节点分裂属性。随机森林中决策树的节点分裂属性的选择准则为CART(ClassificationAndRegressionTree)。CART决策树算法的衡量指标为Gini系数,在决策树的构建过程中,选择Gini系数最小的属性和属性分割阈值来进行节点分裂[7]。
(3)节点终止分裂的判断。随机森林中决策树需要充分的生长,且在生长过程中不需要剪枝,然而决策树不能无限制地增长下去,其节点需要遵守一定的终止分裂的原则[4]。
(4)确定叶子节点类别。
随机森林的决策树具体构建步骤为:
(1)创建决策树的根节点,输入训练样本集。
(2)随机选取决策树的待选特征,依据CART算法在待选特征中选择根结点的最优分裂属性和最优的分裂阈值。
(3)根据所选属性将节点进行分裂,产生两个子节点。(4)判断节点是否满足节点终止分裂的准则,若满足则确定该节点的类别,若不满足,则重复执行步骤
(2),直到满足节点终止分裂条件为止。
3基于随机森林的故障诊断方法
模型随机森林的决策树是一种弱分类器,其在构建和决策过程中容易产生过拟合,导致其预测的精度不高。为削弱单棵决策树对分类的不利影响,随机森林采用组合分类器的方式,将训练样本集来源于同个总体样本集的多颗决策树集合在一起,共同对同一分类预测问题进行投票决策,进而提升预测分类的精度。
(1)随机选取决策树的训练集。本文中燃气轮机故障诊断中的参数一般为性能参数和振动参数(功率、温度、压力、流量、转速、和振幅等数值)。假设燃气轮机故障总体样本集为U,随机森林的训练样本集为D。通过集成学习算法Bagging独立随机地从总体样本集U中选取k个训练样本集记为Dj,其中j=1,2,3...,k。各决策树的训练样本集Dj中样本的个数相同且均约为训练样本集Dj的2/3。
(2)由Autoencoder神经网络算法处理的故障特征,训练随机森林。假设需要生成的决策树的棵数为k,从燃气轮机故障数据库中每次随机抽取(有放回)此特征的个数为f,为k棵决策树依次随机地抽取k组此特征集并将其作为相应决策树的待选特征。这样提升了随机森林的分类精度并减少了各决策树间的相关性。
(3)根据决策树的训练集和决策树的待选燃气轮机故障特征来构建随机森林的决策树。
(4)将生成的决策树组合形成随机森林,其输出结果采用大多数投票法给出。模型构建示意图如图2所示。4结语本文将随机森林算法和Autoencoder降维运用于燃气轮机故障诊断中,提出了一种基于随机森林的燃气轮机故障检测的方法,通过组合分类器投票决策对燃气轮机故障进行诊断,提升检测精度、稳定性和泛化能力,对燃气轮机故障诊断具有一定的参考价值。
参考文献
[1]谢春玲,戴景民.燃气轮机故障诊断技术研究综述与展望[J].燃气轮机故障诊断技术研究综述与展望,2010,52(1):1-3.
[2]曹正凤.随机森林算法优化研究[D].北京:首都经济贸易大学,2014.
[3]李孝堂.现代燃气轮机技术[M].北京:航空工业出版社,2006.
[4]马骊.随机森林算法的优化改进研究[D].广州:暨南大学,2016.
[7]蔡林霖.随机森林的模型化选择及其并行化方法[D].哈尔滨:哈尔滨工业大学,2012.
作者:熊毅 李永刚 单位:京能集团北京京西燃气热电有限公司