美章网 资料文库 电力企业窃漏电用户自动识别探析范文

电力企业窃漏电用户自动识别探析范文

本站小编为你精心准备了电力企业窃漏电用户自动识别探析参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

电力企业窃漏电用户自动识别探析

【摘要】窃电对电力设施会造成破坏,引发大面积停电事故。这不但给国家造成巨大的经济损失,也严重破坏了供电市场的秩序,影响到广大用户的正常生活,甚至威胁到了国家电网的正常运行。本文阐述了将数据挖掘应用到窃漏电中具有重要的研究意义,并介绍了各层具体功能。基于数据挖掘技术构建的窃漏电用户自动识别模型,对相关技术进行了介绍,利用该系统对用电户的电能表数据进行模型构建,并对结果进行了分析。

【关键词】数据挖掘;窃漏电;神经网络;数据分析模型

1前言

据统计,全国每年都因窃漏电造成几百亿的元的经济损失,被查出的窃漏电案件的数量极低,查处难度比较大,需要一定的专业技术和必要设备,同时还要有众多的技术人员。如北京工业区一家生产服装箱包的小厂,在一年的时间里窃电大约在20-30万元,某省14年就因窃电带来的损失就高达50亿元。对于普通居民户也存在窃电的行为,窃电量虽不及用电大户多,但也不能忽视,此外,窃电可造成电力设施的破坏,引发大面积停电事故,每年都发生多起因窃电引起的事故。这不但给国家造成巨大的经济损失,也严重破坏了供电市场的秩序,威胁到了国家电网的正常运行,影响到广大用户的正常生活。现有的用电检查及反窃电工作主要依靠突击检查的方式来打击窃电行为,费时又费力,存在先天性的缺陷和不足:一是由于传统用电检查工作往往是有计划有周期的,在非检查期用户可能存在用电安全的隐患、电能表的故障以及窃电的行为,这些在检查中不一定会被稽查人员发现。二是没有针对性,在传统的用电检查中,对嫌隙电能表进行测量检查校正,这也不是窃漏电检查的主要方式和手段,但相对于数以万计的用电户不能够及时的发现。三是稽查人员在查出窃漏电工作中,缺少很多必要的信息,例如用电户的用电负荷情况或时时的电能表的信息。到现场去检测也只能是获得检测时的电能信息。假如用户采取不定时随机的窃电方式,这种行为很难被稽查人员发现。对用电异常模型分析,虽然能获取一些窃漏电的有用信息,但由于终端误报或漏报,不能快速准确的识别出真正的窃漏电用户,这种情况下对窃漏电的查处很不利,获取到的信息不能真正发挥作用,在构建这种分析模型时还需要一定的专业知识和丰富的经验,所得到的结果还有一定的误差和主观性。

2数据挖掘技术

神经网络技术是一种对信息进行处理的算法的数学模型,用来信息处理的算法。这种技术依附复杂的系统特征,通过调整系统内部大量节点之间的相互联系,进而实现对信息的处理和利用。人工神经网络随着不断的训练和完善,它的学习能力和适应的能力也在不断的提高,通过给它提供大量的数据,分析这些数据之间潜在的联系和规律,并根据训练得出的规律,来分析新的大量的输入数据并推断出符合期望的结果。CART决策树ClassificationAndRegressionTree,即分类回归树算法,简称CART算法,它是决策树的一种实现,通常决策树主要有三种实现,分别是ID3算法,CART算法和C4.5算法。CART算法把样本数据分割为多个子样本,每一个生成的非叶子结点都有两个分支,CART是一种二分递归分割技术,用它生成的决策树是结构简洁的二叉树。它可以分为以下两个步骤:(1)将样本递归划分进行建树过程;(2)用验证数据进行剪枝。

3模型的实现

3.1分析方法与过程

窃漏电用户在电力计量自动化系统的监控大用户中只占小部分,同时某些大用户也不可能存在窃漏电行为,如银行、税务、学校、工商等非居民类别,故在数据预处理时有必要将这些类别用户剔除。系统中的用电负荷不能直接体现出用户的窃漏电行为,终端报警可能存在误报和漏报,因此要对数据进行探索和预处理,总结窃漏电用户的行为规律,再从数据中提炼出描述窃漏电用户的特征指标。最后结合历史窃漏电用户信息,整理出专家样本数据集,再进一步构建分类模型,实现窃漏电用户的自动识别。主要包括以下步骤:(1)从电力计量自动化系统、营销系统有选择性地抽取部分大用户用电负荷、终端报警及违约窃电处罚信息等原始数据;(2)对样本数据探索分析,剔除不可能存在窃漏电行为行业的用户,即白名单用户,初步审视正常用户和窃漏电用户的用电特征;(3)对样本数据进行预处理,包括数据清洗、缺失值的处理和数据变换;(4)构建专家样本集;(5)构建窃漏电模型;(6)在线监测用户用电负荷及终端报警,调用模型实现实时诊断。

3.2数据抽取与窃漏电相关的原始数据

主要有用电负荷数据、终端报警数据、违约窃电处罚信息以及用户档案资料等,故进行窃漏电诊断建模时需从如下系统中抽取数据。

3.2.1从营销系统抽取的数据主要有(1)用户基本信息:用户名称、用户编号、用电地址、用电类别、报装容量、计量方式、电流互感器变比、电压互感器变比;(2)违约、窃电处理记录;(3)计量方法及依据。

3.2.2从计量自动化系统采集的数据属性主要有(1)实时负荷:时间点、计量点、总有功功率、A/B/C相有功功率、A/B/C相电流、A/B/C相电压、A/B/C相功率因数;(2)终端报警。窃漏电用户的窃漏电开始时间和结束时间是表征其窃漏电的关键时间节点,在这些时间节点上,用电负荷和终端报警等数据也会有一定的特征变化,故样本数据抽取时务必要包含关键时间节点前后一定范围的数据,并通过用户的负荷数据计算出当天的用电量,公式如下:fl=0.25∑mi∈l天mi(1)其中fl为第l天的用电量,mi为第l天每隔15分钟的总有功功率,对其累加求和得到当天用电量。基于此,本案例抽取某市近5年来所有的窃漏电用户有关数据和不同用电类别正常用电用户共208个用户的有关数据,时间跨度为五年,从2009年元旦开始,截止到2014年12月31日,同时包含每天是否有窃漏电情况的标识。

3.3构建模型

3.3.1构建窃漏电用户识别模型在专家样本准备完成后,需要划分出测试、训练样本,随机选取20%作为测试样本,剩下的作为训练样本。窃漏电用户识别可通过构建分类预测模型来实现,比较常用的分类预测模型有神经网络和CART决策树,各个模型都有各自的优点,故采用这两种方法构建窃漏电用户识别,并从中选择最优的分类模型。

3.3.2神经网络设定神经网络的输入节点数为3,输出节点数为1,隐层节点数为10,权值的衰减参数为0.05。训练样本建模的混淆矩阵见表3-9,分类准确率为94.17%,正常用户被误判为窃漏电用户占正常用户的1.95%,窃漏电用户被误判为正常用户占正常窃漏电用户的28.6%。

3.3.3CART决策树利用训练样本构建CART决策树模型,得到的决策树模型见图2。分类准确率为91.67%,正常用户被误判为窃漏电用户占正常用户的5.85%,窃漏电用户被误判为正常用户占正常窃漏电用户的22.86%。

3.4模型评价

对于训练样本,构建模型后的神经网络分类准确率与CART决策树的分类准确率相差不大,两者都能达到90%以上。为了进一步评估模型分类的性能,故利用测试样本对两个模型进行评价,评价方法采用ROC曲线进行评估,一个较为满意的分类器所对应的ROC曲线应该是尽量靠近左上角。神经网络和CART决策树对测试数据集的测试代码。分别画出神经网络和CART决策树在测试样本下的ROC曲线。经过对比上面两个ROC曲线发现神经网络的ROC曲线比CART决策树的ROC曲线更加靠近单位方形的左上角,神经网络模型曲线下的面积更大,说明神经网络模型的分类性能较好,能应用于实际的窃漏电用户的识别。

4结论

基于数据挖掘技术,探讨了窃电识别系统,既解决了窃漏电的难以检测的问题,挽回了国家的损失,又很好的建立了快速检测窃漏电的检测系统,为电力监测提供了很好的检测手段,减轻了稽查人员的工作负担,提高了他们的工作效率。

参考文献:

[1]曾翔宇.基于数据挖掘的列车智能驾驶模型研究[D].北京:北京交通大学,2014.

[2]陈渊.数据挖掘技术在丙酮精制过程中的应用研究[D].北京:清华大学,2007.

[3]成蓬勃.基于数据挖掘技术的配电网故障诊断研究[D].南宁:广西大学,2007.

[4]黄中海.数据挖掘在高校学生心理危机预防中的应用[D].武汉:武汉科技大学,2015.

[5]靳涛.数据挖掘及在电厂凝汽设备诊断中的应用[D].北京:华北电力大学北京,2003.

作者:刘婷婷;王志新;葛明涛 单位:郑州大学西亚斯国际学院