0 引言
近些年,窃电行为屡禁不止,窃电手法也趋向智能化、隐蔽化。除了在供电设施上擅自接线用电,绕越用电计量装置用电,伪造或者开启加封的用电计量装置封印用电,故意损坏用电计量装置,还会使用倒表器、移相方式、有线远方控制和无线遥控等智能型窃电[1]。而反窃电工作仍然以人为经验为主,反窃电采用的方法包括逐相检查法、力矩法、钳形表法等,反窃电技术装备有待提高。被动式查证易疏漏,渗透率低;主动巡查命中率低,效率低下,反窃电技术亟待取得突破[2]。
窃电检测和分析需要提高信息化程度,充分利用用电大数据[3],挖掘用户用电习惯,基于机器学习算法,结合鉴别经验规则,构建大数据反窃电模型,并逐步建立用户窃电行为检测和分析系统,分析窃电用户特征,准确识别高窃电嫌疑的用户[4-7],从而为电力企业提供智能化的分析策略,为反窃电管理的完善提供有效的技术支持[8-9]。进一步,维护正常的供用电秩序,保证用电安全,保障正常用电用户和电力企业的利益。
本文主要贡献在于利用用电数据和相关电力数据集,构建窃电风险等级模型,设计用户窃电行为检测系统。首先,介绍所采用的神经网络框架及模型构建方法;其次,介绍特征工程和数据预处理采用的方法;最后,在真实数据集上验证模型的有效性以及完善其可扩展性。
1 神经网络
神经网络是深度学习的基础,作为经典的机器学习框架,已在诸多领域的大数据应用中取得了广泛应用[10]。
1.1 神经元与多层网络
神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,能够模拟生物神经系统的交互和学习过程。
元神经网络中的功能神经元,接收到来自其他神经元的输入信号xi(i=1,2,…n),通过带权重wi(i=1,2,…n)的连接进行传递,神经接收到的总输入值将与其阈值θ比较,然后通过“激活函数”(Sigmoid函数、logistic 函数等)处理以产生输出y。
权重和阈值可以通过学习得到。功能神经元模型如
要解决非线性可分问题,需叠加单层感知器,常见的神经网络结构为“多层前馈神经网络”,包含输入层、输出层以及之间的一层或多层的隐藏层[11]。
1.2 误差逆传播算法
误差逆传播(error Back Paopagation,BP)算法是训练神经网络的迭代学习算法,采用随机梯度下降进行参数寻优,其算法如下。
则网络在此样本上的均方误差为:
单隐藏层前馈神经网络结构示意如
2 窃电风险等级模型
2.1 数据输入与特征提取
模型初始训练的数据集来自于湖州部分地区2016年第四季度的用户用电数据,采集于21 623个低压用户户号和17 779个专变用户户号,其中包含646个已查验确认的低压窃电用户。
根据窃电特点及其受窃电行为影响的计量指标,专变用户主要从瞬时电压、瞬时电流、三相不平衡、日用电量、月最大需量等方面提取模型特征,低压用户主要从日用电量、用电量变化、尖峰平谷时期用电量、所在台区线损、线损变化等方面提取模型基本特征,从而全面刻画用户用电模式和规律,及其对电网产生的影响[13]。
主要特征和对输入数据的预处理如下:
1)用电量时间序列:一阶差分观测期内的电表读数,获取日用电总量和尖峰平谷各时间段用电量的时间序列数据。
2)平均电表读数:对观测期内用户电表读数统计值取均值,作为用电基数输入。
3)月最大需量:观测期内各月用户电量最大需量。另外,提取月最大需量与实际用电量差异值
特征。
4)所在台区线损:用户所在台区的线损率、台区用户数、台区用电量,反映所在台区线损程度和窃电用户分布的比例。
5)电压三相不平衡:根据IEEE Std 12-2004的定义,由三相相电压值
数据清洗过程中,对超过20%用电量数据存在异常值的用户进行剔除。用均值填充剩余数据集中用电量缺失值,对于异常值点以临近处均值拟合。
根据均值µ和方差σ对特征值进行z-Score的标准化:
Sigmoid函数具备求导的很好的性质计算梯度,
ROC空间将伪阳性率(False Positive Rate,FPR)定义为X轴,真阳性率(True Positive Rate,TPR)定义为Y轴,因此曲线距离左上角越近,证明分类器效果越好。同样,AUC(Area under the Curve of ROC)也用来对模型的效果进行评估,其值为ROC曲线所覆盖的区域面积,AUC越大,模型整体性能越好。该窃电用户检测模型平均AUC达到0.85,反映了其良好的分类效果和健壮性。
对模型的输出进行变换,按窃电嫌疑(用户被分类为窃电用户的可能性)划分窃电风险等级。窃电嫌疑值高于0.8的为高可疑用户,作为排查重点,0.6~0.8为中度可疑用户,0.6以下为低可疑用户,其中的高可疑用户是重点关注和排查的对象。
利用湖州部分地区2017年第二季度的来自
34 520个用户的真实用电数据,输入模型查询高嫌疑值的窃电用户。经过实际检查,模型返回的高可疑窃电用户命中率达到0.75,验证了检测模型的有效性。
通过现场操作人员的确认和分析,对未命中用户的误判异常指标记录,结合正向反馈的数据,对模型进行增量训练。
2.4 模型的应用
基于机器学习的算法和历史用电数据训练窃电风险等级模型,作为窃电用户识别系统的计算核心支撑,构成用户窃电行为检测系统的核心模块。用户窃电行为检测系统架构如
3 展望
现阶段基于神经网络的用户窃电检测与分析,模型的分类能力和准确率、召回率均有待提高,下一步将加入随机森林、梯度提升树等算法模型模块,利用模型集成提升学习能力[18]。数据集的连续有效保障用户窃电等级模型的泛化能力和精准程度。数据仓库正在构建,数据存储和查找的效率需要进一步提高。对窃电用户的查处和标记需要增加各项指标的记录,如窃电起止时间、窃电方式、窃电量等,数据质量的提高将进一步促进模型的优化。
4 结语
传统的反窃电技术工作量大、渗透率低,本文基于用户用电数据和相关电力数据提取特征指标,利用BP神经网络算法实现窃电风险等级监测模型,模型在湖州市真实数据实例验证上展现了高准确率和命中率,较以往随机排查、经验规则,以更高的科学性和实用性提升了反窃电技术的信息化和智
能化。