基于神经网络算法的用户窃电行为检测模型研究

0 引言

近些年,窃电行为屡禁不止,窃电手法也趋向智能化、隐蔽化。除了在供电设施上擅自接线用电,绕越用电计量装置用电,伪造或者开启加封的用电计量装置封印用电,故意损坏用电计量装置,还会使用倒表器、移相方式、有线远方控制和无线遥控等智能型窃电^[1]。而反窃电工作仍然以人为经验为主,反窃电采用的方法包括逐相检查法、力矩法、钳形表法等,反窃电技术装备有待提高。被动式查证易疏漏,渗透率低;主动巡查命中率低,效率低下,反窃电技术亟待取得突破^[2]。

窃电检测和分析需要提高信息化程度,充分利用用电大数据^[3],挖掘用户用电习惯,基于机器学习算法,结合鉴别经验规则,构建大数据反窃电模型,并逐步建立用户窃电行为检测和分析系统,分析窃电用户特征,准确识别高窃电嫌疑的用户^[4-7],从而为电力企业提供智能化的分析策略,为反窃电管理的完善提供有效的技术支持^[8-9]。进一步,维护正常的供用电秩序,保证用电安全,保障正常用电用户和电力企业的利益。

本文主要贡献在于利用用电数据和相关电力数据集,构建窃电风险等级模型,设计用户窃电行为检测系统。首先,介绍所采用的神经网络框架及模型构建方法;其次,介绍特征工程和数据预处理采用的方法;最后,在真实数据集上验证模型的有效性以及完善其可扩展性。

1 神经网络

神经网络是深度学习的基础,作为经典的机器学习框架,已在诸多领域的大数据应用中取得了广泛应用^[10]。

1.1 神经元与多层网络

神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,能够模拟生物神经系统的交互和学习过程。

元神经网络中的功能神经元,接收到来自其他神经元的输入信号x_i(i=1,2,…n),通过带权重w_i(i=1,2,…n)的连接进行传递,神经接收到的总输入值将与其阈值θ比较,然后通过“激活函数”（Sigmoid函数、logistic 函数等）处理以产生输出y。

权重和阈值可以通过学习得到。功能神经元模型如图1所示。

图1 功能神经元模型Fig.1 Functional neuron model

要解决非线性可分问题,需叠加单层感知器,常见的神经网络结构为“多层前馈神经网络”,包含输入层、输出层以及之间的一层或多层的隐藏层^[11]。

1.2 误差逆传播算法

误差逆传播（error Back Paopagation,BP）算法是训练神经网络的迭代学习算法,采用随机梯度下降进行参数寻优,其算法如下。

（1）

则网络在此样本上的均方误差为：

（3）

单隐藏层前馈神经网络结构示意如图2所示。

图2 单隐藏层前馈神经网络结构示意Fig.2 Single hidden layer feedforward neural network structure

2 窃电风险等级模型

2.1 数据输入与特征提取

模型初始训练的数据集来自于湖州部分地区2016年第四季度的用户用电数据,采集于21 623个低压用户户号和17 779个专变用户户号,其中包含646个已查验确认的低压窃电用户。

根据窃电特点及其受窃电行为影响的计量指标,专变用户主要从瞬时电压、瞬时电流、三相不平衡、日用电量、月最大需量等方面提取模型特征,低压用户主要从日用电量、用电量变化、尖峰平谷时期用电量、所在台区线损、线损变化等方面提取模型基本特征,从而全面刻画用户用电模式和规律,及其对电网产生的影响^[13]。

主要特征和对输入数据的预处理如下：

1）用电量时间序列：一阶差分观测期内的电表读数,获取日用电总量和尖峰平谷各时间段用电量的时间序列数据。图3是该时间序列数据的可视化,绿色代表的是正常用户,红色代表窃电用户,可以看到窃电用户和正常用户用电时段的差异性。

2）平均电表读数：对观测期内用户电表读数统计值取均值,作为用电基数输入。

3）月最大需量：观测期内各月用户电量最大需量。另外,提取月最大需量与实际用电量差异值
特征。

4）所在台区线损：用户所在台区的线损率、台区用户数、台区用电量,反映所在台区线损程度和窃电用户分布的比例。

5）电压三相不平衡：根据IEEE Std 12-2004的定义,由三相相电压值V_a、V_b、V_c及其均值V_pavg计算三相电压不平衡度^[10]：

（5）

数据清洗过程中,对超过20%用电量数据存在异常值的用户进行剔除。用均值填充剩余数据集中用电量缺失值,对于异常值点以临近处均值拟合。

根据均值µ和方差σ对特征值进行z-Score的标准化：

（7）

Sigmoid函数具备求导的很好的性质计算梯度,

Fig.4 ROC graph of MLP model " style="box-sizing: border-box; color: rgb(43, 43, 43); text-decoration-line: none;">图4 MLP模型ROC曲线Fig.4 ROC graph of MLP model

ROC空间将伪阳性率（False Positive Rate,FPR）定义为X轴,真阳性率（True Positive Rate,TPR）定义为Y轴,因此曲线距离左上角越近,证明分类器效果越好。同样,AUC（Area under the Curve of ROC）也用来对模型的效果进行评估,其值为ROC曲线所覆盖的区域面积,AUC越大,模型整体性能越好。该窃电用户检测模型平均AUC达到0.85,反映了其良好的分类效果和健壮性。

对模型的输出进行变换,按窃电嫌疑（用户被分类为窃电用户的可能性）划分窃电风险等级。窃电嫌疑值高于0.8的为高可疑用户,作为排查重点,0.6~0.8为中度可疑用户,0.6以下为低可疑用户,其中的高可疑用户是重点关注和排查的对象。

利用湖州部分地区2017年第二季度的来自
34 520个用户的真实用电数据,输入模型查询高嫌疑值的窃电用户。经过实际检查,模型返回的高可疑窃电用户命中率达到0.75,验证了检测模型的有效性。

通过现场操作人员的确认和分析,对未命中用户的误判异常指标记录,结合正向反馈的数据,对模型进行增量训练。

2.4 模型的应用

基于机器学习的算法和历史用电数据训练窃电风险等级模型,作为窃电用户识别系统的计算核心支撑,构成用户窃电行为检测系统的核心模块。用户窃电行为检测系统架构如图5所示。窃电用户识别系统提供Web查询界面给窃电排查人员,基于最新电力数据返回预测结果。人为排查和判定的反馈结果以及偷窃电指标,触发模型的增量训练和自学习过程,定时更新模型^[15-17]。

图5 用户窃电行为检测系统架构Fig.5 Electric filching detection system architecture

3 展望

现阶段基于神经网络的用户窃电检测与分析,模型的分类能力和准确率、召回率均有待提高,下一步将加入随机森林、梯度提升树等算法模型模块,利用模型集成提升学习能力^[18]。数据集的连续有效保障用户窃电等级模型的泛化能力和精准程度。数据仓库正在构建,数据存储和查找的效率需要进一步提高。对窃电用户的查处和标记需要增加各项指标的记录,如窃电起止时间、窃电方式、窃电量等,数据质量的提高将进一步促进模型的优化。

4 结语

传统的反窃电技术工作量大、渗透率低,本文基于用户用电数据和相关电力数据提取特征指标,利用BP神经网络算法实现窃电风险等级监测模型,模型在湖州市真实数据实例验证上展现了高准确率和命中率,较以往随机排查、经验规则,以更高的科学性和实用性提升了反窃电技术的信息化和智
能化。

热搜词 :

0 引言

1 神经网络

1.1 神经元与多层网络

1.2 误差逆传播算法

2 窃电风险等级模型

2.1 数据输入与特征提取

2.4 模型的应用

3 展望

4 结语

相关新闻

虚拟电厂缺什么？

多供电回路下的实际最大需量

“千亿”市场预期下，虚拟电厂建设还“缺”些什么？

关于建立独立储能容量电价机制的探讨

储能系统价格触底正式进入“0.5元时代”

热搜词 :

基于神经网络算法的用户窃电行为检测模型研究

0 引言

1 神经网络

1.1 神经元与多层网络

1.2 误差逆传播算法

2 窃电风险等级模型

2.1 数据输入与特征提取

2.4 模型的应用

3 展望

4 结语

相关新闻

虚拟电厂缺什么？

多供电回路下的实际最大需量

“千亿”市场预期下，虚拟电厂建设还“缺”些什么？

关于建立独立储能容量电价机制的探讨

储能系统价格触底 正式进入“0.5元时代”

储能系统价格触底正式进入“0.5元时代”