在互联网环境下,多售电主体形成竞争关系,需要允分分析用户的社会属性、用电行为和互联网行为,以便获取用户的用电行为偏好,并为用户提供更为适宜的供电服务,也通过对用户的精准分析,制定供电和需求侧响应策略。为了实现电力精准消费和优化消费,需要对互联网用电用户进行分类,并通过寻找形似用户的方式,精准预测或者推荐优化电力套餐。目前电力消费对用户的识别,多是基于用户社会属性进行定性分类,忽略对用电行为的精准分析,尤其是缺少对用户互联网行为及其对用电的影响做深入分析。
因此,售电主体如何在互联网环境下通过分析用户行为寻找和识别相似用户,进而形成个性化用电服务和售电侧能效有效优化,是一个急需解决的技术问题。
有鉴于此,本书提供一种互联网售电主体相似用户识别方法,能根据用户属性、用电行为和互联网行为综合分析两个用户的相似度,从而为用户提供精准用电业务推荐,而且帮助售电主体充分掌握用户用电规律,制定有效的需求侧响应策略。
如图7-6所示,互联网售电主体相似用户识别方法包含以下步骤:
(1)互联网售电主体建立包含用户人口、住房面积、房屋市场均价、加热类型、历史用电负荷、用户互联网行为等信息的用户数据库,见表7-1。
图7-6相似用户识别方法
表7-1用户标签相似度对比
(2)互联网售电主体分别对人口、住房面积、房屋市场均价、加热类型等用户静态标签设定分类表,并计算样本用户与售电主体所有用户的属性相似度,对于超过设定相似度阈值的用户,建立新用户群A。计算方法是:将样本用户i与用户j的人口、住房面积、房屋市场均价、加热类型等用户静态标签分别映射到售电主体设定的用户标签分类表,两个用户各标签如果映射到分类表的同一位置则认为该属性相似度为1,否则为0,假设形成的标签相似度向量[1,0,0,1,0,0],再根据售电主体设定的各属性权重W1:=[0.25,0.25,0.25,0.25,0.25,0.25],加权计算用户静态标签相似度:
S1(i,j)=1×0.25+0×0.25+1×0.25+1×0.25=0.75
设用户静态标签相似度网值为0.7,则所有与用户i相似度超过0.7的用户则划入新的用户群A。
(3)计算样本用户和新用户群A各个用户的日均负荷曲线,将样本用户分别与用户群A的个体进行负荷曲线相似度计算。对于超过设定相似度阈值的用户,建立新用户群B。计算方法是:分别取用户i和j所有日负荷曲线中各小时的平均负荷组成样本用户i与用户j的负荷向量Li;和Lj;,其中日均负荷为用户i和用户j数据库中存的所有日负荷在每个对应时间的均值。假设Li=[2,3,4,5,4,6,4,7,5,6,4,3,5,9,5,6,4,3,7,2,1,3,2,1],Lj=[1,2,4,5,4,64,7,8,2,4,3,5,6,5,7,4,3,6,2,1,2,2,1],计算负荷相似度设用户负荷相似度
设用户负荷阈值为0.8,则在用户群A中所有与用户i相似度超过0.8的用户则划入新的用户群B。
(4)建立用户互联网用电行为特征向量,元素包括互联网售电平台应用业务类型、用电报告阅读状态、需求响应情况、用户信用等,计算样本用户与用户群B中各个用户的互联网用电行为相似度。计算方法是:从用户数据库中分别获取互联网售电平台应用业务类型、用电报告阅读状态、需求响应情况、用户信用等级等,其中互联网售电平台应用业务类型为用户通过售电平台订购的增值服务类型;用电报告阅读状态为用户查询用电详情的频度;需求响应情况为用户峰谷用电量差值。将样本用户i与用户j的互联网售电平台应用业务类型、用电报告阅读状态、需求响应情况、用户信用等级分别映射到售电主体设定的用户互联网行为要素分类表,两个用户各要素如果映射到分类表的同一位置则认为该要素相似度为1,否则为0,假设形成的互联网行为相似度向量为[0,0,1,1],再根据售电主体设定的各属性权重W2=[0.3,0.1,0.2,0.4],加权计算用户互联网行为相似度
S1(i,j)=0×0.3+0×0.1+1×0.2+1×0.4=0.6
(5)对样本用户和用户样B中各个用户的标签相似度、负荷曲线相似度和互联网用电行为相似度进行加权求和,超过互联网售电主体设定的阈值的用户,则认为是与样本用户相似的用户。计算方法是:根据售电主体设定的各要素相似度权重W2=[0.2,0.4,0.4],用户i与用户j的相似度为
S=w3(1)S1(i,j)+w3(2)S2(i,j)+w3(3)S3(i,j)=0.774
假设售电主体设定相似度阈值为0.7,者在用户群B中所有与样本用户相似度超过0.7的用户均为样本用户的相似用户。