其他分享
首页 > 其他分享> > “泰迪杯” 数据挖掘挑战赛 优秀作品 - 基于非侵入式负荷检测与分解的电力数据挖掘

“泰迪杯” 数据挖掘挑战赛 优秀作品 - 基于非侵入式负荷检测与分解的电力数据挖掘

作者:互联网

目录

1.挖掘目标

2.分析方法与过程
2.1 问题 1 分析方法与过程
2.1.1 单个设备运行特征
2.1.2 实时用电量计算
2.2 问题 2 分析方法与过程
2.2.1 流程图
2.2.2 基于 SVM 的多分类判别模型
2.2.3 基于最近邻的判别模型
2.2.4 电流电压轨迹图可视化验证
2.3 问题 3 分析方法与过程
2.3.1 流程图
2.3.2 设备类型分类
2.3.3 不同运行状态下设备运行电流特征
2.3,4 运用线性组合思想对设备组进行分析
2.4 问题 4 分析方法与过程
2.4.1 流程图
2.4.2 基于波形特征匹配的设备判别
2.4.3 基于线性组合的设备组状态分析

3.结果分析
3.1 问题 1 结果分析
3.1.1 实时用电量计算结果
3.1.2 各用电设备运行特征
3.2 问题 2 结果分析
3.2.1 附件 2 设备 1 判别分析
3.2.2 附件 2 设备 2 判别分析
3.3 问题 3 结果分析
3.3.1 附件 3 设备组 4-YD2+YD8 各用电设备分析
3.3.2 附件 3 设备组 5-YD3+YD5+YD11 各用电设备分析
3.3.3 附件 3 设备组 6-YD1+YD2+YD3+YD6+YD7 各用电设备分析
3.4 问题 4 结果分析
3.4.1 附件 4 设备组 1 各用电设备判别及状态分析
3.4.2 附件 4 设备组 2 各用电设备判别及状态分析
3.4.3 附件 4 设备组 3 各用电设备判别及状态分析

4.结论

5.参考文献

1.挖掘目标

本次建模的目标是利用 NILMD 装置测得的整个电路上的电力数据,利用 SVM、最近邻、线性组合、可视化的方法与工具,实现从整条线路中“分解”出每个用电设备的独立用电数据。具体要实现四个目标:

  1. 分析每个用电设备的运行特征,并计算实时用电量。

  2. 设计自动识别单一设备的数学模型和计算方法。

  3. 设计在已知设备组下判别各个用电设备的状态、操作及操作时间的方法,并计算实时用电量。

  4. 设计未知设备组下判别设备组成、各个用电设备的状态、操作及操作时间的方法,并计算实时用电量。

需要实现的目标从单一到混合、从已知到未知,问题由易变难。

2.分析方法与过程

2.1 问题 1 分析方法与过程

2.1.1 单个设备运行特征

1、YD1(奥克斯风扇)

特征描述:奥克斯风扇属于有限多状态设备,一共具有 4 种状态。图2-1所示 YD1 的电流轨迹图,我们可以看出电流呈现阶梯状的改变,每达到一种运行稳态后电流会趋于平稳的状态。但是档位发生切换的瞬间会存在暂态特征。图2-2是 YD1 的电流-电压轨迹图,而且在不同档位下的电流-电压轨迹图呈现出相似的形态,这是奥克斯风扇的独特的负荷印迹[1]。

在这里插入图片描述

图 2-1 YD1 电流运行轨迹

在这里插入图片描述

图 2-2 YD1 电流电压轨迹图

2、YD2(美的微波炉)

特征描述:美的微波炉属于有限多状态设备,一共有 6 种运行状态。图2-3所示的电流轨迹图呈现出明显的“梳齿”状,而且电流幅值呈现一种缓慢下降,但是总体维持在高位水平。微波炉不同的运行状态不能够直接根据电流的幅值进行判别,而需要计算“占空比”,占空比是指微波炉高电流运行时间与低电流运行时间的比值。例如:“低火”状态的微波炉,高电流运行时间短,低电流运行时间长;“中火”状态下,高电流运行时间相对变长,低电流运行时间变短。图2-4所示的是 YD2 的电流-电压轨迹图,而且在不同档位下的电流-电压轨迹图呈现出相似的形态,这是美的微波炉独特的负荷印迹。

在这里插入图片描述

图 2-3 YD2 电流运行轨迹

在这里插入图片描述

图 2-4 YD2 电流电压轨迹图

3、YD3(九阳热水壶)

特征描述:九阳热水壶属于“ON/OFF”型设备,只有开启和关闭两种状态,开启状态下电流相对平稳,而且热水壶暂态不明显。图2-6所示的是 YD3 的电流-电压轨迹图,而且在不同状态下的电流-电压轨迹图呈现出相似的形态,这是九阳热水壶的负荷印迹。

在这里插入图片描述

图 2-5 YD3 电流运行轨迹

在这里插入图片描述

图 2-6 YD3 电流电压轨迹图

4、YD4(Thinkpad 笔记本电脑)

特征描述:Thinkpad 笔记本电脑属于连续变状态设备,这类设备的稳态区段功率无恒定均值,而是在一个范围内连续变动,图2-7明显表现出这种特征。图2-8所示的是 YD4的电流-电压轨迹图,而且在不同运行状态下的电流-电压轨迹图呈现出相似的形态,这是Thinkpad 笔记本电脑的独特的负荷迹。

在这里插入图片描述

图 2-7 YD4 电流运行轨迹
在这里插入图片描述

图 2-8 YD4 电流电压轨迹图

5、YD5(白炽灯)

特征描述:白炽灯与九阳热水壶类似,同属于“ON/OFF”型设备,只有开启和关闭两种状态,开启状态下电流相对平稳,而且白炽灯暂态也不明显。图2-10所示的是 YD5 的电流-电压轨迹图,而且在不同状态下的电流-电压轨迹图呈现出相似的形态,这是白炽灯的负荷印迹。

在这里插入图片描述

图 2-9 YD5 电流运行轨迹

在这里插入图片描述

图 2-10 YD5 电流电压轨迹图

6、YD6(节能灯)

特征描述:节能灯与白炽灯相似,同属于“ON/OFF”型设备,只有开启和关闭两种状态,开启状态下电流相对平稳但是低于白炽灯,而且节能灯暂态相对明显。图2-12所示的是 YD5 的电流-电压轨迹图,而且在不同状态下的电流-电压轨迹图呈现出相似的形态,这是节能灯的负荷印迹。

在这里插入图片描述

图 2-11 YD6 电流运行轨迹

在这里插入图片描述

图 2-12 YD6 电流电压轨迹图

7、YD7(FUJI 激光打印机)

特征描述:FUJI 激光打印机属于有限多状态设备,但是打印机工作状态比较特殊,根据已知数据绘制的电流图如图2-13所示。前面两个峰值波动均为打印机开启状态下的暂态波动,第三个峰值为打印状态下的特征,第四个峰值为复印状态下的特征,复印暂态峰值更高,而扫描状态则维持在相对低的电流水平。图2-14所示的是 YD7 的电流-电压轨迹图,但是对于打印机不同运行状态下的电流-电压轨迹图会呈现出相对不同的形态,因为扫描状态和打印状态相差较远,这是打印机的负荷印迹。

在这里插入图片描述

图 2-13 YD7 电流运行轨迹

在这里插入图片描述

图 2-14 YD7 电流电压轨迹图

在这里插入图片描述

图 2-15 YD7 电流电压轨迹图

8、YD8(饮水机)

特征描述:饮水机有 5 种运行状态,属于有限多状态设备。不同运行状态下的电流处于不同的峰值,而且稳态下的电流相对平稳,但是饮水机状态切换存在一定的暂态波动。图2-17所示的是 YD8 的电流-电压轨迹图,而且在不同档位下的电流-电压轨迹图呈现出相似的形态,这是饮水机的负荷印迹。

在这里插入图片描述

图 2-16 YD8 电流运行轨迹

在这里插入图片描述

图 2-17 YD8 电流电压轨迹图

9、YD9(挂式空调)

特征描述:挂式空调属于连续变状态的设备。虽然在不同的档位下,空调的电流幅值处于不同高度,但是不会稳定在一定水平,图2-18能够明显体现出来。但是空调还有明显的暂态特征,因此不能够简单根据电流的幅值对空调的运行状态进行判别,应该在此基础上根据波形的形状进行判别。图2-19所示的是 YD9 的电流-电压轨迹图,而且在不同档位下的电流-电压轨迹图呈现出相似的形态,这是挂式空调的负荷印迹。

在这里插入图片描述

图 2-18 YD9 电流运行轨迹
在这里插入图片描述
图 2-19 YD9 电流电压轨迹图

10、YD10(奔腾电吹风)

特征描述:奔腾电吹风有 5 种运行状态,属于有限多状态设备。类似于饮水机,不同运行状态下的电流处于不同的峰值,而且稳态下的电流相对平稳,但是状态切换存在一定的暂态波动。图2-21所示的是 YD10 的电流-电压轨迹图,但是不同档位下的运行差异比较大因此 V-I 轨迹图在不同运行状态下会呈现不同的特征,这是属于奔腾电吹风的负荷印迹。

在这里插入图片描述

图 2-20 YD10 电流运行轨迹
在这里插入图片描述
图 2-21 YD10 电流电压轨迹图
在这里插入图片描述
图 2-22 YD10 电流电压轨迹图
在这里插入图片描述
图 2-23 YD10 电流电压轨迹图

11、YD11(创维电视机)

特征描述:创维电视机只有开启、关闭两种状态,属于“ON/OFF”型设备。开启状态下,电流相对平稳,但是开启的瞬间存在明显的暂态。图2-25所示的是 YD11 的电流-电压轨迹图,而且在不同状态的电流-电压轨迹图呈现出相似的形态,这是创维电视机的负荷印迹。

在这里插入图片描述

图 2-24 YD10 电流电压轨迹图
在这里插入图片描述
图 2-25 YD10 电流电压轨迹图

2.1.2 实时用电量计算

实时用电量计算的是瞬时的用电器的电流与电压以及时间的乘积[2]。
实时用电量计算公式:

W = P ∗ 100 / 3600 P = U ∗ I W =P* 100/3600\\ P=U*I W=P∗100/3600P=U∗I
其中 W W W 为实时用电量,单位是 0.001 kwh; P P P 为功率,单位为 w。

2.2 问题 2 分析方法与过程

2.2.1 流程图

在这里插入图片描述

图 2-26 问题 2 总体流程图

综合考虑数据可能存在缺失的实际情况,提出结合 SVM 和最近邻结合的判别模型。而且由题 1 描述的特征可知,同一设备的电流-电压轨迹图会呈现出相似的形态,而不同的设备电流-电压轨迹图会呈现出不同的形态,因此可视化电流电压轨迹图可以作为对模型判别结果的一种验证手段,能够提升判别的准确率[3]。

2.2.2 基于 SVM 的多分类判别模型

1、流程图

在这里插入图片描述

图 2-27 基于 SVM 的设备完整流程

2、数据可视化及特征提取

在对附件一中的数据可视化过程中发现,同一设备无论出于何种运行状态下,谐波电压数据可视化的图像非常相似,如下图所示。

在这里插入图片描述

图 2-28 设备 1 奥克斯风扇谐波电压图

图 2-1 中的不同颜色代表了奥克斯风扇在不同的运行状态下的谐波电压数据波形图,从图中不难发现,任意状态下设备 1 的谐波电压波形十分相似。而且这种相似性并非仅仅发生在设备 1,下图展示的是设备 5 的各个状态下的谐波电压波形。

在这里插入图片描述

图 2-29 设备 5 白炽灯谐波电压图

由图 2-2 所示的白炽灯谐波电压波形,在不同的设备状态下也呈现相似特性。而且在对所有的 11 个设备的谐波电压数据进行分析时,均发现此类相似的特性[4]。因此可以说明,谐波电压的波形不会随着设备的状态的改变而发生剧烈变化。

在这里插入图片描述

图 2-30 所有设备的谐波电压图

与此同时,图 2-3 绘制的是所有的 11 个设备的谐波电压图波形,每种颜色代表一种设备。可以看出不同的设备谐波电压的频率相同,但是波动的峰值差异巨大。综上所述,不同设备谐波电压差异大,同一设备谐波电压差异小,可以说明谐波电压这一参数可以用于判别设备本身。每个时间点 UC 样本参数有 50 个,因此这 50 个参数的指标序列是可以用于进行设备判别分析的。

除此之外,我们从 YD1-YD11 的工作参数中可以知晓,不同设备的瓦数差异巨大,也就说明不同设备的实时用电量不在一个量级。因此,实时用电量本身也可以作为判别设备的依据。因此,综上所述,我们选择 50 维的谐波电压参数以及 1 维的实时用电量作为设备判别的依据。

3、模型选择及数据清洗

在确定判别参数之后,我们选择的判别方法是多分类的 SVM 模型。根据程祥等人[5]在非侵入式负荷监测研究综述中的描述中,我们了解到在负荷种类不多而且负荷处于单一状态下,采用 SVM 模型可以取得较高的准确度。我们采样 SVM 方式进行训练的过程如下图所示。

在这里插入图片描述

图 2-31 SVM 训练过程

在确定判别所需特征之后,我们开始对相关的特征数据进行抽取和清洗。附件一所给的数据样本不均衡,如果直接作为训练数据会使得 SVM 分类器的效果大幅下降。如下表所示,不同设备样本量差距过大,我们采样的清洗手段是,对样本量较多的设备进行下采样,按照设备的运行状态进行分层采样,采样后的用于判别训练的数据如表所示。

表 2-1 分层采样后的训练集样本量
在这里插入图片描述

确定样本量之后,给每个设备打上 Label,YD1-YD11 分别标记为 1-11 的标号。然后再打乱整个数据集的顺序按照 7/3 的比例从中抽取出 training set 和 testing set,training set 用于监督学习训练学习,testing set 用于验证分类器的分类效果。由于 SVM 对数据本身的 scale 是敏感的,因此在进行训练之前需要先进行归一化处理。

4、训练模型及误差验证
将上述抽取出的 training set 用于模型训练和学习,以 30%样本的 testing set 用于模型预测和评估,最终基于 SVM 的多类别分类器准确率在 93.08%。

2.2.3 基于最近邻的判别模型

1、 流程图

在这里插入图片描述

图 2-32 最近邻判别流程

2、 最近邻原理:
最近邻的核心思想是如果某一个样本在特征空间与最相邻的样本中的大多数属于同一个类别,则该样本也属于这个类别[6]。距离的度量采用的是欧式距离,计算公式为:
d i s t a n c e = [ ( x − x i ) 2 + ( y − y i ) 2 ]   ( i = 1 , 2 , 3.... , 11 ) distance = [(x-x_i)^2 + (y-y_i)^2] \ (i=1,2,3....,11) distance=[(x−xi​)2+(y−yi​)2] (i=1,2,3....,11)

根据最近邻原理计算待估计点与 11 个已知点的 distance,选择 distance 最小的已知点类别作为待估计点的设备类型。

3、 基于最近邻的判别方法:

每个用电器对应最大功率的稳态运行状态下有功无功的值如下表所示:

表 2-2 11 种用电器(P,Q)表
在这里插入图片描述
(P 的单位为 W; Q 的单位为 Var)

以有功为横坐标,无功为纵坐标可画出对应用电器的功率特征分布图,如下所示:

在这里插入图片描述

图 2-33 所有设备的(P,Q)分布图

由于每种设备对应的(P,Q)位置如上图所示,而且这种位置不会随着设备运行状态发生改变,因此可以根据最近邻算法计算位置设备与上述 11 种设备的欧氏距离,并将其判别为距离最近的那种设备的类型。我们采用的是 matlab 工具进行最近邻判别分析。

2.2.4 电流-电压轨迹图可视化验证

1、附件 2 设备 1 电流电压轨迹图

运用电流-电压轨迹图进行验证,图2-34为设备 1 的轨迹图,图3-35为 YD8 的轨迹图,非常相似,进一步说明基于最近邻的判别结果是正确的。
在这里插入图片描述

图 2-34 设备 1 电流电压轨迹图
在这里插入图片描述
图 2-35 YD8 电流电压轨迹图

2、附件 2 设备 2 电流电压轨迹图

运用电流-电压轨迹图进行验证,图2-36为设备 2 的轨迹图,图2-37为 YD9 的轨迹图,非常相似,进一步说明基于 SVM 的判别结果是正确的。

在这里插入图片描述

图 2-36 设备 2 电流电压轨迹图
在这里插入图片描述
图 2-37 YD9 电流电压轨迹图

2.3 问题 3 分析方法与过程

2.3.1 流程图

在这里插入图片描述

图 2-38 问题三流程图

由题意我们已知设备组的构成,需要判别的是各个设备在各个时刻的运行状态,并计算实时用电量。由于设备组中的设备是并联在同一电路之下,NLMID 装置实测的数据之中电流数据是叠加的[7]。因此,设备组所呈现的电流的波形应该是各个运行状态下的单个用电设备的叠加。举例说明,数据由 NLMID 设备测出,电流数据是各个用电设备叠加出来的结果。因此,设备组 3 中的任意时刻的电流数值也一定是由 YD4、YD5、YD8、YD10、YD11 五种设备各自在某一种状态下运行的电流值的叠加。因此,我们采用线性组合的方式对混合设备的运行状态进行求解。

2.3.2 设备类型分类

根据用电设备工作状态的不同,可以将其分为以下 3 种类型[8]:

1)ON/OFF。这类设备只有运行和关闭两种状态。

2)有限多状态设备。这类设备电设备通常具有有限多个分立的工作状态,不同的功率
状态即标志着不同的工作状态。

3)连续变状态设备。这类用电设备的稳态区段功率无恒定均值,而是在某个范围内连续变动。

YD1-YD11 这些设备均可以纳入相应的种类之中。

表 2-3 设备类型分类
在这里插入图片描述

1)ON/OFF 类型的四个设备的电流可视化
在这里插入图片描述

图 2-39 ON/OFF 型设备电流图

2)有限多状态设备类型的设备电流可视化
在这里插入图片描述
在这里插入图片描述

图 2-40 有限多状态设备电流图

3)连续变状态设备类型的设备电流可视化

在这里插入图片描述

图 2-41 连续变状态设备电流图

在已知设备类型的情况下,需要求解出各个运行设备在各个时刻的运行状态。在对用电器进行“ON/OFF”、“有限多状态设备”、“连续变状态设备”分类之后,不难发现每个类别下的电器在运行中会出现相似的运行特征。“ON/OFF”型设备只有开启和关闭两种状态,而且在稳定运行状态下的电流比较平稳,波动很小;“有限多状态设备”类型的电器,一般会有多种操作对应于不同的运行状态,不过在稳态运行下电流大部分电器也是比较平稳;然而,“连续变状态设备”则在稳定运行状态下电流的波动很大,一般不会平稳运行在某一水平。我们采用线性组合的思想对此问题求解,必然需要先对设备进行更加细致的划分。因此,我们在进行以上三种设备分类的基础上,进行的更加细致的划分。对稳态运行下电流不平稳的设备进行了单独处理。

2.3.3 不同运行状态下设备运行电流特征

由于设备在不同的运行状态下稳态电流不一定是平稳的,所以不是所有的设备都可以根据稳态电流的幅值进行运行状态的判别。因此,我们需要对 11 种用电器类别进行更细致的划分,其中可以使用电流的线性组合进行求解的设备有:

在这里插入图片描述

而 YD7 激光打印机、YD2 美的微波炉、YD4Thinkpad 笔记本电脑、以及 YD9 挂式空调都难以根据稳定状态下的电流大小判别设备的运行状态,而必须根据电流的波形进行状态的判断。因此我们对其状态进行单独判别。

在这里插入图片描述

图 2-42 激光打印机电流轨迹图

描述: FUJI 激光打印机属于有限多状态设备,但是打印机工作状态比较特殊,根据已知数据绘制的电流图如下左所示。前面两个峰值波动均为打印机开启状态下的暂态波动,第三个峰值为打印状态下的特征,第四个峰值为复印状态下的特征,复印暂态峰值更高,而扫描状态则维持在相对低的电流水平。

在这里插入图片描述

图 2-43 美的微波炉电流轨迹图

描述:美的微波炉属于有限多状态设备,一共有 6 种运行状态。下左图所示的电流轨迹图呈现出明显的“梳齿”状,而且电流幅值呈现一种缓慢下降,但是总体维持在高位水平。微波炉不同的运行状态不能够直接根据电流的幅值进行判别,而需要计算“占空比”,占空比是指微波炉高电流运行时间与低电流运行时间的比值,直观的体现是“梳齿”的宽度。例如:“低火”状态的微波炉,高电流运行时间短,低电流运行时间长;“中火”状态下,高电流运行时间相对变长,低电流运行时间变短。经过统计发现如下“占空比”特征,46 可以用于对微波炉运行状态进行判别。

表 2-8 微波炉不同档位“占空比”

在这里插入图片描述

在这里插入图片描述

图 2-44 ThinkPad 笔记本电脑电流轨迹图

描述:Thinkpad 笔记本电脑属于连续变状态设备,这类设备的稳态区段功率无恒定均值,而是在一个范围内连续变动,下左图明显表现出这种特征。而且不同状态下的电脑运行的电流轨迹差异非常的小,初步的想法是运用波形匹配的方法。

在这里插入图片描述

图 2-45 挂式空调电流轨迹图

描述:挂式空调属于连续变状态的设备。虽然在不同的档位下,空调的电流幅值处于不同高度,但是不会稳定在一定水平,下左图能够明显体现出来。但是空调还有明显的暂态特征,因此不能够简单根据电流的幅值对空调的运行状态进行判别,应该在此基础上根据波形的形状进行不同状态的判别。

2.3.4 运用线性组合的思想对设备组进行分析

线性组合是线性代数中具有如下形式的表达式。其中 V i V_i Vi​ 为任意类型的项, a i a_i ai​ 为标量。这些标量称为线性组合的系数或权。

w = a 1 ∗ v 1 + a 2 ∗ v 2 + a 3 ∗ v 3 + . . . + a n ∗ v n w= a_1*v_1+a_2*v_2+a_3*v_3+...+a_n*v_n w=a1​∗v1​+a2​∗v2​+a3​∗v3​+...+an​∗vn​

由电力知识可知,同一支路上的电流数据是会线性叠加的,而且 NILMD 设备收集上的数据就是一条之路上所有用电设备的电流的总合。在实际设备组运行过程中,不同时刻下各个用电设备处于不同的运行状态。根据之前描述的设备分类结果,我们可以知道除了YD7 激光打印机、YD2 美的微波炉、YD4Thinkpad 笔记本电脑、以及 YD9 挂式空调难以根据稳定状态下的电流大小判别设备的运行状态之外,其他的设备在稳定运行状态下的电流均为恒定值。因此设备组在运行过程中平稳运行状态的电流,一定是不同设备的稳定运行状态电流的叠加。而针对不能根据稳态电流判别的设备,采用具体问题具体分析方法。例如,计算微波炉的占空比判别状态,以及根据波形和电流幅值进行状态判别。

在这里插入图片描述

图 2-46 YD3+YD7 电流轨迹图

以 YD3+YD7 设备组为例,通过电流的波动情况不难发现 0-34 点位置电流平稳水平为8,用电设备均未开启。在 35 点的位置电流剧增到 7750,与热水壶开启状态电流水平相当,而且热水壶属于“ON/OFF”型设备。第 40 个点开始打印机开启,电流在热水壶开启的基础上发生了叠加,前两个波动是打印机开启的印迹,第三个波动的波形与打印机复印波形匹配相似度更高,第四个波动于打印机打印状态波形的匹配相似度更高。随后在 327 点电流急速下降 7748,关闭了热水壶。在 363 点,电流微微起伏是打印机进入扫描状态。随后在 417 点热水壶再度开启,425 点电流微微下降打印机关闭,442 点热水壶也再度关闭。

2.4 问题 4 分析方法与过程

2.4.1 流程图

在这里插入图片描述

图 2-47 问题四解决流程

在第四问需要解决的问题是:未知设备组中的设备类型,判别分析设备组中中各个设备的运行状态、操作以及计算实时用电量。然而第三问能够解决的是在已知设备组的情况下进行分析和判别,需要解出同样的答案,但是设备组的信息是未知的。因此,我们首先需要解决的是准确判别出设备组中拥有哪些设备,当我们能够准确判别设备组中的拥有的设备类型,我们就将第四问转化为第三问,再利用第三问中基于设备分类和稳态运行状态线性组合的思想对问题进行求解。

2.4.2 基于波形特征匹配的设备判别

每一种用电器都有其特定的运行特征,而这种特征可能是发生在设备开启状态下的暂态特征,也可以是设备稳定运行中的稳态特征。因为在组合设备的情况下,电流是会发生叠加的,因此分析所使用的数据依然是电流数据。明显的电流负荷印迹即使是在混合多种用电设备的状态下,依旧能够体现出来。因此,在未知设备组设备情况的条件下,我们可以根据各个用电器明显区别于其他设备的独特的明显的负荷印迹[9],可以实现设备组中设备数量和类型的监测。

提取出混合设备组中的发生突变的时间点前后的电流差值,将其与下表所统计出的各个用电设备的变换操作的电流变化值进行比较。由于不同的设备电流差异巨大,通过将目标变化值与各个用电设备的变换操作的电流值进行一一比较,选择最为接近的变化数值不难发现混合设备组中的设备构成。下表中的变换操作只列举出相关设备从低档位到高档位的变化,反向变化不赘述。

在这里插入图片描述
在这里插入图片描述
以上所属的方式能够对大部分用电设备进行判别,但是对于 YD7 激光打印机、YD2 美的微波炉、YD4Thinkpad 笔记本电脑、以及 YD9 挂式空调都难以根据稳定状态下的电流变化判别设备的运行状态,而必须根据电流的波形进行状态的判断。因为此四种设备波形十分明显,异于其他设备,因此通过对设备组电流进行可视化不难发现。

在这里插入图片描述

图 2-48 需特殊判别电器的波形特征图

微波炉在开启后会呈现出“梳齿”状,而且最高峰电流达到 6000。通过计算占空比可以判断状态。

表 2-16 微波炉占空比对应运行状态
在这里插入图片描述

右上角图是打印机的暂态特征,刚开启打印机没有进行任何操作就会出现。因此这个波形能够对打印机的存在性进行判别。笔记本的波形呈现波动状态,总体的电流水平维持在 220 左右。挂式空调在开启的瞬间电流水平会急速上升,随后会下降到稳定水平,但是稳态下电流也会存在一定的波动。

对于波形的量化描述,可以通过采样和计算损失函数确定。通过检测出的突变点,记录突变点前后的 20 个数值构造一个长度为 40 的波形特征数列。定义损失函数cost( x )。

c o s t ( x ) = 1 n ∗ ∑ i = 1 n ( x i − y i ) 2 cost(x)=\frac{1}{n}* \sum{i=1}^{n}(x_i-y_i)^2 cost(x)=n1​∗∑i=1n(xi​−yi​)2

其中 y i y_i yi​是波形的特征序列, x i x_i xi​是设备组电流突变点前后采样的波形特征。将 [ x 1 , x 2 , x 3 , . . . , x n ] [x_1,x_2,x_3,...,x_n] [x1​,x2​,x3​,...,xn​]与 [ y 1 , y 2 , y 3 , . . . , y n ] [y_1,y_2,y_3,...,y_n] [y1​,y2​,y3​,...,yn​]进行计算损失函数,损失最小的波形视作最为匹配的波形。据此,可以通过量化方法实现波形的匹配,从而实现设备组中设备组成分析。

2.4.3 基于线性组合的设备组状态分析

根据上述思路可以实现对已知设备组中成分的准确识别。在此基础上需要解决,已知设备组成判别各个设备运行状态的任务,也就是第三问需要解决的问题。据此,我们沿用第三问的解决方法,首先对设备进行精确分类。对稳态运行状态下电流恒定的设备统计其状态切换的电流差值,对于电流不平稳的设备根据波形、幅值或者其他统计指标判断其状态转化。在精确分类的基础上,结合线性组合的思想,判断设备组运行不同时刻下各个用电设备的状态的组合情况。

在这里插入图片描述

图 2-49 未知设备组 1 电流轨迹图

对附件 4 中设备组 1 进行具体分析。初始状态下电流为 9 为底部电流,在点 52 处电流上升了 183,在用电设备中与白炽灯最为接近,因此开启了白炽灯。随后在在点 57 处电流再度上升 140,与 1 档风扇最为接近,而且后续还存在阶梯状的上升,电流都会存在平稳状态。而且上升的值与风扇切换档位是最为贴合。因此判断设备组 1 中含有电风扇和白炽灯。

在这里插入图片描述

具体状态切换过程为:52 点处开启了白炽灯,57 点处开启了电风扇 1 档,122 点处风扇切换到 2 档,185 点处风扇开启 3 档,247 点关闭了风扇,311 点又开启了风扇 3 档,随后在 374 点关闭了风扇,387 点关闭了白炽灯。

3.结果分析

3.1 问题 1 结果分析

3.1.1 实时用电量计算结果

实时用电量计算公式:
W = P ∗ 100 / 3600 P = U ∗ I W=P*100/3600\\ P=U*I W=P∗100/3600P=U∗I

其中 W W W 为实时用电量,单位是 0.001 kwh; P P P 为功率,单位为 w。

在这里插入图片描述

图 3-1 Python 运行部分代码

下表所示是 YD1 截取的部分实时用电量计算结果。其余时间点以及其他设备的实时用电量计算按照相似方法进行,全部结果见 energy1.xlsx。

表 3-1 实时用电量部分数据
在这里插入图片描述

3.1.2 各用电设备运行特征

1)YD1(奥克斯风扇)

特征描述:奥克斯风扇属于有限多状态设备,一共具有 4 种状态,电流呈现阶梯状的改变,每达到一种运行稳态后电流会趋于平稳的状态。但是档位发生切换的瞬间会存在暂态特征。
在这里插入图片描述
2)YD2(美的微波炉)

特征描述:美的微波炉属于有限多状态设备,一共有 6 种运行状态,电流轨迹图呈现出明显的“梳齿”状,而且电流幅值呈现一种缓慢下降,但是总体维持在高位水平。微波炉不同的运行状态不能够直接根据电流的幅值进行判别,而需要计算“占空比”,占空比是指微波炉高电流运行时间与低电流运行时间的比值。例如:“低火”状态的微波炉,高电流运行时间短,低电流运行时间长;“中火”状态下,高电流运行时间相对变长,低电流运行时间变短。

在这里插入图片描述
3)YD3(九阳热水壶)

特征描述:九阳热水壶属于“ON/OFF”型设备,只有开启和关闭两种状态,开启状态下电流相对平稳,而且热水壶暂态不明显。
在这里插入图片描述

4)YD4(Thinkpad 笔记本电脑)

特征描述:Thinkpad 笔记本电脑属于连续变状态设备,这类设备的稳态区段功率无恒定均值,而是在一个范围内连续变动。

5)YD5(白炽灯)

特征描述:白炽灯与九阳热水壶类似,同属于“ON/OFF”型设备,只有开启和关闭两种状态,开启状态下电流相对平稳,而且白炽灯暂态也不明显。
在这里插入图片描述
6)YD6(节能灯)

特征描述:节能灯与白炽灯相似,同属于“ON/OFF”型设备,只有开启和关闭两种状态,开启状态下电流相对平稳但是低于白炽灯,而且节能灯暂态相对明显。
在这里插入图片描述
7)YD7(FUJI 激光打印机)

特征描述:FUJI 激光打印机属于有限多状态设备,但是打印机工作状态比较特殊,前面两个峰值波动均为打印机开启状态下的暂态波动,第三个峰值为打印状态下的特征,第四个峰值为复印状态下的特征,复印暂态峰值更高,而扫描状态则维持在相对低的电流水平。

8)YD8(饮水机)

特征描述:饮水机有 5 种运行状态,属于有限多状态设备。不同运行状态下的电流处于不同的峰值,而且稳态下的电流相对平稳,但是饮水机状态切换存在一定的暂态波动。

在这里插入图片描述
9)YD9(挂式空调)

特征描述:挂式空调属于连续变状态的设备。虽然在不同的档位下,空调的电流幅值处于不同高度,但是不会稳定在一定水平,下左图能够明显体现出来。但是空调还有明显的暂态特征,因此不能够简单根据电流的幅值对空调的运行状态进行判别,应该在此基础上根据波形的形状进行判别。

10)YD10(奔腾电吹风)

特征描述:奔腾电吹风有 5 种运行状态,属于有限多状态设备。类似于饮水机,不同运行状态下的电流处于不同的峰值,而且稳态下的电流相对平稳,但是状态切换存在一定的暂态波动。
在这里插入图片描述
11)YD11(创维电视机)

特征描述:创维电视机只有开启、关闭两种状态,属于“ON/OFF”型设备。开启状态下,电流相对平稳,但是开启的瞬间存在明显的暂态。
在这里插入图片描述

3.2 问题 2 结果分析

3.2.1 附件 2 设备 1 判别分析

设备 1 的谐波电压数据存在缺失,因此我们根据流程图选择最近邻的方法对设备 1 进行判别分析。具体的运用最近邻分析的流程不赘述。下图是根据最大功率绘制的(P, Q)图。

在这里插入图片描述

图 3-2 11 种设备(P,Q)图

由于每种设备对应的(P,Q)位置如上图所示,而且这种位置不会随着设备运行状态发生改变,因此可以根据最近邻算法计算位置设备与上述 11 种设备的欧氏距离,并将其判别为距离最近的那种设备的类型。我们采用 matlab 工具进行最近邻判别分析。Matlab 计算过程如下。

在这里插入图片描述

图 3-3 matlab 部分运行代码

在这里插入图片描述

图 3-4 matlab 运行截图

判别结果:设备 1 的参数与 YD8 最为接近,可初步判断为 YD8 。

运用电流-电压轨迹图进行验证,下左图为设备 1 的轨迹图,下右图为 YD8 的轨迹图,非常相似,进一步说明基于最近邻的判别结果是正确的。
在这里插入图片描述

图 3-5 运用电流电压轨迹图验证设备 1

3.2.2 附件 2 设备 2 判别分析

基于 SVM 的数据清洗以及学习过程的代码均在附件 1 之中,最终基于 SVM 的多类别分类器准确率在 93.08%。但是在对附件 2 中的数据进行判别时发现,附件 2 中的设备 1 存在数据缺失,谐波电压的按频率采样的数据全部缺失,导致基于 SVM 的判别模型中的特征难以起到分类效果。在数据未缺失的情况下,我们对附件 2 中的设备 2 进行判别,判别结果为设备 9。由于基于 SVM 判别模型中大量采用了谐波电压作为判别特征,而实际数据中存在缺失,我们在此基础上提出了基于最近邻的判别模型。基于 SVM的判别方法运用的是 python实现。

在这里插入图片描述

图 3-6 运用 python 训练模型在测试集上测试

在这里插入图片描述

图 3-7 运用训练好的模型对设备组 2 进行判别

对于设备 2 判别结果为 YD9。

运用电流-电压轨迹图进行验证,下左图为设备 1 的轨迹图,下右图为 YD9 的轨迹图,非常相似,进一步说明基于 SVM 的判别结果是正确的。
在这里插入图片描述

图 3-8 运用电流电压轨迹图验证设备 2

3.3 问题 3 结果分析

3.3.1 附件 3 设备组 4-YD2+YD8 各用电设备分析

在这里插入图片描述

根据上述的解决思路,在已知设备组构成的情况下,通过对设备进行细致划分,统计相应的稳态电流的值以及相应的波形,运用线性组合的思想分析出相关的操作如下。具体计算的实时用电量见 energy3.xlsx。

在这里插入图片描述

3.3.2 附件 3 设备组 5-YD3+YD5+YD11 各用电设备分析

在这里插入图片描述
根据上述的解决思路,在已知设备组构成的情况下,通过对设备进行细致划分,统计相应的稳态电流的值以及相应的波形,运用线性组合的思想分析出相关的操作如下。具体计算的实时用电量见 energy3.xlsx。

在这里插入图片描述

3.3.3 附件 3 设备组 6-YD1+YD2+YD3+YD6+YD7 各用电设备分析

在这里插入图片描述

根据上述的解决思路,在已知设备组构成的情况下,通过对设备进行细致划分,统计相应的稳态电流的值以及相应的波形,运用线性组合的思想分析出相关的操作如下。具体计算的实时用电量见 energy3.xlsx。
在这里插入图片描述
在这里插入图片描述

3.4 问题 4 结果分析

3.4.1 附件 4 设备组 1 各用电设备判别及状态分析

在这里插入图片描述

对于设备组 1 通过第二部分阐述的方法,判别出设备组 1 含有 YD1 和 YD5。结合解决第三题的思路解得对应的操作时间如下。
在这里插入图片描述

3.4.2 附件 4 设备组 2 各用电设备判别及状态分析

在这里插入图片描述
对于设备组 2 通过第二部分阐述的方法,判别出设备组 2 含有 YD1、YD2 和 YD3。结合解决第三题的思路解得对应的操作时间如下。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.4.3 附件 4 设备组 3 各用电设备判别及状态分析

在这里插入图片描述
对于设备组 3 通过第二部分阐述的方法,判别出设备组 3 含有 YD1、YD2、YD3、YD5 和YD11。结合解决第三题的思路解得对应的操作时间如下。
在这里插入图片描述
在这里插入图片描述

4.结论

运用机器学习以及数学建模等思想对 NILMD 装置获取到的整个线路上的电力数据进行分析和挖掘,从中“分解”出单个用电设备的独立用电数据。一方面,对于电力公司准确预测电力负荷、科学制定电力调配方案、提高系统稳定性和可靠性具有重要意义;另一方面,对于用户而言可以了解用电器的使用情况,科学合理用电,减少用电隐患。本文针对由简入繁、由易到难的四个目标,提出了相应的解决思路。综合运用 SVM、最近邻、可视化、线性组合、特征匹配等方法,对电力数据分解提出了一套解决办法。

每种用电设备都有其独特的负荷印迹,从 NILMD 装置获取的数据中,提取出单一设备的特征,能够实现对未知单一设备的准确判别。在此基础上,结合电学规律不难分析出,设备组总线路上的电流是由各个设备在不同状态下组合出的结果。在对设备进行精准分类和特征统计的基础上,运用线性组合的思想能够实现对已知设备组内不同设备状态的综合分析。从单一设备中提取出能够唯一判别的特征库,将未知设备组状态分解与之进行特征匹配,能够实现对未知设备组内设备类型的准确判别。借此,再通过设备分类和线性组合的思想,能够实现对未知设备组内不同设备状态的综合分析。

本次电力数据挖掘的分析过程中,进行了大量的数据整理、拆分以及可视化的工作,实验中的每个步骤都有理论依据,整个数据分析与挖掘的流程十分明确、逻辑鲜明、条理清晰。然而在实际操作过程中也遇到一些挑战,尤其是在解决最后两个问题的时候我们发现了更多的解决思路,可能会对现有方法的进行很好的改进。例如:在判别混合设备组中含有哪些设备时,我们采用的是提取丰富的特征库,然后通过定义损失函数的方式进行判别,将混合设备组特征进行拆分与特征库进行匹配,从而判断设备组的组成。随后我们发现于此采用 CNN的方法可能会有更好的结果[10]。然而,一方面受比赛时间的限制,其次团队本身也需要不断地学习新的知识和方法。在后续的研究学习过程之中,我们将尝试使用全新的解决思路,对目标问题提出更加自动化的解决方案。

5.参考文献

[1].余贻鑫,刘博与栾文鹏,非侵入式居民电力负荷监测与分解技术. 南方电网技术, 2013(04): 第1-5页.

[2].崔灿,面向智能用电的非侵入式居民负荷监测关键技术研究, 2017,华北电力大学(北京).

[3].李雨轩,非侵入式负荷分解算法的综合研究, 2016, 北京交通大学.

[4].王志超,住宅用电负荷的非侵入式监测方法研究, 2015, 重庆大学.

[5].程祥等,非侵入式负荷监测与分解研究综述. 电网技术, 2016(10): 第3108-3117页.

[6].余小鹏与周德翼, 一种自适应k-最近邻算法的研究. 计算机应用研究, 2006(02): 第70-72页.

[7].龙伟,基于智能电表的数据分析, 2017, 深圳大学.

[8].牛卢璐,基于暂态过程的非侵入式负荷监测, 2010, 天津大学.

[9].刘博,非侵入式电力负荷监测与分解技术, 2014, 天津大学.

[10].姜波,基于深度学习的非侵入式住宅用电负荷分解方法, 2017, 合肥工业大学.

标签:状态,泰迪杯,轨迹,判别,设备组,数据挖掘,挑战赛,电流,设备
来源: https://blog.csdn.net/weixin_47922824/article/details/115716132