摘 "要: 針對(duì)在接入新負(fù)荷時(shí)傳統(tǒng)非侵入式負(fù)荷識(shí)別算法會(huì)產(chǎn)生誤分類(lèi)的問(wèn)題,提出一種基于三元組損失(Triplet Loss)和KNN的非侵入式未知負(fù)荷識(shí)別算法。首先,采用負(fù)荷穩(wěn)態(tài)運(yùn)行時(shí)的電流、電壓構(gòu)造多特征融合的彩色V?I軌跡圖像;然后,挖掘在線的Semi?Hard樣本對(duì),使用Triplet Loss訓(xùn)練神經(jīng)網(wǎng)絡(luò),并得到各樣本的特征向量;最后,對(duì)特征向量進(jìn)行PCA降維,并基于類(lèi)中心構(gòu)造鄰域,使用KNN算法來(lái)進(jìn)行負(fù)荷識(shí)別。使用PLAID、COOLL數(shù)據(jù)集對(duì)所提算法進(jìn)行測(cè)試。測(cè)試結(jié)果表明,所提的負(fù)荷識(shí)別算法在已知類(lèi)別負(fù)荷的分類(lèi)和未知負(fù)荷的識(shí)別方面均有較高的準(zhǔn)確率。
關(guān)鍵詞: 三元組損失; KNN; 非侵入式負(fù)荷監(jiān)測(cè); V?I軌跡; PCA降維; 特征融合
中圖分類(lèi)號(hào): TN911?34; TP18; TM714 " " " " " " " "文獻(xiàn)標(biāo)識(shí)碼: A " " " " " " " "文章編號(hào): 1004?373X(2024)18?0008?07
Non?intrusive unknown load identification based on Triplet Loss and KNN
ZHANG Sheng1, 2, CHEN Tie1, 2
(1. College of Electrical Engineering and New Energy, China Three Gorges University, Yichang 443002, China;
2. Hubei Provincial Key Laboratory for Operation and Control of Cascaded Hydropower Station, Yichang 443002, China)
Abstract: In allusion to the problems of misclassification of traditional non?intrusive load identification algorithm when new load is connected, a non?intrusive unknown load identification algorithm based on Triplet Loss and KNN (K?nearest neighbor) is proposed. The multi?feature fusion color V?I trajectory image is constructed by means of the current and voltage of the load during steady state operation. The online Semi?Hard sample pairs are mined, and the Triplet Loss is used to training neural network, so as to obtain feature vectors for each sample. The PCA (principal component analysis) dimensionality reduction for feature vectors is conducted, the neighbourhood is constructed based on the class center, and the KNN algorithm is used for the load identification. The algorithm is tested by means of PLAID and COOLL datasets. The testing results show that the proposed load identification algorithm has high accuracy in both the classification of known loads and the recognition of unknown loads.
Keywords: Triplet Loss; KNN; non?intrusive load monitoring; V?I trajectory; PCA dimensionality reduction; feature fusion
0 "引 "言
隨著全球能源消耗的加劇和環(huán)境問(wèn)題的日益突出,“碳達(dá)峰、碳中和”成為了國(guó)際社會(huì)共同關(guān)注的問(wèn)題。建筑用電產(chǎn)生的碳排放量至少占全球的[14],其向用戶(hù)提供實(shí)時(shí)的家庭用電信息,可以幫助用戶(hù)改善用電習(xí)慣,減少5%~20%的能源浪費(fèi)。負(fù)荷監(jiān)測(cè)是實(shí)現(xiàn)居民電力需求側(cè)管理的主要手段,非侵入式負(fù)荷監(jiān)測(cè)(Non?Intrusive Load Monitoring, NILM)通過(guò)分析總線端的用電信息來(lái)獲得每個(gè)電器的運(yùn)行情況和能耗信息。相比于侵入式負(fù)荷監(jiān)測(cè),NILM避免了繁雜傳感器的安裝,具有保護(hù)隱私、易推廣、易維護(hù)等優(yōu)點(diǎn),有助于電力公司了解用戶(hù)用電情況,制定合理的計(jì)費(fèi)策略和規(guī)劃電力系統(tǒng)的調(diào)度[1],并幫助用戶(hù)減少不必要的用電消費(fèi),實(shí)現(xiàn)節(jié)能[2]。
負(fù)荷特征提取和識(shí)別一直是NILM的研究熱點(diǎn)。文獻(xiàn)[3]中首次提出非侵入式負(fù)荷監(jiān)測(cè)的概念,并利用總線端穩(wěn)態(tài)功率的變化來(lái)進(jìn)行負(fù)荷辨識(shí)。文獻(xiàn)[4]中研究了頻率波動(dòng)對(duì)諧波特征提取效果的影響,并針對(duì)該影響因素提出相應(yīng)的方法,提升了基于諧波進(jìn)行負(fù)荷辨識(shí)的精度。文獻(xiàn)[5]中提出V?I軌跡的概念,根據(jù)電壓、電流形成V?I軌跡,并用層次聚類(lèi)的方法對(duì)電器分類(lèi)。相比于傳統(tǒng)的功率特征以及電流波形特征,該方法能更有效地對(duì)電器進(jìn)行分類(lèi),但缺點(diǎn)在于需要從V?I軌跡中手動(dòng)提取特征。文獻(xiàn)[6]中將V?I軌跡映射到二進(jìn)制單元格中,再利用有監(jiān)督的自組織映射(Supervised Self?Organizing Map, SSOM)進(jìn)行負(fù)荷辨識(shí)。文獻(xiàn)[7]中在灰色V?I軌跡圖的基礎(chǔ)上先將電流、電壓、相位信息分別嵌入到RGB通道上實(shí)現(xiàn)多維特征的融合,再用AlexNet網(wǎng)絡(luò)進(jìn)行負(fù)荷辨識(shí),取得了不錯(cuò)的效果。文獻(xiàn)[8]中采用負(fù)荷啟停時(shí)的暫態(tài)功率波形,以模板匹配的方式辨識(shí)負(fù)荷。
非侵入式負(fù)荷識(shí)別方法在閉集場(chǎng)景下有著不錯(cuò)的效果,然而在現(xiàn)實(shí)應(yīng)用場(chǎng)景中含有大量訓(xùn)練集未包含的未知電器,采用以上方法無(wú)法識(shí)別未知類(lèi)。為解決這個(gè)問(wèn)題,文獻(xiàn)[9]通過(guò)提取負(fù)荷穩(wěn)態(tài)電流的1~9次奇次諧波,采用K近鄰算法(K?Nearest Neighbor, KNN)進(jìn)行未知負(fù)荷檢測(cè),然而采用諧波不能全面反映負(fù)荷的電氣特性。文獻(xiàn)[10]采用孿生網(wǎng)絡(luò)依次計(jì)算樣本V?I軌跡與特征庫(kù)中各V?I軌跡的相似性,并通過(guò)多次實(shí)驗(yàn)設(shè)定相似度閾值和兩個(gè)功率閾值,以此來(lái)判斷未知負(fù)荷或分類(lèi)已知負(fù)荷。然而閾值的設(shè)定存在一定的主觀性和依賴(lài)性,在實(shí)際應(yīng)用中表現(xiàn)不佳。文獻(xiàn)[11]基于度量學(xué)習(xí)對(duì)電流波形進(jìn)行特征映射,然后設(shè)定閾值并根據(jù)余弦相似度對(duì)未知負(fù)荷進(jìn)行檢測(cè)。但該文獻(xiàn)并沒(méi)有針對(duì)閾值的設(shè)定以及未知負(fù)荷辨識(shí)進(jìn)行討論,同樣存在特征表示不足的問(wèn)題。
非侵入式負(fù)荷識(shí)別作為分類(lèi)任務(wù),將數(shù)值特征與圖像特征相結(jié)合的彩色V?I軌跡相比于其他特征更具有區(qū)分性[7]?,F(xiàn)有研究表明,由三元組損失(Triplet Loss)訓(xùn)練的網(wǎng)絡(luò)相比于傳統(tǒng)分類(lèi)用的softmax提取到的特征類(lèi)內(nèi)差異小,類(lèi)間差異大,這為未知負(fù)荷留有一定的特征空間,從而為未知負(fù)荷識(shí)別創(chuàng)造了條件[12]。文獻(xiàn)[13]中使用Triplet Loss訓(xùn)練的網(wǎng)絡(luò)對(duì)已知類(lèi)別特征進(jìn)行表示,然后對(duì)每類(lèi)聚類(lèi)中心進(jìn)行建模,采用極值理論進(jìn)行開(kāi)集自動(dòng)調(diào)制識(shí)別。文獻(xiàn)[14]中使用Cosine Loss和Triplet Loss訓(xùn)練嵌入空間,使用概率判別的方法進(jìn)行患者活動(dòng)的開(kāi)集識(shí)別。同時(shí),文獻(xiàn)[15]采用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取,結(jié)合KNN識(shí)別,相比于其他方法能更有效地進(jìn)行開(kāi)集故障診斷。
為此,本文提出一種基于Triplet Loss和KNN的非侵入式未知負(fù)荷識(shí)別方法。首先,提取負(fù)荷穩(wěn)態(tài)電流,并引入電流、電壓和相位信息,構(gòu)建彩色V?I軌跡;其次,使用訓(xùn)練集訓(xùn)練三元組損失的神經(jīng)網(wǎng)絡(luò);然后,將訓(xùn)練集和測(cè)試集軌跡圖像映射為固定長(zhǎng)度的特征向量,再用PCA降維保留主要特征,去除冗余信息;最后,基于訓(xùn)練集的特征,使用KNN進(jìn)行已知負(fù)荷的分類(lèi)和未知負(fù)荷識(shí)別。在PLAID和COOLL數(shù)據(jù)集上的算例分析驗(yàn)證了所提方法的可用性和準(zhǔn)確性。
1 "基于Triplet Loss和KNN的非侵入式未知負(fù)荷識(shí)別模型
1.1 "非侵入式未知負(fù)荷識(shí)別模型總體流程
本文所提出的非侵入式未知負(fù)荷識(shí)別模型流程如圖1所示。
1.2 "彩色V?I軌跡圖像特征的構(gòu)建
V?I軌跡是當(dāng)電器處于穩(wěn)態(tài)運(yùn)行時(shí),以一個(gè)完整周期內(nèi)的電壓和電流數(shù)據(jù)繪制而成的二維圖像。彩色V?I軌跡是由部分電氣特征與原始V?I軌跡融合得到的,相比于單一的軌跡特征,復(fù)合的特征因含有更多的信息,能更有效地區(qū)分不同的電器[16]。本文將V?I軌跡映射到數(shù)值矩陣中,通過(guò)構(gòu)造RGB三個(gè)顏色通道的數(shù)值矩陣對(duì)特征進(jìn)行融合,其流程如下所示。
1) 通過(guò)事件檢測(cè),對(duì)事件發(fā)生前后的穩(wěn)態(tài)電流作差,得到單個(gè)電器的穩(wěn)態(tài)電流波形數(shù)據(jù)。
2) 將與電流波形同時(shí)間段內(nèi)電壓首次達(dá)到峰值的時(shí)間點(diǎn)作為一個(gè)穩(wěn)態(tài)周期的初始采樣點(diǎn)。
3) 為了平滑信號(hào)并減少噪聲的影響,對(duì)所提取的一個(gè)周期內(nèi)的電壓和電流信號(hào)進(jìn)行移動(dòng)平均處理,處理后的電流和電壓值分別為:
[im=1wk=mm+wikvm=1wk=mm+wvk, " m=0,1,2,…,M-w] (1)
式中:vm、im分別為移動(dòng)平均處理后得到的電壓和電流采樣點(diǎn)的值;vk、ik分別為處理前電壓和電流采樣點(diǎn)中第k個(gè)采樣點(diǎn)的值;M為一個(gè)穩(wěn)態(tài)周期的采樣點(diǎn)數(shù);w為移動(dòng)窗口的寬度。
4) 假設(shè)采用的V?I軌跡矩陣大小為N×N,通過(guò)對(duì)移動(dòng)平均處理后的電壓和電流進(jìn)行最大最小值歸一化,并乘以矩陣寬度N,得到穩(wěn)態(tài)周期內(nèi)電壓和電流采樣點(diǎn)在V?I軌跡矩陣中映射的坐標(biāo)。
[xm=ceilvm-vminvmax-vminN] (2)
[ym=ceilim-iminimax-iminN] (3)
式中:xm、ym分別為電壓和電流映射在矩陣中的橫坐標(biāo)和縱坐標(biāo);vm、im分別為移動(dòng)平均處理后的電壓和電流中第m個(gè)采樣點(diǎn);vmin、imin分別為移動(dòng)平均處理后一個(gè)穩(wěn)態(tài)周期內(nèi)電壓和電流最小值;vmax、imax分別為移動(dòng)平均處理后一個(gè)穩(wěn)態(tài)周期內(nèi)電壓和電流最大值;ceil(·)表示向上取整函數(shù)。
5) 為了使得V?I軌跡連續(xù),對(duì)軌跡進(jìn)行插值處理。
6) 鑒于當(dāng)3個(gè)RGB通道元素值均為1時(shí),圖像顯示為白色,故構(gòu)造3個(gè)N×N大小的RGB矩陣,初始值均置為1。
7) 采用文獻(xiàn)[7]的方法分別計(jì)算RGB矩陣中電流、電壓信息以及相位特征的元素值,并嵌入各矩陣中,得到彩色V?I軌跡。與文獻(xiàn)[7]不同的是,為了將3個(gè)通道的像素值限制在0~1內(nèi),對(duì)于G通道,采用以下的式子進(jìn)行縮放并正確映射到0~1中。
[G(rj,cj)=G(rj,cj)+vj(2V)+12)A(rj,cj)] (4)
式中:G為RGB圖像的G通道;rj、cj分別為對(duì)應(yīng)圖像矩陣的橫坐標(biāo)與縱坐標(biāo);vj為第j個(gè)點(diǎn)的電壓值;V為負(fù)荷電壓差最大值;A為次數(shù)矩陣,每個(gè)元素值為采樣點(diǎn)映射到軌跡中對(duì)應(yīng)坐標(biāo)重復(fù)次數(shù)。
1.3 "Triplet Loss神經(jīng)網(wǎng)絡(luò)的構(gòu)建
三元組損失的神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)孿生網(wǎng)絡(luò)的構(gòu)造不同,訓(xùn)練時(shí),其輸入由一個(gè)錨點(diǎn)、正樣本(與錨點(diǎn)屬于同一類(lèi))和一個(gè)負(fù)樣本(與錨點(diǎn)不同類(lèi))構(gòu)成,目的是學(xué)習(xí)一種特征映射,使得同類(lèi)間特征向量差距縮小,異類(lèi)間特征向量差距放大,相比于孿生網(wǎng)絡(luò)降低了在遇到相似類(lèi)別時(shí)誤判的概率[11,17?18]。其通過(guò)將一組樣本對(duì)輸入到三元組損失網(wǎng)絡(luò)的共享層,對(duì)提取到的特征向量進(jìn)行損失函數(shù)運(yùn)算,并進(jìn)行網(wǎng)絡(luò)參數(shù)的更新。損失函數(shù)L公式如下:
[L=max0,m+Dfxa,fxp-Dfxa,fxn] (5)
式中:xa、xp、xn分別代表錨點(diǎn)樣本、正樣本、負(fù)樣本;f(·)代表三元組網(wǎng)絡(luò)共享層的映射;D(·,·)代表兩個(gè)點(diǎn)歐氏距離的運(yùn)算;m表示正負(fù)樣本距離的閾值。
本文采用卷積層、池化層、批量歸一化層以及全連接層作為神經(jīng)網(wǎng)絡(luò)的共享層部分,并增加Dropout防止過(guò)擬合,來(lái)提取V?I軌跡圖像的特征。以共享層最后一層取128維的全連接層為例,其網(wǎng)絡(luò)結(jié)構(gòu)如表1所示。
卷積層和池化層填充方式均為“same”,卷積層激活函數(shù)均為ReLU,步長(zhǎng)大小均為1。
并不是所有的樣本對(duì)都能通過(guò)式(5)使得梯度下降。Easy樣本對(duì)自然滿(mǎn)足式(5),其損失函數(shù)為0;Hard樣本對(duì)中,負(fù)樣本與錨點(diǎn)之間的距離太遠(yuǎn),訓(xùn)練時(shí)模型難以收斂,導(dǎo)致訓(xùn)練不穩(wěn)定[11];Semi?Hard樣本對(duì)可以幫助模型更好地學(xué)習(xí)到數(shù)據(jù)之間的差異。本文通過(guò)在線挖掘Semi?Hard樣本對(duì)進(jìn)行訓(xùn)練。
1.4 "基于PCA降維和KNN的識(shí)別方法
1.4.1 "基于PCA的特征降維
對(duì)于通過(guò)1.3節(jié)神經(jīng)網(wǎng)絡(luò)提取到的高維特征向量,向量之間存在著內(nèi)在的相關(guān)性,如果不進(jìn)行降維,后續(xù)的分類(lèi)器在運(yùn)算時(shí)會(huì)有較高運(yùn)算量且特征之間會(huì)產(chǎn)生冗余。本文采用主成分分析(Principal Component Analysis, PCA)進(jìn)行降維,計(jì)算步驟如下。
1) 構(gòu)建含有m條、特征數(shù)為n維的數(shù)據(jù)集矩陣[X=x1,x2,…,xi,…,xm]。
2) 對(duì)所有樣本進(jìn)行中心化:
[xi←xi-1mi=1mxi] (6)
3) 計(jì)算協(xié)方差矩陣:
[C=1mXXT] (7)
4) 計(jì)算協(xié)方差矩陣特征值和特征向量,將特征值從大到小進(jìn)行排序,根據(jù)該順序下的特征值可以進(jìn)行方差貢獻(xiàn)率的累計(jì)。本文選擇貢獻(xiàn)率達(dá)到99%時(shí)求取K個(gè)特征向量并組成系數(shù)矩陣W。
5) 降維后的數(shù)據(jù)為:
[X'=WTX] (8)
1.4.2 "KNN算法
KNN作為一種常見(jiàn)的機(jī)器學(xué)習(xí)算法,無(wú)需訓(xùn)練,常被用于分類(lèi)任務(wù)中。KNN在進(jìn)行分類(lèi)時(shí)計(jì)算測(cè)試樣本到特征庫(kù)中所有樣本的歐氏距離,并選取最近的K個(gè)樣本,選擇所屬類(lèi)別最多的類(lèi)作為分類(lèi)結(jié)果。
1.4.3 "基于PCA降維和KNN識(shí)別模型的構(gòu)建
本文提出的KNN負(fù)荷識(shí)別流程如圖2所示。在1.3節(jié)對(duì)特征進(jìn)行映射后,對(duì)其進(jìn)行PCA降維和歸一化處理,以確保特征之間的尺度一致。本文KNN算法中K值選取為1,根據(jù)歐氏距離選擇距新樣本最鄰近的樣本,再計(jì)算該樣本所屬類(lèi)的中心,選擇一個(gè)距離判據(jù)進(jìn)行判斷,若新樣本到最鄰近樣本的距離dnear大于該值,則認(rèn)為是未知樣本,否則認(rèn)為屬于該類(lèi)。
與文獻(xiàn)[10]選擇固定的距離閾值以及與每個(gè)樣本兩兩計(jì)算相似度的做法不同,本文對(duì)每個(gè)類(lèi)分別進(jìn)行距離閾值的設(shè)定。鑒于閾值選擇為所有該類(lèi)樣本到該類(lèi)中心距離的最大值時(shí),會(huì)因?yàn)椴糠之惓|c(diǎn)的存在而導(dǎo)致距離閾值變大,會(huì)將其他類(lèi)別的樣本識(shí)別為該類(lèi),以及選擇最小值時(shí)易將該類(lèi)別的樣本點(diǎn)識(shí)別為未知類(lèi)別,故本文選擇將鄰近樣本所屬類(lèi)別的樣本到該類(lèi)中心所有距離的平均值作為每個(gè)類(lèi)別的動(dòng)態(tài)閾值,進(jìn)行已知類(lèi)別的分類(lèi)和未知類(lèi)別的識(shí)別。
2 "算例分析
2.1 "實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集選取
本文實(shí)驗(yàn)中CPU為Intel i5?8400,主頻為2.80 GHz,GPU為NVIDIA GeForce GTX 1050 Ti,RAM為24.0 GB,軟件平臺(tái)為Python 3.6、TensorFlow 2.3框架。
采用公共數(shù)據(jù)集PLAID2014[19]和COOLL[20]驗(yàn)證本文方法。其中PLAID2014包含以30 kHz采樣的55戶(hù)家庭的11類(lèi)共235臺(tái)電器的電壓電流數(shù)據(jù),總共為1 074條??紤]到PLAID2014中不同類(lèi)別電器樣本量差距較大,采用合成少數(shù)類(lèi)過(guò)采樣技術(shù)(SMOTE)對(duì)少數(shù)類(lèi)進(jìn)行擴(kuò)充。擴(kuò)充后每類(lèi)樣本為175個(gè),共1 925個(gè)樣本。COOLL數(shù)據(jù)集包含以100 kHz采集的12類(lèi)42臺(tái)電器的電壓電流數(shù)據(jù),每臺(tái)電器20條數(shù)據(jù),總共為840條。PLAID2014和COOLL數(shù)據(jù)集中各類(lèi)電器均包含不同品牌設(shè)備,每個(gè)品牌設(shè)備之間的電氣信息也有所差異。為了驗(yàn)證本文算法在不同情景下的識(shí)別能力,對(duì)于PLAID2014數(shù)據(jù)集,選取其全部的數(shù)據(jù)來(lái)研究本文算法在不同品牌間的泛化能力;而對(duì)于COOLL數(shù)據(jù)集,從中選取部分電器,并采用隨機(jī)采樣的方法擴(kuò)充每個(gè)電器的樣本,由20個(gè)擴(kuò)充到60個(gè),共900個(gè)樣本,如表2所示,用來(lái)研究本文算法在單個(gè)電器上的識(shí)別能力。對(duì)于以上數(shù)據(jù)集,每類(lèi)隨機(jī)選取20個(gè)樣本作為測(cè)試集,剩余樣本作為訓(xùn)練集。
2.2 "評(píng)價(jià)指標(biāo)
為了評(píng)估本文算法的識(shí)別能力,采用分類(lèi)任務(wù)中常用的評(píng)價(jià)指標(biāo),如混淆矩陣和準(zhǔn)確率來(lái)對(duì)識(shí)別結(jié)果進(jìn)行評(píng)價(jià)。混淆矩陣的縱軸代表電器的實(shí)際類(lèi)別,橫坐標(biāo)代表預(yù)測(cè)的類(lèi)別,從混淆矩陣可以直觀地知道電器的識(shí)別情況。準(zhǔn)確率指的是識(shí)別正確的樣本個(gè)數(shù)與測(cè)試總樣本個(gè)數(shù)之比,其公式為:
[Aaccuracy=NtrueNtotal] (9)
式中:Ntrue指正確識(shí)別的樣本個(gè)數(shù);Ntotal指測(cè)試樣本總數(shù)。
2.3 "PLAID數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
利用1.2節(jié)的方法構(gòu)造負(fù)荷樣本,考慮到軌跡分辨率過(guò)低時(shí)不足以將特征充分表達(dá),以及過(guò)高時(shí)會(huì)存在噪聲干擾,本文參考文獻(xiàn)[21],將軌跡矩陣的大小設(shè)置為64×64。同時(shí)為了適應(yīng)網(wǎng)絡(luò)的輸入,將圖像大小針對(duì)輸入層調(diào)整為224×224×3,每類(lèi)留下20個(gè)樣本作為測(cè)試集,剩余的作為訓(xùn)練集。
首先,驗(yàn)證本文方法對(duì)于已知類(lèi)的分類(lèi)能力。訓(xùn)練時(shí)batch size設(shè)置為32,epoch為300輪,由于模型最后使用L2正則化,將每個(gè)樣本的L2范數(shù)歸一化為1,鑒于訓(xùn)練難易度,默認(rèn)設(shè)置損失函數(shù)中的m為1。最后采用初始學(xué)習(xí)率為0.001的Adam優(yōu)化器對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化。訓(xùn)練完后用測(cè)試集對(duì)模型進(jìn)行測(cè)試,混淆矩陣結(jié)果如圖3所示。其中按照0~10進(jìn)行編號(hào)的類(lèi)別分別為空調(diào)、熒光燈、風(fēng)扇、冰箱、吹風(fēng)機(jī)、加熱器、白熾燈、計(jì)算機(jī)、微波爐、吸塵器、洗衣機(jī),被識(shí)別為未知負(fù)荷時(shí)標(biāo)記為-1。
由圖3可以看出:冰箱分別有一個(gè)和兩個(gè)樣本與風(fēng)扇、白熾燈產(chǎn)生了混淆;風(fēng)扇、冰箱、吸塵器、洗衣機(jī)均有個(gè)別樣本被識(shí)別為未知負(fù)荷,其原因是電器不同品牌或運(yùn)行狀態(tài)特征差異較大;其他負(fù)荷均未發(fā)生誤分類(lèi),且該方法能夠有效識(shí)別電氣特征類(lèi)似的負(fù)荷,如加熱設(shè)備、吹風(fēng)機(jī)和加熱器等。絕大部分負(fù)荷識(shí)別準(zhǔn)確率為100%,平均識(shí)別準(zhǔn)確率為96.3%。
為說(shuō)明本文算法在負(fù)荷識(shí)別方面的有效性,將其與其他文獻(xiàn)方法進(jìn)行對(duì)比,均采用PLAID數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),結(jié)果如表3所示。
其中,文獻(xiàn)[22]使用兩個(gè)特征提取網(wǎng)絡(luò)對(duì)V?I軌跡和功率特征進(jìn)行提取并融合,再訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類(lèi)。文獻(xiàn)[23]采用卷積和BP神經(jīng)網(wǎng)絡(luò)分別對(duì)軌跡的圖像特征以及諧波和功率等數(shù)值特征進(jìn)行雙通道融合,并在融合特征后構(gòu)建全連接層,對(duì)分類(lèi)器進(jìn)行訓(xùn)練。文獻(xiàn)[24]將設(shè)備功率特征進(jìn)行維度變換,與軌跡組成新的混合特征圖,并用LeNet進(jìn)行分類(lèi)。可以看出,除了吸塵器,本文方法在其他設(shè)備及平均識(shí)別準(zhǔn)確率上均高于文獻(xiàn)所提的方法。盡管以上文獻(xiàn)均采用特征融合的方法,但相比之下本文模型使用三元組損失能更好地捕捉復(fù)雜特征,且該方法使得特征空間中的不同類(lèi)樣本更具區(qū)分性,同類(lèi)樣本更具緊密性,而KNN對(duì)于特征空間中具有明顯分布結(jié)構(gòu)的數(shù)據(jù)更合適,因此得到的結(jié)果均優(yōu)于以上方法。
為了說(shuō)明在接入新負(fù)荷時(shí)本文方法對(duì)于未知負(fù)荷的辨識(shí)能力,分別將洗衣機(jī)、吸塵器、微波爐、計(jì)算機(jī)作為新類(lèi)別接入,其余類(lèi)別電器作為已知類(lèi)進(jìn)行實(shí)驗(yàn),結(jié)果如表4所示。第一列表示未知類(lèi)的電器類(lèi)型,其余列為各電器的識(shí)別準(zhǔn)確率,包括未知類(lèi)和已知類(lèi)的電器??梢钥吹皆诟髑榫跋卤疚姆椒ň休^好的識(shí)別準(zhǔn)確率,平均準(zhǔn)確率均在91%以上,能夠在保證準(zhǔn)確分類(lèi)已知類(lèi)的前提下辨別出新接入的未知類(lèi)別。這是由于三元組損失網(wǎng)絡(luò)的映射使得特征空間中各已知類(lèi)相分離,為新接入的類(lèi)保留了大部分的特征空間,而KNN依賴(lài)于數(shù)據(jù)之間的距離,對(duì)于密集分布的數(shù)據(jù)集表現(xiàn)良好。因此,本文方法能有效降低已知負(fù)荷被識(shí)別為未知的概率,并有效地將未知負(fù)荷識(shí)別出來(lái)。然而當(dāng)計(jì)算機(jī)作為未知類(lèi)時(shí),準(zhǔn)確率僅為65%,這是由于計(jì)算機(jī)的V?I軌跡與已知類(lèi)中的熒光燈相似,在識(shí)別過(guò)程中將部分計(jì)算機(jī)樣本識(shí)別為熒光燈而導(dǎo)致識(shí)別準(zhǔn)確率較低。
2.4 "COOLL數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
對(duì)于COOLL數(shù)據(jù)集,將表2中編號(hào)為11~14的類(lèi)別作為未知類(lèi)別,每個(gè)類(lèi)60個(gè)樣本,共240個(gè)樣本,編號(hào)標(biāo)為-1。對(duì)于已知類(lèi),取每個(gè)類(lèi)樣本20個(gè)作為測(cè)試集,剩余樣本作為訓(xùn)練集進(jìn)行訓(xùn)練。訓(xùn)練完畢對(duì)測(cè)試集進(jìn)行識(shí)別,其混淆矩陣如圖4所示。
由圖4可見(jiàn),已知負(fù)荷的識(shí)別率達(dá)到了95.9%,未知類(lèi)別識(shí)別準(zhǔn)確率為100%,平均準(zhǔn)確率為98%;絕大部分電器識(shí)別準(zhǔn)確率為100%,僅有少數(shù)電器樣本,如鉆頭2和研磨機(jī)2等被識(shí)別為未知類(lèi)。對(duì)于部分電氣特征相似的設(shè)備,如研磨機(jī)1和修剪機(jī),在兩個(gè)設(shè)備之間也沒(méi)產(chǎn)生混淆。可見(jiàn)本文方法對(duì)于單個(gè)型號(hào)設(shè)備識(shí)別上具有較高的準(zhǔn)確率,能夠避免未知電器接入時(shí)在各已知類(lèi)之間產(chǎn)生混淆,并能準(zhǔn)確地識(shí)別出未知類(lèi),但是不足的是會(huì)將少數(shù)已知類(lèi)識(shí)別為未知類(lèi)。
3 "結(jié) "論
針對(duì)在接入新負(fù)荷時(shí)傳統(tǒng)非侵入式負(fù)荷識(shí)別算法會(huì)產(chǎn)生誤分類(lèi)的問(wèn)題,本文提出了一種以Triplet Loss訓(xùn)練神經(jīng)網(wǎng)絡(luò)映射結(jié)合KNN的負(fù)荷識(shí)別方法。該方法將帶有電流、電壓、相位信息的彩色V?I軌跡作為負(fù)荷印記,通過(guò)三元組損失訓(xùn)練的神經(jīng)網(wǎng)絡(luò)映射得到具有區(qū)分度的特征向量;使用PCA等預(yù)處理技術(shù),在各類(lèi)中心構(gòu)造類(lèi)鄰域,設(shè)定動(dòng)態(tài)閾值,并使用KNN進(jìn)行識(shí)別。
采用PLAID和COOLL數(shù)據(jù)集對(duì)本文方法進(jìn)行了測(cè)試。對(duì)于PLAID數(shù)據(jù)集,相比于其他文獻(xiàn)的方法,本文方法在已知負(fù)荷分類(lèi)準(zhǔn)確率上達(dá)到了96.3%,有著更高的識(shí)別準(zhǔn)確率,并在未知負(fù)荷的檢測(cè)上效果顯著。對(duì)于COOLL數(shù)據(jù)集,已知負(fù)荷分類(lèi)準(zhǔn)確率達(dá)到了95.9%,在未知類(lèi)別的檢測(cè)上達(dá)到了100%。表明本文所提方法能夠在準(zhǔn)確識(shí)別已知類(lèi)的前提下檢測(cè)未知類(lèi)負(fù)荷,這為非侵入式負(fù)荷識(shí)別的實(shí)際應(yīng)用提供了方案。
注:本文通訊作者為張勝。
參考文獻(xiàn)
[1] 雷怡琴,孫兆龍,葉志浩,等.電力系統(tǒng)負(fù)荷非侵入式監(jiān)測(cè)方法研究[J].電工技術(shù)學(xué)報(bào),2021,36(11):2288?2297.
[2] 張春健.非侵入式家居電器負(fù)荷識(shí)別方法研究及應(yīng)用[D].濟(jì)南:山東大學(xué),2021.
[3] HART G W. Nonintrusive appliance load monitoring [J]. Proceedings of the IEEE, 1992, 80(12): 1870?1891.
[4] 呂志寧,趙少東,饒竹一,等.非侵入負(fù)荷辨識(shí)的諧波特征量提取改進(jìn)方法研究[J].電子測(cè)量技術(shù),2019,42(7):29?34.
[5] LAM H Y, FUNG G S K, LEE W K. A novel method to construct taxonomy electrical appliances based on load signatures [J]. IEEE transactions on consumer electronics, 2007, 53(2): 653?660.
[6] DU L, HE D W, HARLEY R G, et al. Electric load classification by binary voltage?current trajectory mapping [J]. IEEE transactions on smart grid, 2016, 7(1): 358?365.
[7] 郇嘉嘉,汪超群,洪海峰,等.基于圖像編碼與深度學(xué)習(xí)的非侵入式負(fù)荷識(shí)別方法[J].科學(xué)技術(shù)與工程,2021,21(21):8901?8908.
[8] 華亮亮,黃偉,楊子力,等.基于DTW算法的非侵入式家居負(fù)荷行為識(shí)別方法[J].電測(cè)與儀表,2019,56(14):17?22.
[9] 王蕭陽(yáng).基于動(dòng)態(tài)環(huán)境的非侵入式負(fù)荷識(shí)別算法研究[D].重慶:重慶郵電大學(xué),2022.
[10] YU M, WANG B N, LU L X, et al. Non?intrusive adaptive load identification based on Siamese network [J]. IEEE access, 2022, 10: 11564?11573.
[11] 王丙楠,陸玲霞,包哲靜,等.一種基于度量學(xué)習(xí)的自適應(yīng)非侵入式負(fù)荷識(shí)別方法[J/OL].電測(cè)與儀表:1?9[2024?03?22].http://kns.cnki.net/kcms/detail/23.1202.TH.20220523.1708.00
4.html.
[12] 程時(shí)遠(yuǎn).復(fù)雜條件下的通信輻射源個(gè)體識(shí)別研究[D].成都:電子科技大學(xué),2022.
[13] CHEN Y H, XU X D, QIN X W. An open?set modulation recognition scheme with deep representation learning [J]. IEEE communications letters, 2023, 27(3): 851?855.
[14] BHAVANASI G, WERTHEN?BRABANTS L, DHAENE T, et al. Open?set patient activity recognition with radar sensors and deep learning [J]. IEEE geoscience and remote sensing letters, 2023, 20: 1?5.
[15] 陳澤理,盧簫揚(yáng),林培杰,等.基于偽標(biāo)簽?1D DenseNet?KNN的光伏陣列開(kāi)集復(fù)合故障診斷方法[J].福州大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,51(4):490?497.
[16] 鮑海波,楊舒惠,陳子民,等.事件檢測(cè)類(lèi)非侵入式負(fù)荷監(jiān)測(cè)算法綜述[J].電力系統(tǒng)自動(dòng)化,2023,47(13):94?109.
[17] 許柏祥,劉麗,邱桃榮.面向近重復(fù)文本圖像檢索的三分支孿生網(wǎng)絡(luò)[J].智能系統(tǒng)學(xué)報(bào),2022,17(3):515?522.
[18] 高昂,鄭建勇,梅飛,等.基于三元組孿生網(wǎng)絡(luò)的竊電檢測(cè)算法[J].中國(guó)電機(jī)工程學(xué)報(bào),2022,42(11):3975?3986.
[19] GAO J K, GIRI S, KARA E C, et al. PLAID: a public dataset of high?resoultion electrical appliance measurements for load identification research: demo abstract [C]// Proceedings of the 1st ACM Conference on Embedded Systems for Energy?Efficient Buildings. Memphis, United States: ACM, 2014: 198?199.
[20] PICON T, MEZIANE M N, RAVOER P, et al. COOLL: controlled on/off loads library, a public dataset of high?sampled electrical signals for appliance identification [EB/OL]. [2024?04?13]. https://arxiv.org/pdf/1611.05803.pdf.
[21] 崔昊楊,蔡杰,陳磊,等.基于顏色編碼的非侵入式負(fù)荷細(xì)粒度識(shí)別方法[J].電網(wǎng)技術(shù),2022,46(4):1557?1567.
[22] 王守相,郭陸陽(yáng),陳海文,等.基于特征融合與深度學(xué)習(xí)的非侵入式負(fù)荷辨識(shí)算法[J].電力系統(tǒng)自動(dòng)化,2020,44(9):103?110.
[23] 郇嘉嘉,汪超群,洪海峰,等.基于雙通道多特征融合的電力負(fù)荷智能感知方法[J].科學(xué)技術(shù)與工程,2021,21(13):5360?5368.
[24] 梁浚杰,楊舒惠,鮑海波,等.基于混合特征圖的非侵入式負(fù)荷監(jiān)測(cè)算法[J].廣西大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,48(1):132?139.