滕紅麗,賈樹恒,王灝,王雅倩,周東國(guó),胡文山,袁超
(1.河南農(nóng)業(yè)大學(xué)理學(xué)院,河南 鄭州 450002;2.武漢大學(xué)電氣與自動(dòng)化學(xué)院,湖北 武漢 430072)
負(fù)荷監(jiān)測(cè)作為高級(jí)測(cè)量體系(Advanced Metering Infrastructure,AMI)最重要的組成部分[1],是實(shí)現(xiàn)智能電網(wǎng)的關(guān)鍵技術(shù)之一。其中,非侵入式負(fù)荷監(jiān)測(cè)(Non-intrusive load monitoring,NILM)[2]以軟算法代替硬測(cè)量,具有經(jīng)濟(jì)適用、易推廣等優(yōu)點(diǎn),逐步取代了侵入式測(cè)量,成為新的研究熱點(diǎn)。NILM僅利用電力入口處的單一測(cè)量裝置即可有效獲取負(fù)荷電氣信息,結(jié)合軟件算法有針對(duì)性地分析、管理用戶用電行為,從而實(shí)現(xiàn)需求側(cè)精細(xì)化管理和智能用電雙向信息流交互[3-4]。
目前,負(fù)荷識(shí)別及分類方法以模式識(shí)別[5]為主,主要通過(guò)學(xué)習(xí)負(fù)荷印記(Load Signatures,LS)實(shí)現(xiàn)負(fù)荷分類,例如支持向量機(jī)、K最鄰近算法、神經(jīng)網(wǎng)絡(luò)等,國(guó)內(nèi)外相關(guān)研究眾多。FIGUEIREDO等[6]提取負(fù)荷電流和電壓的峰值、均方根以及功率因子等特征作為負(fù)荷印記標(biāo)記電氣設(shè)備。LIN等[7]結(jié)合Fuzzy、C-Means和模糊分類方法,能夠較好地處理負(fù)荷特征相似問(wèn)題,其性能優(yōu)于BP(Back Propagation)神經(jīng)網(wǎng)絡(luò);WANG等[8]提取V-I軌跡曲線,通過(guò)支持向量機(jī)多分類算法實(shí)現(xiàn)負(fù)荷辨識(shí);DU等[9-10]深入研究了負(fù)荷V-I軌跡特征,并通過(guò)多種設(shè)備證明V-I軌跡圖像作為負(fù)荷分類特征的優(yōu)勢(shì)以及卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)對(duì)圖像的分類效果;HONG等[11]利用傅里葉變換(Fast Fourier Transform,F(xiàn)FT)獲得電流、電壓、有功功率、無(wú)功功率等4種負(fù)荷印記,構(gòu)成7種組合特征,研究發(fā)現(xiàn)4種負(fù)荷印記組合時(shí)能獲得最高精度。HE等[12]采用雙層特征提取框架融合不同負(fù)荷特征的優(yōu)勢(shì),具備較強(qiáng)的可擴(kuò)展性。KELLY[13]采用3種深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)架構(gòu),在負(fù)荷分解方面取得良好的分類效果。MAUCH等[14]采用長(zhǎng)短時(shí)記憶序列網(wǎng)絡(luò)(Long Short Term Memory Network,LSTM)模型通過(guò)使用電器運(yùn)行時(shí)的時(shí)間序列特性進(jìn)行負(fù)荷分解,對(duì)負(fù)荷功率特征具有較好的辨識(shí)效果。但這些研究也存在一些不足,V-I軌跡圖特征比其他高頻特征具有更高的辨識(shí)準(zhǔn)確率,但不能有效區(qū)分V-I軌跡圖相似但功率差異較大的設(shè)備;功率特征也存在相同情況,單獨(dú)使用功率特征,也無(wú)法較好的區(qū)分功率特征相似但V-I軌跡圖差異較大的設(shè)備。
相對(duì)于單一特征,組合特征能夠更全面反映不同負(fù)荷電氣特點(diǎn),從而獲得更高的辨識(shí)精度。多層次的綜合辨識(shí)模型能夠更好地提高辨識(shí)效果和復(fù)雜場(chǎng)景適用性,其中集成學(xué)習(xí)表現(xiàn)優(yōu)秀。本研究提出一種基于深度學(xué)習(xí)決策融合的非侵入式負(fù)荷分類方法。首先從原始負(fù)荷電氣信息中提取負(fù)荷穩(wěn)態(tài)特征(有功功率P、無(wú)功功率Q和V-I軌跡圖)以及利用傅里葉變換得到電流諧波特征H。其次,將P、Q、H3種特征組合為PQH特征,通過(guò)歸一化處理后作為L(zhǎng)STM神經(jīng)網(wǎng)絡(luò)的輸入,進(jìn)行負(fù)荷第一層辨識(shí)。將V-I軌跡圖特征進(jìn)行圖像二值化處理,作為CNN網(wǎng)絡(luò)的輸入,進(jìn)行負(fù)荷第二層辨識(shí)。最后采用決策融合方法對(duì)兩個(gè)辨識(shí)模型進(jìn)行融合,實(shí)現(xiàn)負(fù)荷分類,并使用公共數(shù)據(jù)集對(duì)算法的分類性能進(jìn)行測(cè)試。
負(fù)荷特征的選取是決定模型性能優(yōu)劣的因素之一,應(yīng)滿足以下基本要求:1)盡可能反映設(shè)備的電氣特性;2)能夠和其他設(shè)備進(jìn)行區(qū)分;3)降低不同特征之間的相關(guān)性,減少冗余,以提高模型效率。目前常用負(fù)荷印記有有功功率P、無(wú)功功率Q、電流波形、電流諧波、諧波畸變率、V-I軌跡圖等。
1.1.1 功率P、Q特征 設(shè)備的有功功率P和無(wú)功功率Q屬于低頻特征,利用快速傅里葉變換得到。設(shè)采樣點(diǎn)數(shù)為N的時(shí)域電壓和電流信號(hào)分別為v(n)和i(n),n=0,…,N-1,則有
(1)
(2)
式中:V0和I0分別為基波電壓和電流有效值,Vk和Ik分別為第k次諧波電壓和電流有效值,θk和φk分別為第k次電壓和電流諧波的相位角,f0為設(shè)備工作頻率。
將(1)、(2)式進(jìn)行FFT變換,得到功率P、Q表達(dá)式。
(3)
(4)
1.1.2 電流諧波H特征 高頻次的特征信息中,電流諧波反映了用電設(shè)備在投入過(guò)程中電感、電容等高頻特性,例如電流諧波畸變能夠反映基波和高次諧波的比例成分,負(fù)荷特征表達(dá)中,常將其作為一個(gè)負(fù)荷印記。設(shè)利用FFT方法得到k階頻域電流信號(hào)為
I(k)=A(k)+jB(k)
(5)
式中:k=0,1,…,N-1,j為虛數(shù)單位,A(k)和B(k)分別為第k階頻域信號(hào)的實(shí)部和虛部?;ê透麟娏髦C波分量有效值如式(6),(7)。
(6)
(7)
(8)
式中:||為取模。
1.1.3 特征歸一化 若直接將特征P、Q、H用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),功率和諧波特征的數(shù)值數(shù)量級(jí)差異較大,會(huì)降低較小值(電流諧波)的重要性,因此需要進(jìn)行歸一化處理。常用歸一化方法有min-max歸一化和z-score歸一化。min-max歸一化對(duì)數(shù)據(jù)的處理是線性的,若數(shù)據(jù)中含有離群點(diǎn)時(shí),會(huì)降低不同類型數(shù)據(jù)差異,產(chǎn)生不利影響。z-score歸一化法能夠克服離群點(diǎn)的影響,更適用于功率和諧波特征數(shù)值差異較大的情況,因此采用z-score歸一化法。
原始數(shù)據(jù)序列x1,x2,…,xn,將其轉(zhuǎn)換為均值為0,方差為1的標(biāo)準(zhǔn)數(shù)據(jù),得到y(tǒng)i,i=1,2,…,n。
(9)
(10)
(11)
將P、Q、H特征數(shù)據(jù)作為3個(gè)原始數(shù)據(jù)序列,根據(jù)式(9)—(11)對(duì)每一個(gè)序列進(jìn)行歸一化處理。
V-I軌跡圖反映了一個(gè)工作周期內(nèi)電壓和電流的關(guān)系。BAETS等[10]驗(yàn)證了V-I軌跡圖作為負(fù)荷分類特征的有效性和優(yōu)勢(shì)性。傳統(tǒng)的V-I軌跡圖特征將其形狀數(shù)據(jù)作為辨識(shí)模型的輸入,方法復(fù)雜且易造成特征缺失。DU等[9]將V-I軌跡圖映射到基于二進(jìn)制值的單元格網(wǎng)絡(luò),結(jié)果表明二值化的V-I軌跡圖是一種容易提取且十分有效的特征。
對(duì)一個(gè)工作周期的電壓、電流采樣,得到采樣點(diǎn)v(n)和i(n)。設(shè)V-I軌跡二值圖的像素為w×w,根據(jù)式(12)將v(n)和i(n)線性變換為[0,w]區(qū)間的整數(shù)。
(12)
式中:Vn和In為變換后的電壓和電流值,vn和in為v(n)和i(n)中第n個(gè)采樣點(diǎn)的值,vmax和imax為v(n)和i(n)的最大值,vmin和imin為v(n)和i(n)的最小值,?」表示向下取整。
像素為w×w的二值圖像,以像素為單位將其視為一個(gè)w×w的矩陣X,矩陣元素的值取決于是否被V-I軌跡覆蓋:若被覆蓋則該矩陣元素為1,否則為0。矩陣X計(jì)算方法如式(13),(14)。
(13)
(14)
式中:n=0,1,…,N-1;i,j∈[0,w-1]。
歸一化后的P、Q、H特征都是時(shí)間序列,可以進(jìn)行組合。LSTM網(wǎng)絡(luò)作為經(jīng)典的改進(jìn)RNN神經(jīng)網(wǎng)絡(luò)之一,主要用于序列化信息的識(shí)別。LSTM網(wǎng)絡(luò)增加了記憶模塊,能很好地避免梯度消失現(xiàn)象的發(fā)生。研究采用LSTM模型對(duì)PQH組合特征進(jìn)行訓(xùn)練和學(xué)習(xí)。V-I軌跡圖是二值化圖像,考慮到卷積神經(jīng)網(wǎng)絡(luò)在圖像分類上表現(xiàn)優(yōu)秀,同時(shí)兼顧負(fù)荷分類的性能、模型復(fù)雜度和訓(xùn)練時(shí)間,研究采用基于LeNet-5的CNN神經(jīng)網(wǎng)絡(luò)模型,使用V-I軌跡二值圖做負(fù)荷印記進(jìn)行負(fù)荷分類。假設(shè)2個(gè)網(wǎng)絡(luò)的辨識(shí)結(jié)果分別為Y1、Y2,利用決策融合方法將Y1和Y2融合,得到最終分類結(jié)果Y。研究使用4種指標(biāo)和混淆矩陣對(duì)LSTM、CNN和決策融合模型的分類結(jié)果進(jìn)行評(píng)價(jià)。決策融合模型負(fù)荷辨識(shí)框架如圖1所示。
圖1 非侵入式負(fù)荷辨識(shí)框架Fig.1 Non-intrusive load identification framework
LSTM和CNN網(wǎng)絡(luò)模型中,負(fù)荷印記采用one-hot編碼方式生成;輸入層的神經(jīng)元數(shù)量和輸入特征向量長(zhǎng)度相同;輸出層神經(jīng)元個(gè)數(shù)為設(shè)備種類數(shù)。LSTM網(wǎng)絡(luò)主要基于時(shí)間序列,具有歷史記憶特性,適合于能抽取時(shí)間序列特征參數(shù)的負(fù)荷辨識(shí)。本研究中LSTM網(wǎng)絡(luò)的層數(shù)和時(shí)間序列長(zhǎng)度相同,設(shè)置為10;隱含層神經(jīng)元個(gè)數(shù)為48,權(quán)重矩陣內(nèi)所有元素的值在區(qū)間(-1,1)內(nèi)初始化。Softmax函數(shù)作為輸出層激活函數(shù),使用對(duì)數(shù)似然函數(shù)中的交叉熵函數(shù)作為損失函數(shù),這樣不僅能提高模型訓(xùn)練速度,還有助于解決梯度消失問(wèn)題。
CNN模型以LeNet-5網(wǎng)絡(luò)為基礎(chǔ),在圖像分類領(lǐng)域具有較好的性能和較大的應(yīng)用潛能。為保證降維效果和特征提取精度,降低結(jié)構(gòu)復(fù)雜性,模型結(jié)構(gòu)設(shè)置如下:第一層為輸入層,輸入維數(shù)和矩陣維數(shù)相同;第二層為第一卷積層,使用12個(gè)卷積核,每個(gè)卷積核大小為3×3;第三層為第一池化層,池化大小為2×2;第四層為第二卷積層,使用24個(gè)卷積核,每個(gè)卷積核大小為3×3;第五層為第二池化層,池化大小為2×2;第六層為全連接層,設(shè)置128個(gè)神經(jīng)元,在保證訓(xùn)練集擬合效果的同時(shí)避免過(guò)擬合;第七層為輸出層,神經(jīng)元數(shù)量等于期望輸出的負(fù)荷印記向量長(zhǎng)度。
為幫助模型分辨特征差異較小的類別,同時(shí)使訓(xùn)練能快速收斂,使用Relu函數(shù)作為CNN卷積層和全連接層的激活函數(shù);多分類問(wèn)題中常用的Softmax函數(shù)作為輸出層激活函數(shù)。損失函數(shù)使用交叉熵函數(shù)。
集成學(xué)習(xí)是將多個(gè)不同的基礎(chǔ)分類器組合成一個(gè)集成模型的方法,集成學(xué)習(xí)有助于降低分類模型的偏差和方差,提高模型性能,降低過(guò)擬合風(fēng)險(xiǎn),具有比單一學(xué)習(xí)器更顯著優(yōu)越的泛化性能。決策融合是集成學(xué)習(xí)中多模型組合方法。常見的集成策略有平均法、投票法和學(xué)習(xí)法。平均法主要針對(duì)回歸任務(wù);投票法主要針對(duì)分類任務(wù);學(xué)習(xí)法是一種更為強(qiáng)大的集成策略,需要較多的訓(xùn)練數(shù)據(jù)。結(jié)合算法的分類目標(biāo)和訓(xùn)練數(shù)據(jù)體積,本研究采用投票法作為L(zhǎng)STM和CNN模型融合方法。
投票法中,絕對(duì)多數(shù)投票法和相對(duì)多數(shù)投票法適用于3個(gè)或3個(gè)以上分類模型的情況,而基于合適權(quán)重的加權(quán)投票法同樣可以獲得較好的決策結(jié)果,本研究采用加權(quán)投票法實(shí)現(xiàn)模型融合??紤]到不同分類模型對(duì)不同負(fù)荷設(shè)備的分類效果會(huì)出現(xiàn)一定差異,引入決策權(quán)重矩陣對(duì)加權(quán)投票法進(jìn)行改進(jìn)。改進(jìn)的加權(quán)投票法通過(guò)對(duì)LSTM模型和CNN模型輸出向量的每一個(gè)元素設(shè)置權(quán)重,這樣可以克服加權(quán)投票法不能反映分類模型的辨識(shí)偏好等問(wèn)題。模型融合原理如圖2所示。
圖2 決策融合原理圖Fig.2 Schematic diagram of decision fusion
(15)
H(x)=cargmaxjY
(16)
式中:Y為集成后的輸出向量,Wi為hi的權(quán)重向量,符號(hào)“⊙”表示按元素乘,argmax()表示獲取向量最大元素的下標(biāo)。H(x)為運(yùn)算后得到融合模型分類結(jié)果。
所有的權(quán)重向量Wi可組成權(quán)重矩陣W。
(17)
式中:wi,j為hi的第j個(gè)類別輸出權(quán)重,且有
(18)
在分類任務(wù)[15]中,用于評(píng)價(jià)分類模型好壞的指標(biāo)有混淆矩陣(Confuse Matrix)、準(zhǔn)確率(Accuracy rate,A)、精確率(Precision ratio,P)、召回率(Recall rate,R)、F1值等?;煜仃囈卜Q誤差矩陣,是表示精度評(píng)價(jià)的一種標(biāo)準(zhǔn)格式,用行、列數(shù)相同的矩陣形式來(lái)表示,各矩陣元素通過(guò)將每個(gè)實(shí)測(cè)像元的位置、分類與分類圖像中的相應(yīng)位置和分類相比較計(jì)算。其他4個(gè)指標(biāo)計(jì)算方法如表1所示。
表1 評(píng)價(jià)指標(biāo)說(shuō)明Table 1 Description of evaluation indexes
(1)混淆矩陣反映了分類結(jié)果的混淆程度,最大的優(yōu)點(diǎn)是具有直觀性,可以清楚觀察模型的分類效果。用行代表樣本的實(shí)際類別,列代表模型的分類結(jié)果,則第i行第j列的數(shù)值表示模型將實(shí)際類別i分類為類別j的樣本數(shù)量;對(duì)角線元素表示分類正確的樣本數(shù)量。
(2)因每類設(shè)備的實(shí)例數(shù)量遠(yuǎn)小于總設(shè)備實(shí)例數(shù)量之和,評(píng)價(jià)過(guò)程中正、負(fù)樣本數(shù)量差異過(guò)大,會(huì)造成指標(biāo)結(jié)果虛高等問(wèn)題,因此單一的準(zhǔn)確率指標(biāo)無(wú)法全面反映模型優(yōu)劣。本研究使用混淆矩陣、準(zhǔn)確率、精確率、召回率和F1值多重指標(biāo)對(duì)模型進(jìn)行更加綜合、全面的評(píng)價(jià)。
為驗(yàn)證模型的有效性,使用插件級(jí)設(shè)備標(biāo)識(shí)數(shù)據(jù)集(Plug-Level Appliance Identification Dataset,PLAID)進(jìn)行測(cè)試。該數(shù)據(jù)集包含56戶家庭,11類不同電氣設(shè)備(空調(diào),電風(fēng)扇,電吹風(fēng),電暖器,電冰箱,熒光燈,白熾燈,微波爐,筆記本電腦,吸塵器,洗衣機(jī))的采樣數(shù)據(jù)。每類設(shè)備包含數(shù)十個(gè)不同品牌和型號(hào)的電氣設(shè)備,共1 074條原始樣本,如表2所示。每條樣本數(shù)據(jù)包含30 kHz采樣頻率下時(shí)長(zhǎng)2~5 s的設(shè)備電壓、電流波形,包括設(shè)備啟動(dòng)時(shí)的瞬態(tài)數(shù)據(jù)和設(shè)備運(yùn)行一段時(shí)間后的穩(wěn)態(tài)數(shù)據(jù),每個(gè)工作周期的采樣點(diǎn)數(shù)N=500。
表2 PLAID數(shù)據(jù)集設(shè)備種類統(tǒng)計(jì)表Table 2 Equipment type statistics of PLAID data set
由于PLAID數(shù)據(jù)集中不同類別設(shè)備樣本數(shù)量差異較大,熒光燈樣本最多,有175條,洗衣機(jī)樣本最少,只有26條。為了避免數(shù)據(jù)不平衡降低模型辨識(shí)性能,預(yù)先采用合成少數(shù)類過(guò)采樣技術(shù)(Synthetic Minority Oversampling Technique,SMOTE)對(duì)原數(shù)據(jù)集進(jìn)行擴(kuò)充,使每類設(shè)備樣本數(shù)均達(dá)到樣本最多設(shè)備類別的樣本數(shù)175,擴(kuò)充后總樣本數(shù)為1 925條。
因PLAID數(shù)據(jù)集作者已做去噪處理,研究直接從每個(gè)原始樣本中截取最后10 000個(gè)采樣點(diǎn),即20個(gè)工作周期,約0.33 s,并按位計(jì)算中位數(shù)將其壓縮為一個(gè)工作周期的穩(wěn)態(tài)數(shù)據(jù),數(shù)據(jù)長(zhǎng)度N=500。
使用擴(kuò)充后的數(shù)據(jù)集提取有功功率P、無(wú)功功率Q、電流諧波H和V-I軌跡圖。因設(shè)備品牌、型號(hào)和工作檔位(例如:空調(diào)、電吹風(fēng)等)不同,提取的部分設(shè)備P-Q二維特征存在重疊現(xiàn)象,這會(huì)在一定程度上影響辨識(shí)效果。大部分電風(fēng)扇樣本和其他設(shè)備也出現(xiàn)了不同程度的混疊,因此電風(fēng)扇的辨識(shí)準(zhǔn)確度可能較低。
圖3給出提取的11類設(shè)備的前16次電流諧波。由圖3可知,各設(shè)備的偶次電流諧波均可忽略不計(jì),奇次電流諧波隨諧波次數(shù)增加呈下降趨勢(shì),且大部分設(shè)備在第3次諧波時(shí)幅值已經(jīng)較小,說(shuō)明高次諧波對(duì)負(fù)荷分類貢獻(xiàn)相對(duì)較小。本研究使用第1、3、5次電流諧波作為電流諧波特征,加上P、Q特征,LSTM模型的輸入層神經(jīng)元數(shù)目為5(P、Q,電流1、3、5次諧波),從而降低模型復(fù)雜度,便于工程化應(yīng)用。
圖3 不同種類設(shè)備的電流諧波直方圖Fig.3 Current harmonic histograms of different kinds of equipment
圖4給出提取的11類設(shè)備V-I軌跡圖。圖5給出二值化后的V-I軌跡二值圖。分析可知,這些設(shè)備的V-I軌跡圖存在一定差異,但少部分樣本(例如空調(diào)、白熾燈、電風(fēng)扇和電冰箱)的V-I軌跡圖有一定程度的相似性,可能影響辨識(shí)效果。
圖4 不同種類設(shè)備的V-I軌跡圖Fig.4 V-I trajectory original graphs of different kinds of equipment
圖5 不同種類設(shè)備的V-I軌跡二值圖Fig.5 V-I trajectory binary graphs of different kinds of equipment
3.2.1 LSTM模型 將提取后的PQH特征集按4∶1分為訓(xùn)練集(1 540條樣本)和測(cè)試集(385條樣本),輸出神經(jīng)元個(gè)數(shù)為設(shè)備種類數(shù)11,訓(xùn)練輪數(shù)為500,使用小批量梯度下降法,設(shè)置每次迭代使用20個(gè)樣本對(duì)參數(shù)進(jìn)行更新。使用測(cè)試集對(duì)訓(xùn)練好的最佳LSTM模型進(jìn)行測(cè)試,得到混淆矩陣和A、P、R、F1指標(biāo)如圖6-a和表3所示。
由圖6-a和表3可知,每類設(shè)備的準(zhǔn)確率均高于95%,由于正負(fù)樣本比例(1∶10)差異較大,不同設(shè)備的準(zhǔn)確率差異不大。精確率評(píng)價(jià)中,電冰箱和白熾燈評(píng)價(jià)結(jié)果最差。從混淆矩陣可以看出,這是由于電風(fēng)扇辨識(shí)結(jié)果造成的電冰箱和白熾燈假正例(FP)較多。召回率評(píng)價(jià)中,LSTM模型對(duì)電風(fēng)扇的辨識(shí)性能較差,由特征分析可以看出,這是由于電風(fēng)扇的PQH分布與其他設(shè)備重疊較多。F1評(píng)價(jià)結(jié)果對(duì)精確率和召回率進(jìn)行綜合。
3.2.2 CNN模型 將V-I軌跡二值圖特征集按4∶1分為訓(xùn)練集(1 540條樣本)和測(cè)試集(385條樣本),輸出神經(jīng)元個(gè)數(shù)為設(shè)備種類數(shù)11,迭代次數(shù)為500,使用小批量梯度下降法,設(shè)置每次迭代使用20個(gè)樣本對(duì)參數(shù)進(jìn)行更新,每輪訓(xùn)練迭代77次。使用測(cè)試集對(duì)最佳CNN模型進(jìn)行測(cè)試,得到混淆矩陣和A、P、R、F1指標(biāo)如圖6-b和表3所示。
由表3可知,每類設(shè)備的準(zhǔn)確率均高于95%;其他3個(gè)指標(biāo)在空調(diào)、電風(fēng)扇、電冰箱、白熾燈和洗衣機(jī)5類設(shè)備上的評(píng)價(jià)結(jié)果不夠理想。從V-I軌跡二值圖和混淆矩陣可以看出,這是由于這5類設(shè)備的V-I軌跡圖像形狀近似,給辨識(shí)帶來(lái)難度。LSTM和CNN分類結(jié)果進(jìn)行對(duì)比發(fā)現(xiàn),基于不同特征的2個(gè)模型對(duì)不同種類設(shè)備的辨識(shí)上能夠互補(bǔ),可以進(jìn)行模型融合。
3.2.3 基于多特征的決策融合模型 使用的評(píng)價(jià)指標(biāo)中,準(zhǔn)確率A和精確率P的計(jì)算涉及正負(fù)樣本,每類設(shè)備的正、負(fù)樣本數(shù)量存在較大差異時(shí),這2個(gè)指標(biāo)不適合作為反映融合模型對(duì)各設(shè)備適配度的決策準(zhǔn)則。本研究選擇召回率R構(gòu)建決策權(quán)重:記LSTM和CNN對(duì)第j類設(shè)備的測(cè)試召回率分別為p1,j和p2,j,則決策權(quán)重矩陣元素計(jì)算公式如式(19)。
(19)
式中:T=2為融合模型數(shù)量。根據(jù)表3的召回率,計(jì)算得到?jīng)Q策權(quán)重矩陣如式(20)。
表3 LSTM、CNN和融合模型測(cè)試集的A、P、R和F1指標(biāo)Table 3 A,P,R and F1 indicators of the test set of LSTM,CNN and Fusion Model %
(20)
1.空調(diào);2.電風(fēng)扇;3.電吹風(fēng);4.電暖器;5.電冰箱;6.熒光燈;7.白熾燈;8.微波爐;9.筆記本電腦;10.吸塵器;11.洗衣機(jī)。1.Air conditioner;2.Electric fan;3.Electric hair dryer;4.Electric heater;5.Electric refrigerator;6.Fluorescent lamp;7.Incandescent lamp;8.Microwave oven;9.Laptop;10.Vacuum cleaner;11.Washing machine.圖6 3種模型的混淆矩陣 Fig.6 Confusion matrixes of three models
決策融合模型的混淆矩陣和A、P、R、F1指標(biāo)如表3和圖6-c所示。由表3可知,在單類設(shè)備辨識(shí)中,從準(zhǔn)確率A、精確率P、召回率R和F1單一評(píng)價(jià)指標(biāo)分析,決策融合后大部分設(shè)備的評(píng)價(jià)結(jié)果均優(yōu)于或等于LSTM和CNN的評(píng)價(jià)結(jié)果,其余均介于二者之間。
從表3可知,決策融合模型的A、P、R、F1 4種評(píng)價(jià)指標(biāo)均高于LSTM模型和CNN模型的單獨(dú)辨識(shí)結(jié)果。總體來(lái)說(shuō),決策融合方法能夠有效融合LSTM和CNN兩種模型,融合辨識(shí)模型效果優(yōu)于單一模型辨識(shí)效果。
3.3.1 特征組合對(duì)比 單一諧波特征H、單一功率特征P、組合特征PQH使用LSTM模型的辨識(shí)結(jié)果如表4所示。從表4可以看出,PQH組合特征能夠在一定程度上提高LSTM模型辨識(shí)性能。由特征分析可知,功率相近的負(fù)荷分類中增加諧波特征,諧波特征相似的負(fù)荷分類中增加功率特征,均可從另一維度幫助區(qū)分,從而提升辨識(shí)結(jié)果準(zhǔn)確性。
表4 LSTM模型不同特征評(píng)價(jià)指標(biāo)Table 4 Evaluation indexes of LSTM model based on different features %
3.3.2 不同文獻(xiàn)算法對(duì)比 文獻(xiàn)[16]將BP網(wǎng)絡(luò)提取的功率特征和LeNet-5網(wǎng)絡(luò)提取的V-I軌跡特征進(jìn)行組合,再利用BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)負(fù)荷分類。文獻(xiàn)[17]使用穩(wěn)態(tài)電流的1,3,5次諧波幅值和相角組成負(fù)荷印記,使用多層感知機(jī)(Multilayer Perceptron,MLP)算法進(jìn)行負(fù)荷分類。文獻(xiàn)[18]使用經(jīng)橢圓傅里葉描述子簡(jiǎn)化的V-I軌跡作負(fù)荷印記,使用隨機(jī)森林算法實(shí)現(xiàn)負(fù)荷分類。文獻(xiàn)[19]使用自動(dòng)選擇設(shè)備特征的遞歸特征消除(Recursive Feature Elimination,RFE)算法,負(fù)荷分類用隨機(jī)森林算法。文獻(xiàn)[20] 使用穩(wěn)態(tài)與暫態(tài)特征相結(jié)合的混合特征,使用基于主成分分析(Principal components analysis,PCA) 的辨識(shí)分類算法(Identification and Localization based on PCA,ILPCA)進(jìn)行負(fù)荷分類。這些研究均在PLAID數(shù)據(jù)集上進(jìn)行,各負(fù)荷辨識(shí)算法的準(zhǔn)確率如表5所示。從表5可以看出,除電吹風(fēng)和白熾燈的準(zhǔn)確率本研究略低于文獻(xiàn)[16]、[19]、[20]外,其余設(shè)備準(zhǔn)確率均高于或等于其他文獻(xiàn)算法;本研究所有設(shè)備的平均準(zhǔn)確率高于其他幾種算法。
表5 本研究與其他文獻(xiàn)算法準(zhǔn)確率的對(duì)比Table 5 Comparison of accuracy rate with other literature algorithms %
本研究提出一種基于多負(fù)荷特征和決策融合方法的非侵入式負(fù)荷分類辨識(shí)方法。該方法使用有功功率P、無(wú)功功率Q、電流諧波H、V-I軌跡圖等負(fù)荷特征,以期更大范圍反映設(shè)備特性,更深維度區(qū)分不同種類設(shè)備。本研究利用z-score歸一化方法構(gòu)建組合PQH特征,并對(duì)V-I軌跡圖二值化。選擇LSTM模型和CNN模型進(jìn)行辨識(shí)分類,使用加權(quán)決策對(duì)2個(gè)模型進(jìn)行融合,進(jìn)一步提高負(fù)荷辨識(shí)效果,克服了單一特征或單一模型無(wú)法較好辨識(shí)特征相似負(fù)荷的弊端。
研究結(jié)果表明,在準(zhǔn)確率A、精確率P、召回率R、F1值4種評(píng)價(jià)指標(biāo)上,LSTM模型的平均結(jié)果分別為98.57%、94.04%、92.47%和92.21%;CNN模型的平均結(jié)果分別為98.45%、92.11%、91.94%和91.94%;改進(jìn)后的決策融合模型的結(jié)果分別為99.32%、96.36%、96.36%和96.34%。通過(guò)分析發(fā)現(xiàn),在4種指標(biāo)的性能表現(xiàn)上,決策融合模型的表現(xiàn)均優(yōu)于單一模型,說(shuō)明本研究提出的基于多特征組合的決策融合模型能更有效地實(shí)現(xiàn)負(fù)荷分類,從而為非侵入式負(fù)荷辨識(shí)提供一種有效可行的新方法。
河南農(nóng)業(yè)大學(xué)學(xué)報(bào)2021年2期