裘星,尹仕紅,張之涵,謝智偉,江敏豐,鄭建勇
(1.深圳供電局有限公司,廣東 深圳 518048;2.東南大學(xué)電氣工程學(xué)院,江蘇 南京 210096)
隨著國民經(jīng)濟的迅速發(fā)展,人民的生活水平獲得了顯著的提高,居民對家用電器的使用也大幅增加[1—3]。然而由于一部分家用電器,特別是含有大量高次諧波電流的家用電器,如電吹風(fēng)、洗衣機等,存在著一定的安全隱患,因此需要對家用電器使用情況進行識別,進而排查潛在安全風(fēng)險。非侵入式負荷識別技術(shù)可以實時監(jiān)控用戶側(cè)用電設(shè)備的類型、運行狀態(tài)和功率大小等,識別用戶用電安全隱患,幫助用戶排查安全風(fēng)險,從而指導(dǎo)居民的安全用電[4—5]。
在非侵入式負荷識別技術(shù)的研究上,國內(nèi)外學(xué)者做了大量的工作。文獻[6]根據(jù)不同負荷的穩(wěn)態(tài)電流特征,構(gòu)建自回歸移動平均模型(autoregressive moving average model,ARMAX)線性負荷與哈默斯坦(Hammerstein)非線性負荷的模型數(shù)據(jù)庫,對未知負荷進行模型匹配以實現(xiàn)負荷類型識別,然而提出的多項式模型難以準確反映負荷的電流諧波特征。文獻[7]選取負荷的有功功率和電流3次諧波幅值作為特征,利用遺傳優(yōu)化實現(xiàn)負荷識別,然而忽略了家用負荷的高次諧波特征。文獻[8]選取電流前13次奇次諧波電流幅值作為負荷特征,并分別使用4種監(jiān)督學(xué)習(xí)方法進行負荷識別,然而所提取的各次諧波幅值不能表現(xiàn)各次諧波在一個周期內(nèi)的位置,無法完整描述波形特征。文獻[9]繪制了不同負荷的V-I軌跡圖像,通過對比分析證明了不同工作原理的設(shè)備(如電阻型、電機驅(qū)動型或電力電子型)擁有其獨特的V-I軌跡圖像,辨識度較高。然而V-I軌跡圖像只能描述歸一化后的電壓、電流之間的關(guān)系,難以反映負荷實際功率的大小關(guān)系,即不能區(qū)分大功率負荷與小功率負荷。因此文獻[10]提出了一種基于V-I軌跡特征與功率特征相結(jié)合的負荷辨識算法,證明了復(fù)合特征相比于簡單的V-I軌跡圖像特征有著更高的負荷辨識度,可以準確區(qū)分擁有相似的V-I軌跡但功率差距較大的家用電器。然而,為保證卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)有較快的訓(xùn)練速度,將對V-I軌跡圖像進行高度像素化,導(dǎo)致其難以反映負荷電流的高次諧波特征。且所提方法使用了3種不同的神經(jīng)網(wǎng)絡(luò)模型進行特征提取與辨識,需要耗費大量的時間進行參數(shù)調(diào)節(jié),導(dǎo)致此方法的運用受到了一定的限制。上述方法均不能準確提取家用電器的高次諧波特征,難以檢測用戶用電的安全隱患。
針對上述問題,文中對傳統(tǒng)的V-I軌跡矩陣特征進行改進,融合了高次諧波電流特征及功率特征,組成混合特征矩陣,彌補了家用電器V-I軌跡矩陣高度像素化帶來的特征損失,再利用CNN進行特征辨識。對插頭級電器識別數(shù)據(jù)集(plug-level appliance identification dataset,PLAID),家用電器數(shù)據(jù)集和深圳某小區(qū)用戶家用電器實測數(shù)據(jù)進行算例分析。實驗結(jié)果表明,混合特征矩陣能夠克服V-I軌跡矩陣高度像素化帶來的特征損失,可以正確區(qū)分V-I軌跡矩陣相同、功率大小也相近的家用電器,極大地提高了對加熱器和吹風(fēng)機的辨識正確率,且所提方法的負荷辨識正確率相對于傳統(tǒng)的V-I軌跡圖像特征辨識法有明顯提升。
家庭負荷的供電電壓一般來說是比較穩(wěn)定的,不同負荷的電壓波形基本一致,而反映負荷典型特征的主要是電流波形[11—12]。常用的V-I軌跡圖像的作用是以圖形化方式反映電流波形特征,通過構(gòu)建一個穩(wěn)態(tài)周期內(nèi)家用電器歸一化后的電流與電壓間的函數(shù)關(guān)系,并繪制圖像進行描述。
圖1為不同負荷在一個周期內(nèi)的V-I軌跡圖像,表1為不同負荷的有功、無功功率特征。通過比較可得,大部分家用電器的V-I軌跡圖像和有功、無功功率差異較大,然而加熱器與吹風(fēng)機這2種負荷的電流波形和V-I軌跡圖像的相似度較高,且兩者的有功功率與無功功率差距極小。由于吹風(fēng)機含有大量高次諧波電流,在使用中存在一定的安全隱患,而加熱器相較而言更為安全,因此,實現(xiàn)2種家用電器的準確辨識有助于排查使用含有大量高次諧波的家用電器的潛在安全風(fēng)險,也是一個研究難點[13—15]。
圖1 各類家用電器的V-I軌跡圖像Fig.1 V-I track images of various family loads
表1 各類家用電器的有功與無功功率Table 1 Active and reactive power of various family loads
為降低特征的復(fù)雜度,在特征提取的過程中需要將V-I軌跡圖像高度像素化。圖2為吹風(fēng)機與加熱器的22階V-I軌跡矩陣圖像,可見像素化后2種用電器的V-I軌跡圖像幾乎完全一致,給兩者的正確分類帶來了極大的難度。
圖2 2種家用電器的V-I軌跡矩陣Fig.2 V-I trajectory matrix of two family loads
文中從頻域分量方面對2種家用電器進行了深入研究,利用快速傅里葉變換(fast Fourier transform,F(xiàn)FT)對兩者電流信號的基波及各次諧波的幅值進行了比較,如圖3所示。
圖3 2種家用電器的電流諧波幅值對比Fig.3 Amplitude histogram of harmonics of current of two family loads
由圖3可見,吹風(fēng)機與加熱器在諧波分布上最明顯的差異是,加熱器只含有極少的9次諧波分量,而吹風(fēng)機則包含較多的9次諧波,這些9次諧波分量主要是由吹風(fēng)機內(nèi)部無刷直流電機產(chǎn)生[16],而加熱器內(nèi)部沒有直流電機,因此高次諧波分量也較少。
選擇高次諧波的含量作為附加特征,與像素化的V-I軌跡圖像以及家用電器有功、無功功率組合為混合特征,從而彌補V-I軌跡圖像高度像素化所帶來的高次諧波特征損失問題,提高負荷識別的正確率。
由于V-I軌跡表征負荷電壓波形與電流波形之間的關(guān)系,不同負荷的V-I軌跡差異在于軌跡的形狀,因此難以使用常見的信號處理方法,如FFT、小波變換等算法進行特征提取。因此,文中使用二維圖像矩陣描述不同類型家庭負荷的V-I軌跡特征,具有計算簡單且還原效果較好的優(yōu)點[17]。計算步驟如下:
(1)提取負荷在一個周期內(nèi)的電壓電流波形,并將2種波形數(shù)據(jù)歸一化至[0,1]范圍內(nèi)。
(2)構(gòu)建N×N階二維矩陣M作為V-I軌跡矩陣,矩陣在初始狀態(tài)下的所有元素均為0。
(3)利用下式將電壓電流波形映射至N×N階二維矩陣中。
a=?V(p)×(N-1)+1」
(1)
b=?I(p)×(N-1)+1」
(2)
M(a,b)=1
(3)
式中:V(p),I(p)分別為歸一化后第p個采樣點的電壓與電流值;a,b分別為矩陣M的行索引和列索引;?」為向下取整符號。通過式(1)—式(3)可繪制V-I軌跡矩陣,如圖4所示,N取20,白色表示矩陣元素為0,黑色表示矩陣元素為1。
圖4 V-I軌跡矩陣Fig.4 V-I trajectory matrix
為了防止特征數(shù)據(jù)過于龐大,延長有監(jiān)督學(xué)習(xí)的訓(xùn)練時間,在使用V-I軌跡矩陣描述負荷的電流波形特征時會適當減少矩陣階數(shù),進而降低了對電流波形的采樣精度,這導(dǎo)致了一部分高次諧波特征,如9次諧波特征難以體現(xiàn)在V-I軌跡矩陣中,會對家用電器辨識造成一定的偏差。因此,文中選取了電流高次諧波以及有功、無功功率作為補充特征,高次諧波特征可以彌補V-I軌跡矩陣采樣精度不足的缺點,而有功、無功功率特征可以區(qū)分大功率用電器與小功率用電器,兩者可以極大提高負荷辨識的正確率。
運用FFT對一個周期內(nèi)的負荷電流波形進行處理,將時域信號轉(zhuǎn)化為頻域信號,如式(4)所示。
(4)
式中:k為諧波次數(shù);X(k)為第k次諧波的頻域分量,使用復(fù)數(shù)表示;i(n)為第n個電流采樣點;L為一個周期內(nèi)的電流采樣點個數(shù)。X(k)的模值表示了第k次諧波的幅值,而X(k)的幅角表示了第k次諧波的相位[18—19]。
由圖3可以看出,家用電器的穩(wěn)態(tài)電流波形中,奇次諧波的幅值遠大于偶次諧波,且當諧波次數(shù)大于11次時幅值已經(jīng)非常小,容易混入大量干擾噪聲,因此文中選取7,9,11次諧波作為高次諧波特征。
高次諧波的幅值計算如式(5)所示。
Ai(k)=|Xi(k)|
(5)
式中:Ai(k)為電流第k次諧波的幅值;Xi(k)為電流第k次諧波的頻域分量;k分別取7,9,11。
諧波特征除了包含幅值外,相位也是極為重要的參數(shù)。圖5展示了加熱器與吹風(fēng)機這2種家用電器的奇次諧波相位。由圖5可得,2種家用電器的高次諧波相位值各不相同,其中加熱器的9次諧波相位為負,而吹風(fēng)機的9次諧波相位則為正,因此電流高次諧波的相位特征也可以輔助區(qū)分不同家用電器。
圖5 2種家用電器的電流奇次諧波相位直方圖Fig.5 Phase histogram of odd-order harmonics of current of two family electrical appliances
為保證相位特征的準確性,選取電流各次諧波相位與電壓各次諧波相位的差值作為相位數(shù)據(jù)進行特征辨識,如式(6)所示。
φ(k)=argXi(k)-argXu(k)
(6)
式中:k分別取7,9,11;Xu(k)為電壓第k次諧波的頻域分量;φ(k)為最后提取出的各次諧波相位值;arg為幅角運算函數(shù)。
將功率特征、高次諧波特征和V-I軌跡矩陣進行整合,形成混合特征矩陣,方便識別算法的后續(xù)運算。使用二進制編碼的方法對功率與高次諧波特征進行處理,再添加至V-I軌跡矩陣中形成混合特征矩陣,具體步驟如下。
(1)確認特征順序,共8個補充特征,從左至右分別為:7次諧波幅值,9次諧波幅值,11次諧波幅值,7次諧波相位值,9次諧波相位值,11次諧波相位值,有功功率值和無功功率值。
(2)根據(jù)式(7)將不同樣本的同一特征歸一化至[0,2N-1]范圍內(nèi)。
Sm,g=?(sm,g-smmin)/(smmax-smmin)×(2N-1)」
(7)
式中:g為樣本編號;m為特征編號,取1,2,…,8;Sm,g為歸一化后第g個樣本第m個特征值;sm,g為歸一化之前第g個樣本第m個特征值;smmin,smmax分別為第m個特征下最小和最大的樣本特征值。
(3)將上述歸一化后的特征值轉(zhuǎn)換為N位二進制數(shù)。比如N=8,歸一化后的特征值為181,則二進制數(shù)為10110101。
(4)構(gòu)建N×8階二維特征矩陣F作為補充特征矩陣,矩陣在初始狀態(tài)下的所有元素均為0。
(5)使用式(8)將二進制數(shù)的各位填入矩陣F中。
Fg(a,m)=binm,g(a)
(8)
式中:a為二進制位索引,范圍為[1,N];Fg(a,m)為第g個樣本的補充特征矩陣F的第a行第m列元素值;bin為二進制運行函數(shù),即binm,g(a)為第g個樣本第m個特征下的二進制特征值的第a位。
(6)將F矩陣添加到V-I軌跡矩陣右側(cè),即M矩陣的第N+m列為F矩陣的第m列,形成一個N×(N+8)階的混合特征矩陣W,如圖6所示。
圖6 混合特征矩陣Fig.6 Fusion feature matrix
圖7展示了文中負荷辨識的流程,主要包含家用電器穩(wěn)態(tài)數(shù)據(jù)采集、特征提取、特征組合與負荷識別4個步驟。
圖7 負荷辨識流程Fig.7 Flow of load identification
第2章為每一個樣本建立了N×(N+8)階的混合特征矩陣W,由于矩陣元素的取值只有0和1,因此可以將矩陣視為黑白圖像,進而使用圖像識別技術(shù)進行特征提取。文中選用CNN進行矩陣特征的識別,相比于其他全連接神經(jīng)網(wǎng)絡(luò),CNN在訓(xùn)練二維圖像數(shù)據(jù)的過程中可以保留數(shù)據(jù)的空間特征,擁有較高的訓(xùn)練效率,且不容易出現(xiàn)網(wǎng)絡(luò)過擬合的情況。其結(jié)構(gòu)如圖8所示,其中N取20。
圖8 CNN的結(jié)構(gòu)示意Fig.8 Schematic diagram of the structure of the CNN
由圖8可得,CNN的輸入層維度與混合特征矩陣維度相同,輸出層的維度與待分類負荷種類數(shù)量有關(guān),而CNN的隱含層是由卷積層、池化層、Dropout層和全連接層組成的,其中卷積層和池化層交替重復(fù),且上一層的輸出直接作為下一層的輸入[20—21]。
卷積層的作用是進行輸入數(shù)據(jù)特征提取,由多個卷積核組成。卷積核也被稱為濾波器,其內(nèi)部權(quán)重均由多次反向傳播修正而來。使用卷積核對輸入特征進行從左到右、從上到下的掃描,對掃描區(qū)域進行卷積運算,可以提取輸入圖像的特征。
池化層的作用是對輸入圖像進行壓縮,從而降低下一層的輸入維度,提高運算效率。同時池化層也能減少網(wǎng)絡(luò)參數(shù)的數(shù)量,達到抑制過擬合的效果。文中選取的池化層過濾器大小為2×2,因而可以將輸入單元數(shù)縮小4倍輸出,極大地加快了訓(xùn)練過程[20]。
Dropout層工作的原理是:層內(nèi)的神經(jīng)元在前向傳導(dǎo)的過程中,每一個神經(jīng)元都有一定概率停止工作,即無法向后續(xù)神經(jīng)元傳遞信息。通過設(shè)置Dropout層,可以提高網(wǎng)絡(luò)的訓(xùn)練速度,防止過擬合現(xiàn)象的出現(xiàn),提高模型的魯棒性。
最后一層全連接層的激活函數(shù)為Softmax函數(shù),損失函數(shù)為交叉熵損失函數(shù),其作用是實現(xiàn)樣本的分類,輸出向量的維度與樣本總類別數(shù)相同,向量的第i個元素代表了本次辨識結(jié)果為第i類設(shè)備的概率,所有元素的和為1。文中選取的損失函數(shù)為平方損失函數(shù),在每一次訓(xùn)練結(jié)束之后,全連接層都會將分類結(jié)果與樣本實際類別進行比對,利用損失函數(shù)計算訓(xùn)練誤差,再微調(diào)網(wǎng)絡(luò)中神經(jīng)元之間的權(quán)重,進行下一次訓(xùn)練。對網(wǎng)絡(luò)進行多次訓(xùn)練的目的是使損失函數(shù)最小化,保證樣本實際類別對應(yīng)的元素概率值最大,從而達到最佳的分類效果。
深度學(xué)習(xí)算法CNN的本質(zhì)是使用大量的特征濾波器進行特征提取,并進行層層卷積與池化,進而一步步地從混合特征矩陣中提取有效特征,構(gòu)建分類規(guī)則。一般來說,網(wǎng)絡(luò)層數(shù)越多,則提取的特征也越具有代表性。文中建立的CNN結(jié)構(gòu)如表2所示。
表2 CNN的具體結(jié)構(gòu)Table 2 Specific structures of CNN
文中選用PLAID數(shù)據(jù)集對所提出的負荷識別算法進行驗證。PLAID數(shù)據(jù)集包含了11類家用電器,總共有1 793組樣本數(shù)據(jù),以采樣頻率30 kHz記錄了每一個樣本單獨運行超過2 s的電壓與電流信號[22]。由于大部分家用電器的開啟瞬態(tài)過程都能控制在2 s以內(nèi),因此從數(shù)據(jù)集的每組數(shù)據(jù)中均能提取家用電器穩(wěn)態(tài)運行波形[23]。然而,在PLAID中,不同類別的家用電器樣本數(shù)量有較大差距,樣本數(shù)量最多的幾類家用電器,如吹風(fēng)機、微波爐、空調(diào)和筆記本電腦等,均包含超過200個樣本,而如冰箱、洗衣機、吸塵器和加熱器等家用電器,均只包含70~80個樣本,樣本數(shù)量的不平衡度較高。因此文中選用了合成少數(shù)類過采樣技術(shù)(synthetic minority oversampling,SMOTE)對少數(shù)類樣本進行過采樣,保證不同類別家用電器的樣本數(shù)量大致相同[24]。過采樣算法的具體步驟如下:
(1)對少數(shù)類中的每一個樣本x,計算其與其他所有樣本之間的歐氏距離,形成x對應(yīng)的K近鄰。
(2)設(shè)置過采樣倍率R,即運算結(jié)束后少數(shù)類的樣本個數(shù)增加至R倍。對于每一個樣本,從其K近鄰中隨機選擇R個樣本,分別為x1,x2,…,xR。
(3)利用式(9)生成新樣本:
xi,new=x+Rrand(0,1)×(x-xi)
(9)
式中:xi,new為新生成的樣本;xi為上述隨機產(chǎn)生的樣本;Rrand(0,1)為生成一個在0和1之間的隨機數(shù)。
文中從擴充后的樣本中,每一類家用電器選取75%作為訓(xùn)練集,選取剩余的25%作為測試集。表3展示了不同類別的家用電器訓(xùn)練集與測試集的樣本數(shù)量分布情況。
為評估文中所提算法的準確性,利用混淆矩陣展示各類用電器的識別正確率[25]。算例使用的混淆矩陣為11×11階方陣,混淆矩陣的行表示家用電器的真實類別,而混淆矩陣的列表示神經(jīng)網(wǎng)絡(luò)的預(yù)測類別,矩陣第i行第j列元素代表神經(jīng)網(wǎng)絡(luò)將真實類別為i的樣本預(yù)測為j類的數(shù)量?;煜仃囈话闶褂谜倩芈蔙、精確度P、平衡分數(shù)Q和總識別率Ac來描述識別的總體效果,計算公式分別為:
(10)
表3 不同類別家用電器的訓(xùn)練集與測試集樣本分布Table 3 Sample distribution of training set and testing set of different types of family electrical appliances
(11)
(12)
(13)
個數(shù);Ri為第i類電器的召回率;Pj為第j類電器的精確度。當Ac和Q值越大時,表示分類器的判斷效果越好。表4展示了使用混合特征進行負荷識別的混淆矩陣,圖中類別序號1~11分別表示空調(diào)、節(jié)能燈、電冰箱、電風(fēng)扇、吹風(fēng)機、加熱器、白熾燈、筆記本、微波爐、吸塵器和洗衣機,測試樣本的平衡分數(shù)值分別為90.5%,98.1%,88.5%,94.0%,92.9%,97.0%,89.7%,89.7%,97.4%,97.3%,90.4%。
表4 測試樣本混淆矩陣Table 4 Confusion matrix of test data
在特征提取的有效性方面,相比直接使用V-I軌跡矩陣進行負荷辨識和文獻[10]所提融合V-I軌跡矩陣與功率特征的負荷辨識算法,文中所提算法擁有極大的優(yōu)越性。表5對比了文中所提算法、基于V-I軌跡矩陣的負荷辨識算法以及文獻[10]所提負荷辨識算法的正確率,3種算法的總正確率分別為93.2%,80.9%和89.0%??梢钥闯觯旌咸卣骺梢詷O大地提高辨識正確率,特別是5號吹風(fēng)機與6號加熱器,這2種家用電器之間沒有錯誤識別的現(xiàn)象發(fā)生。同時文中所提算法對其他類型家用電器均有較好的識別效果,總辨識正確率超過93%。
表5 3種方法辨識正確率對比Table 5 Comparison of the accuracy of three identification methods %
為驗證文中所提算法的優(yōu)越性,對比了該算法與其他典型負荷辨識算法的識別速度與正確率。實驗均基于PLAID數(shù)據(jù)集,實驗環(huán)境為win10系統(tǒng)下CPU為Intel i7 10700k,GPU 為 GeForce RTX 2060 Super,內(nèi)存為32 GB 的計算機,所用語言為Python 3.8,深度學(xué)習(xí)框架為PyTorch 1.6。使用11類家用電器,共1 793組樣本數(shù)據(jù)進行訓(xùn)練。其中文獻[10]提取了V-I軌跡圖像特征與功率數(shù)值特征,利用CNN與反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)進行負荷識別;文獻[8]提取負荷電流的奇次諧波特征,分別利用多層感知器(multilayer perceptron,MLP)神經(jīng)網(wǎng)絡(luò)、K最近鄰(K-nearest neighbors,KNN)算法、邏輯回歸(logistic regressive,LR)和支持向量機(support vector machine,SVM)進行負荷辨識,具體結(jié)果如表6所示。由表6可得,文中所提算法的單樣本識別時間為1.02 μs,識別正確率為93.2%,在6種負荷辨識算法中均為最優(yōu),且在訓(xùn)練時間上也有著良好的表現(xiàn),證明了算法的優(yōu)越性。
表6 與其他負荷辨識算法的辨識效果對比Table 6 Comparison of the performance with other load identification algorithms
文中基于我國廣東地區(qū)家用電器計量數(shù)據(jù)進行算例分析,樣本數(shù)據(jù)均來源于深圳某儀表公司的智慧能源終端。數(shù)據(jù)集包含了6種家用電器,分別是定頻空調(diào)、電冰箱、吹風(fēng)機、加熱器、微波爐和洗衣機,總共有600組樣本數(shù)據(jù)。由于不同類別的家用電器的樣本數(shù)量大致相當,因此無需使用合成少數(shù)類過采樣技術(shù)解決樣本不平衡問題。與4.1節(jié)相同,每一類家用電器選取75%作為訓(xùn)練集,選取剩余的25%作為測試集。分類結(jié)果如表7所示,其中總正確率為97.5%。
表7 廣東某地區(qū)家用電器識別正確率Table 7 The accuracy of proposed identification method based on the data from Guangdong %
由表7可知,文中所提方法完全適用于國內(nèi)的電能監(jiān)測數(shù)據(jù),對國內(nèi)的樣本數(shù)據(jù)集可以達到較好的分類效果。
文中對傳統(tǒng)的V-I軌跡矩陣特征進行改進,融合了高次諧波電流特征及功率特征,組合成混合特征矩陣,最后使用CNN對各類家用電器樣本進行辨識,并基于實測數(shù)據(jù)集對算例進行了驗證,主要貢獻如下:
(1)加熱器與吹風(fēng)機這2種負荷的V-I軌跡矩陣相似度較高,且有功、無功功率差距極小,難以進行特征辨識。然而兩者的高次諧波特征有較大差異,因此文中所提方法通過融合高次諧波作為補充特征,能夠準確區(qū)分2種家用電器,有助于排查含有大量高次諧波家用電器的潛在安全風(fēng)險。
(2)由算例分析結(jié)果可得,使用文中所提方法區(qū)分加熱器與吹風(fēng)機這2種負荷的正確率高達100%,總辨識正確率超過了93%,相比于傳統(tǒng)的V-I軌跡圖像特征辨識方法,其辨識正確率有明顯提升。
本文得到深圳供電局有限公司科技項目(090000KK52190185)資助,謹此致謝!