段 晶,李 勇,張振宇,李巍巍,蔣 林,李 磊
(1. 湖南大學(xué)電氣與信息工程學(xué)院,湖南省長(zhǎng)沙市 410082;2. 長(zhǎng)沙新奧長(zhǎng)燃能源發(fā)展有限公司,湖南省長(zhǎng)沙市 410005;3. 利物浦大學(xué)電氣工程與電子系,利物浦L69 3BX,英國(guó);4. 長(zhǎng)沙新奧湘江新能源發(fā)展有限公司,湖南省長(zhǎng)沙市 410005)
為提高電力用戶終端負(fù)荷的能源利用效率、減少電量消耗、促進(jìn)用戶參與需求側(cè)管理或?qū)崿F(xiàn)遠(yuǎn)程優(yōu)化控制,電力負(fù)荷的在線監(jiān)測(cè)必不可少[1-2]。電力負(fù)荷的在線監(jiān)測(cè)方法主要有侵入式負(fù)荷監(jiān)測(cè)(ILM)和非侵入式負(fù)荷監(jiān)測(cè)(NILM)兩種。ILM 需要為每個(gè)監(jiān)測(cè)設(shè)備配置一個(gè)或多個(gè)傳感器,雖然監(jiān)測(cè)結(jié)果更為準(zhǔn)確,但成本高、配置復(fù)雜、維護(hù)困難。NILM的概念最早由Hart 于1992 年提出[3],它只需在被監(jiān)測(cè)系統(tǒng)的電力入口處安裝一個(gè)電力信息采集裝置,再通過信號(hào)分析和處理實(shí)現(xiàn)負(fù)荷的分解與辨識(shí),雖然精度稍低,但是硬件結(jié)構(gòu)簡(jiǎn)單,便于安裝和維護(hù),更切合智能電網(wǎng)建設(shè)的實(shí)際需求[4-5]。因此,近年來NILM 方法的研究備受國(guó)內(nèi)外學(xué)者的關(guān)注。
負(fù)荷辨識(shí)是負(fù)荷監(jiān)測(cè)的核心內(nèi)容,負(fù)荷辨識(shí)方法可分為三大類:優(yōu)化方法、監(jiān)督學(xué)習(xí)方法和無(wú)監(jiān)督學(xué)習(xí)方法。優(yōu)化方法是負(fù)荷辨識(shí)最直接的方法,將提取的負(fù)荷特征數(shù)據(jù)與模板庫(kù)中的特征數(shù)據(jù)進(jìn)行對(duì)比,采用優(yōu)化算法最小化誤差,找到匹配度最高的電氣設(shè)備狀態(tài)組合,包括動(dòng)態(tài)時(shí)間彎曲(DTW)算法[6]、遺傳算法[7]、粒子群優(yōu)化算法[8]等,但優(yōu)化方法進(jìn)行負(fù)荷辨識(shí)普遍需要根據(jù)歷史信息提前建立負(fù)荷特征模板庫(kù)。監(jiān)督學(xué)習(xí)方法需要已知電氣設(shè)備的特定運(yùn)行信息進(jìn)行模型的初始訓(xùn)練,且算法的性能很大程度取決于模型學(xué)習(xí)的數(shù)據(jù)標(biāo)簽,基本上是將負(fù)荷辨識(shí)問題轉(zhuǎn)換為分類學(xué)習(xí)問題進(jìn)行解決,主要方法包括貝葉斯分類器[9]、支持向量機(jī)(SVM)[10]和人工神經(jīng)網(wǎng)絡(luò)(ANN)[11-13]。無(wú)監(jiān)督學(xué)習(xí)方法可以在沒有任何先驗(yàn)信息的情況下運(yùn)行,相較于監(jiān)督學(xué)習(xí)方法減少了訓(xùn)練步驟的干擾性,主要算法包括隱馬爾可夫模型(HMM)[14]及其擴(kuò)展,如文獻(xiàn)[15]中的因子隱馬爾可夫模型(FHMM)和文獻(xiàn)[16]中的隱式半馬爾可夫模型(HSMM)均被應(yīng)用到負(fù)荷辨識(shí)中。
不同類型的負(fù)荷具有不同的負(fù)荷特征,按照其運(yùn)行狀態(tài)可大致分為3 類[17]。對(duì)于連續(xù)變化(Type-Ⅲ)型的負(fù)荷,由于其工作狀態(tài)的功率值保持連續(xù)變化的特性,導(dǎo)致其狀態(tài)空間極其巨大。文獻(xiàn)[18]指出,對(duì)于常用的基于HMM 的負(fù)荷辨識(shí)方法,僅對(duì)Type-Ⅰ型的開關(guān)負(fù)荷表現(xiàn)較好,在面對(duì)狀態(tài)更為復(fù)雜的其他類型負(fù)荷時(shí)效果將被極大的削弱。因此Type-Ⅲ型負(fù)荷的辨識(shí)一直是NILM 中研究的重點(diǎn)和難點(diǎn)之一。
為有效辨識(shí)Type-Ⅲ型負(fù)荷,滿足負(fù)荷辨識(shí)算法對(duì)辨識(shí)準(zhǔn)確率和算法魯棒性的要求,本文提出了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)和HMM 的非侵入式負(fù)荷辨識(shí)算法。通過深度CNN 提取負(fù)荷的多維特征,進(jìn)行負(fù)荷的初次辨識(shí),將連續(xù)變化的負(fù)荷狀態(tài)辨識(shí)問題重構(gòu)為二分類狀態(tài)辨識(shí);根據(jù)負(fù)荷狀態(tài)的時(shí)間依賴性,利用HMM 解決負(fù)荷的二分類狀態(tài)再辨識(shí),減少CNN 辨識(shí)結(jié)果中出現(xiàn)的狀態(tài)斷點(diǎn)現(xiàn)象,提高辨識(shí)準(zhǔn)確率。本文以工商業(yè)電力負(fù)荷為例,在具有代表性的Type-Ⅲ型負(fù)荷數(shù)據(jù)上進(jìn)行訓(xùn)練和測(cè)試,證明了本文算法的有效性,并且可達(dá)到97.9%的辨識(shí)準(zhǔn)確率。
附錄A 圖A1 展示了3 種典型的負(fù)荷曲線,其中Type-Ⅲ型負(fù)荷的狀態(tài)連續(xù)可變性特點(diǎn)非常明顯。工商業(yè)用電在總負(fù)荷中占有很大的比重,研究工商業(yè)用電特性,對(duì)電力系統(tǒng)安全經(jīng)濟(jì)運(yùn)行和電力市場(chǎng)的發(fā)展有著重要的作用。對(duì)工商業(yè)電力負(fù)荷進(jìn)行監(jiān)測(cè)和辨識(shí),可以幫助電力部門了解客戶的用電行為,進(jìn)而為不同的客戶群制訂相應(yīng)的市場(chǎng)策略,使雙方都受益。因此,本文使用Type-Ⅲ型工商業(yè)負(fù)荷來驗(yàn)證非侵入式負(fù)荷辨識(shí)算法的性能。
本文所用的數(shù)據(jù)集為實(shí)測(cè)電力數(shù)據(jù)。測(cè)量?jī)x器為日置電能質(zhì)量分析儀PQ3198,可完成無(wú)間隙的連續(xù)運(yùn)算、事件檢測(cè)、GPS 時(shí)間同步等標(biāo)準(zhǔn)要求的測(cè)量,測(cè)量項(xiàng)目包括有功功率、無(wú)功功率、頻率、電壓、電流及其有效值、最值和高次諧波成分等多維負(fù)荷特征數(shù)據(jù),并具備波形記錄和存儲(chǔ)功能。在電力入口處安裝數(shù)據(jù)采集裝備,采樣頻率為1 Hz,采樣時(shí)長(zhǎng)為7 d。為了驗(yàn)證辨識(shí)效果,在待辨識(shí)負(fù)荷處也安裝采集設(shè)備以準(zhǔn)確獲取其運(yùn)行狀態(tài),從而為辨識(shí)模型提供參考數(shù)據(jù)。
對(duì)于電力入口處采集的任一負(fù)荷特征數(shù)據(jù),可用時(shí)間序列R=[R0,R1,…,RT]表示,其中T為負(fù)荷數(shù)據(jù)的時(shí)間長(zhǎng)度。數(shù)據(jù)處理中可通過差分的方式來增強(qiáng)特征的表達(dá)能力,因此可以得到負(fù)荷的差值特征序列x=[x1,x2,…,xT],其中任一元素xt皆滿足:
給定時(shí)間窗口長(zhǎng)度w,并通過特征選擇確定n種負(fù)荷特征,由此可生成CNN 模型能學(xué)習(xí)的輸入負(fù)荷數(shù)據(jù){H1,H2,…,HL},其中L為輸入數(shù)據(jù)的總長(zhǎng)度。
式中:Xi,j為第j種負(fù)荷特征的第i個(gè)窗口的差值時(shí)間序列,如式(3)所示。
式中:i=1,2,…,T-w+1;j=1,2,…,n。
對(duì)于采集的待辨識(shí)負(fù)荷數(shù)據(jù),以其電流有效值Ii+w/2的大小為標(biāo)準(zhǔn),生成設(shè)備的標(biāo)簽狀態(tài)集{y1,y2,…,yL},其中yi為第i個(gè)時(shí)間窗口內(nèi)的i+w/2 時(shí)刻點(diǎn)的負(fù)荷的運(yùn)行狀態(tài),i=1,2,…,L。
其中,將1 A 作為狀態(tài)標(biāo)記的基準(zhǔn)是根據(jù)待辨識(shí)負(fù)荷運(yùn)行時(shí)的最小電流值所選擇的。
由電能質(zhì)量分析儀采集的電力數(shù)據(jù)共包含3 537 種負(fù)荷特征,其中包括能反映待辨識(shí)負(fù)荷運(yùn)行狀態(tài)變化的相關(guān)特征和與待辨識(shí)負(fù)荷狀態(tài)變化不相關(guān)的無(wú)關(guān)特征。除此之外,負(fù)荷特征中還包括一類冗余特征,即這類特征中所包含的信息可從其他特征中提?。?9]。冗余特征在負(fù)荷辨識(shí)模型學(xué)習(xí)中幾乎不起作用,而無(wú)關(guān)特征反而會(huì)對(duì)模型學(xué)習(xí)造成干擾。因此,在進(jìn)行模型訓(xùn)練之前要進(jìn)行特征選擇,去除無(wú)關(guān)特征和冗余特征,從而提高負(fù)荷辨識(shí)的準(zhǔn)確率,并且特征選擇可以在很大程度上降低維數(shù),減少了模型的運(yùn)算量。
時(shí)間窗口長(zhǎng)度、特征維度與CNN 的乘-加操作(multiply-accumulate operations,MAC)次數(shù)之間的關(guān)系如附錄A 圖A2 所示。隨著特征數(shù)目的增加,神經(jīng)網(wǎng)絡(luò)的操作次數(shù)逐漸變得不可接受,另外,由于特征之間的組合狀態(tài)爆炸增長(zhǎng),導(dǎo)致需要大量的數(shù)據(jù)才能對(duì)網(wǎng)絡(luò)進(jìn)行合適的訓(xùn)練。因此,為了降低網(wǎng)絡(luò)運(yùn)算復(fù)雜度、縮短模型訓(xùn)練時(shí)間,本文采用互信息算法進(jìn)行特征選擇。
在概率論和信息論中,2 個(gè)隨機(jī)變量的互信息是變量間相互依賴性的量度,互信息熵越大表明2 個(gè)隨機(jī)變量之間的相關(guān)性越強(qiáng),反之互信息熵越小,2 個(gè)隨機(jī)變量之間的相關(guān)性就越弱[20]?;バ畔⒅礗(x,y)的計(jì)算如下:
式中:p(x)和p(y)分別為隨機(jī)變量x和y的邊緣概率密度函數(shù);p(x,y)為x和y的聯(lián)合概率密度函數(shù)。
本文采用互信息進(jìn)行特征選擇的具體步驟為:根據(jù)式(5)計(jì)算每個(gè)負(fù)荷特征與待辨識(shí)負(fù)荷運(yùn)行狀態(tài)之間的互信息值;按照互信息的大小對(duì)所有特征按從大到小進(jìn)行排序;然后選擇前n個(gè)互信息最大的特征,構(gòu)成負(fù)荷辨識(shí)的初始特征集合{f1,f2,…,fn};計(jì)算fi與fj(i<j)之間的互信息大小,若fi與某個(gè)特征fj的互信息值大于閾值,則將fj移除特征子集,并按照順序添加新的特征;重新計(jì)算新的特征子集中特征之間的互信息值,重復(fù)篩選直到兩兩特征之間的互信息值皆小于閾值,并構(gòu)建新的特征集合。
附錄A 圖A3 以熱圖的形式展示了負(fù)荷特征之間的相關(guān)性。圖A3(a)中互信息值很小,不同特征之間的相關(guān)性很弱,而圖A3(b)則相反,說明不同負(fù)荷特征之間存在冗余性,特征提取時(shí)可從不同的特征中提取重疊的信息,以致于增加了許多不必要的運(yùn)算。因此,去除冗余特征可使得模型在相同的運(yùn)算維度內(nèi),提取到更多的隱含特征。
對(duì)于Type-Ⅲ型負(fù)荷,本文引入了具備強(qiáng)特征提取能力的CNN 模型,用于提取連續(xù)的負(fù)荷功率變化中隱含的特征。但是,純CNN 類的方法具有另一種弊端,在本文中將其表述為辨識(shí)結(jié)果的非連續(xù)性問題,如附錄A 圖A4 所示。由于CNN 本身不具備時(shí)序建模能力,所以其對(duì)時(shí)序數(shù)據(jù)的感知范圍僅能停留在所選取的時(shí)間窗長(zhǎng)度內(nèi),這導(dǎo)致CNN 的辨識(shí)結(jié)果中經(jīng)常出現(xiàn)局部性的辨識(shí)錯(cuò)誤。值得注意的是,使用CNN 重新提取負(fù)荷數(shù)據(jù)中的特征并將其重構(gòu)為運(yùn)行或非運(yùn)行的二分類狀態(tài),可以解決HMM面臨的狀態(tài)空間過大的問題,使其重新適用于HMM 對(duì)負(fù)荷狀態(tài)的表達(dá)。因此,本文最終確立了使用CNN-HMM 架構(gòu)的Type-Ⅲ型負(fù)荷運(yùn)行狀態(tài)辨識(shí)的解決方案。
基于深度CNN-HMM 的非侵入式負(fù)荷辨識(shí)算法流程如圖1 所示。
圖1 基于深度CNN-HMM 的負(fù)荷辨識(shí)算法流程圖Fig.1 Flow chart of load identification algorithm based on deep CNN-HMM
第1 階段為數(shù)據(jù)處理:采用互信息算法對(duì)電力入口處采集的高維負(fù)荷數(shù)據(jù)進(jìn)行特征選擇,并采用差分處理的方式強(qiáng)化特征表達(dá)能力;對(duì)于待辨識(shí)負(fù)荷數(shù)據(jù),根據(jù)電流有效值大小確定其運(yùn)行狀態(tài),生成設(shè)備的標(biāo)簽數(shù)據(jù)集。
第2 階段為模型訓(xùn)練:將負(fù)荷特征數(shù)據(jù)和標(biāo)簽數(shù)據(jù)合成模型的訓(xùn)練數(shù)據(jù)集,訓(xùn)練深度CNN,使其學(xué)習(xí)擬合特征數(shù)據(jù)與標(biāo)簽之間的非線性映射關(guān)系;通過深度CNN 得到負(fù)荷的初始辨識(shí)結(jié)果,并將其作為HMM 的已知觀測(cè)序列,訓(xùn)練HMM 的參數(shù)。
第3 階段為模型評(píng)估:將負(fù)荷特征數(shù)據(jù)和標(biāo)簽數(shù)據(jù)合成模型的測(cè)試數(shù)據(jù)集,采用深度CNN 模型提取負(fù)荷的隱含特征并進(jìn)行初次辨識(shí),然后采用HMM 優(yōu)化CNN 辨識(shí)結(jié)果中的狀態(tài)斷點(diǎn)問題,由此得到負(fù)荷的最終狀態(tài)序列,并根據(jù)負(fù)荷標(biāo)簽數(shù)據(jù)對(duì)CNN-HMM 辨識(shí)結(jié)果的準(zhǔn)確率進(jìn)行評(píng)估。
殘差神經(jīng)網(wǎng)絡(luò)(ResNet)因其特殊的捷徑連接結(jié)構(gòu),不僅能通過增加網(wǎng)絡(luò)的深度來提高準(zhǔn)確率,而且可緩解由深度增加所帶來的梯度消失問題[21-22]。因此,本文采用ResNet-50 網(wǎng)絡(luò)作為深度CNN 的基本架構(gòu),通過ResNet-50 的學(xué)習(xí),逐漸增加輸入特征向量的深度,減小其數(shù)據(jù)維度,提取數(shù)據(jù)的深層隱含特征,由此優(yōu)化神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)性能。附錄A 表A1為ResNet-50 網(wǎng)絡(luò)結(jié)構(gòu)的超參數(shù)。
HMM 是關(guān)于時(shí)間序列的概率模型,可用一個(gè)五元組參數(shù)λ={U,V,A,B,π}來表示,其參數(shù)定義如下。
1)U={u1,u2,…,uN}是一組隱含狀態(tài)的集合,其中N為隱含狀態(tài)數(shù)目,系統(tǒng)在t時(shí)刻的隱含狀態(tài)Qt∈U。本文采用CNN 進(jìn)行負(fù)荷特征提取,并將其重構(gòu)為二分類狀態(tài)負(fù)荷辨識(shí)問題,所以本文實(shí)驗(yàn)所選擇的待辨識(shí)負(fù)荷的隱含狀態(tài)數(shù)目N=2,只有工作狀態(tài)和非工作狀態(tài),即U={0,1}。
2)V={v1,v2,…,vM}是一組觀測(cè)狀態(tài)的集合,其中M為每一個(gè)隱含狀態(tài)可能輸出的不同觀測(cè)值的數(shù)目,系統(tǒng)在t時(shí)刻的觀測(cè)值St∈V。對(duì)于待辨識(shí)負(fù)荷,觀測(cè)狀態(tài)數(shù)目M=2,即V={0,1}。
3)狀態(tài)轉(zhuǎn)移概率矩陣A=(aij),其中aij為在t時(shí)刻狀態(tài)為ui的條件下,在t+1 時(shí)刻狀態(tài)為uj的概率,計(jì)算公式如下。
4)觀測(cè)狀態(tài)轉(zhuǎn)移概率矩陣B=(bi(k)),其中bi(k)為在t時(shí)刻隱含狀態(tài)為ui的條件下,觀測(cè)狀態(tài)為vk的概率。
5)初始狀態(tài)概率矩陣π=(πi)為t=1 時(shí)刻初始狀態(tài)的概率分布。
本文提出的非侵入式負(fù)荷辨識(shí)算法采用ResNet-50 模型對(duì)負(fù)荷數(shù)據(jù)進(jìn)行初辨識(shí),并將其重構(gòu)為運(yùn)行或非運(yùn)行的二分類問題,再采用HMM 對(duì)初始辨識(shí)結(jié)果進(jìn)行優(yōu)化。HMM 算法的具體步驟為:①初始化HMM 可更新參數(shù)λ′0={A,B,π};②根據(jù)深度CNN 的初辨識(shí)結(jié)果生成觀測(cè)序列S=[S1,S2,…,SL];③迭代更新的參數(shù)λ′,直到觀測(cè)序列出現(xiàn)的概率P(S|λ′)達(dá)最大值;④通過最優(yōu)參數(shù)λ′和觀測(cè)序列S,采用維特比算法求使得可能性P(Q|S,λ′)最大的狀態(tài)序列Q=[Q1,Q2,…,QL],即為待辨識(shí)負(fù)荷的最終辨識(shí)結(jié)果。
負(fù)荷辨識(shí)算法的性能可用準(zhǔn)確率Acc、精確度P′、召回率R以及調(diào)和平均評(píng)價(jià)指標(biāo)Fscore進(jìn)行評(píng)估。準(zhǔn)確率Acc的計(jì)算如下:
式中:m為經(jīng)過算法辨識(shí)預(yù)測(cè)正確的數(shù)量。
精確度P′用來表示算法抗誤檢的能力,召回率R用來表示算法抗漏檢的能力。
式中:TP為被辨識(shí)為正樣本、實(shí)際為正樣本的數(shù)量;FP為被辨識(shí)為正樣本、實(shí)際為負(fù)樣本的數(shù)量;FN為被辨識(shí)為負(fù)樣本、實(shí)際為正樣本的數(shù)量。
Fscore是用來平衡精確度和召回率的評(píng)價(jià)指標(biāo)。
此外,本文采用Wasserstein 距離衡量負(fù)荷辨識(shí)結(jié)果的運(yùn)行時(shí)間概率分布與實(shí)際負(fù)荷運(yùn)行時(shí)間概率分布之間的差異[23],距離可表征算法解決識(shí)別錯(cuò)誤斷點(diǎn)的能力,該值越小表明2 個(gè)概率分布之間的擬合程度越好。Wasserstein 距離的計(jì)算公式如下。
式中:pr和pg為需要計(jì)算二者之間距離的2 個(gè)概率分布;inf(·)表示取最小值;Π(pr,pg)為以pr和pg為邊緣分布的所有可能的聯(lián)合概率分布γ的集合。從γ中采樣(x,y)~γ,計(jì)算其范數(shù)距離||x-y||,由此計(jì)算該聯(lián)合分布下的距離期望值E(x,y)~γ(||x-y||),所有可能的聯(lián)合分布中取該期望值的下確界為Wasserstein 距離。
本文實(shí)驗(yàn)所用數(shù)據(jù)集為實(shí)測(cè)電力數(shù)據(jù),數(shù)據(jù)采集地點(diǎn)分別為湖南大學(xué)研究生教學(xué)樓和湘江歡樂城能源站。其中,教學(xué)樓背景負(fù)荷較為簡(jiǎn)單,主要用能設(shè)備包括電梯與中央空調(diào)。而能源站用能結(jié)構(gòu)較為復(fù)雜,它是一個(gè)冷熱電綜合能源站,包括溴化鋰機(jī)組、蒸汽鍋爐、燃?xì)鉄崴仩t、熱水鍋爐循環(huán)泵等多種用能設(shè)備以及內(nèi)燃發(fā)電機(jī)等發(fā)電設(shè)備。除去大型設(shè)備外,也存在數(shù)量眾多的中小型負(fù)荷,由于供能覆蓋范圍較大,難以窮舉。為滿足2 所酒店與冰雪世界的用能需求,設(shè)備機(jī)組經(jīng)常處于復(fù)雜的動(dòng)態(tài)調(diào)控過程中,用電情況多變、辨識(shí)難度較高,是一個(gè)典型的工商業(yè)復(fù)雜負(fù)荷。
附錄A 圖A5 為實(shí)驗(yàn)數(shù)據(jù)采集地點(diǎn)的電網(wǎng)拓?fù)浣Y(jié)構(gòu)圖,數(shù)據(jù)采集裝置的安裝位置已在圖中標(biāo)記。圖A5(a)為教學(xué)樓低壓側(cè)的拓?fù)?,包括相互?dú)立的1 號(hào)與2 號(hào)電梯、中央空調(diào)、照明設(shè)備等,本文選擇1 號(hào)電梯負(fù)荷為待辨識(shí)負(fù)荷,采集的部分電梯負(fù)荷數(shù)據(jù)見附錄B。圖A5(b)為能源站低壓側(cè)的拓?fù)渑c其部分負(fù)荷,為保障能源站供電的安全可靠性,其中包含兩支獨(dú)立的進(jìn)線,電源進(jìn)線為消防負(fù)荷供電,非消防負(fù)荷進(jìn)線為其他電力負(fù)荷供電,本文選擇鍋爐負(fù)荷作為待辨識(shí)負(fù)荷。
圖2 為待辨識(shí)負(fù)荷的有功功率和無(wú)功功率的聯(lián)合分布圖??梢钥闯?,電梯負(fù)荷和鍋爐負(fù)荷的有功和無(wú)功功率變化范圍都非常廣泛,并且分布較隨機(jī),不能簡(jiǎn)單地將其聚類處理劃分為有限個(gè)狀態(tài),且其有功功率并非維持在一個(gè)或多個(gè)穩(wěn)定值附近。電梯負(fù)荷和鍋爐負(fù)荷的狀態(tài)多變復(fù)雜,是典型的Type-Ⅲ型負(fù)荷,因此可以作為驗(yàn)證本文算法有效性的待辨識(shí)負(fù)荷。
圖2 待辨識(shí)負(fù)荷的有功、無(wú)功功率聯(lián)合分布圖Fig.2 Diagrams of active and reactive power joint distribution for load to be identified
對(duì)采集的數(shù)據(jù)集進(jìn)行預(yù)處理和特征選擇時(shí),選擇不同的時(shí)間窗口長(zhǎng)度w和特征數(shù)量n會(huì)產(chǎn)生不同的辨識(shí)結(jié)果。表1 為固定w=50 s 時(shí),不同的特征數(shù)目對(duì)ResNet-50 網(wǎng)絡(luò)每輪訓(xùn)練時(shí)間的影響。由表1 可知,隨著特征數(shù)目的增加,輸入數(shù)據(jù)維度變大,網(wǎng)絡(luò)的訓(xùn)練時(shí)間也會(huì)隨之變長(zhǎng),因此采用互信息進(jìn)行特征選擇可以縮短模型的訓(xùn)練時(shí)間,從而提高模型運(yùn)算效率。
表1 ResNet-50 網(wǎng)絡(luò)每輪的訓(xùn)練時(shí)間Table 1 Training time of each epoch in ResNet-50 network
圖3 展示了算法辨識(shí)準(zhǔn)確率與時(shí)間長(zhǎng)度和特征數(shù)目的關(guān)系。由圖可見,隨著n的增加,負(fù)荷辨識(shí)模型可從輸入數(shù)據(jù)中提取更多的隱含特征,但當(dāng)n達(dá)到某一數(shù)值后,選擇的負(fù)荷特征中開始出現(xiàn)重疊信息或是無(wú)關(guān)信息,反而會(huì)對(duì)模型辨識(shí)產(chǎn)生干擾,降低辨識(shí)的準(zhǔn)確率;隨著w的增加,模型可從一個(gè)時(shí)間窗口內(nèi)學(xué)習(xí)待辨識(shí)負(fù)荷狀態(tài)之間的時(shí)間連續(xù)性,從而減少辨識(shí)結(jié)果非連續(xù)性的現(xiàn)象,但當(dāng)w覆蓋負(fù)荷的最大運(yùn)行周期值時(shí),模型逐漸達(dá)到飽和,負(fù)荷辨識(shí)準(zhǔn)確率便不會(huì)隨著w的增大而增大。綜合考慮算法的運(yùn)算量和準(zhǔn)確率,本文選擇時(shí)間窗口長(zhǎng)度w=60 s、特征數(shù)量n=40 進(jìn)行特征選擇和模型訓(xùn)練。
圖3 時(shí)間長(zhǎng)度和特征數(shù)量與辨識(shí)準(zhǔn)確率的關(guān)系Fig.3 Relationship of time length, number of characteristics and identification accuracy
從實(shí)驗(yàn)數(shù)據(jù)集中選擇周六的數(shù)據(jù)作為網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù),選擇周一的數(shù)據(jù)作為測(cè)試數(shù)據(jù),并且在訓(xùn)練數(shù)據(jù)中將80%用于訓(xùn)練,其余20%用于模型的評(píng)估,從而選擇出效果最佳的模型。在訓(xùn)練過程中,采用Adam 優(yōu)化器,設(shè)置初始學(xué)習(xí)率為0.001,并使用線性整流函數(shù)(ReLu)以加快模型的收斂速度,用交叉熵函數(shù)計(jì)算分類誤差。附錄A 圖A6 為損失函數(shù)值隨訓(xùn)練過程迭代次數(shù)的變化曲線圖。可以看出,在迭代次數(shù)達(dá)到30 左右時(shí),無(wú)論是訓(xùn)練誤差還是評(píng)估誤差,模型的損失值都趨于平緩,達(dá)到收斂狀態(tài)。
本文將幾種常用的非侵入式負(fù)荷辨識(shí)算法作為對(duì)比算法進(jìn)行測(cè)試,包括k最近鄰(KNN)[24]、隨機(jī)森林(RF)[25]、HMM[14]、長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)[12]、CNN[11]以及CNN-LSTM 模型。其中,選擇HMM和CNN 算法是為了對(duì)比本文算法相較于單獨(dú)模型的優(yōu)化效果。KNN 和RF 算法是經(jīng)典的分類識(shí)別算法,而LSTM 網(wǎng)絡(luò)模型是處理時(shí)間序列的神經(jīng)網(wǎng)絡(luò),這3 種算法均被普遍應(yīng)用于非侵入式負(fù)荷辨識(shí)領(lǐng)域中。
待辨識(shí)負(fù)荷的辨識(shí)結(jié)果如表2 所示,圖4 展示了幾種負(fù)荷辨識(shí)算法在相同時(shí)間內(nèi)的辨識(shí)結(jié)果。由圖4 可見,LSTM 和CNN 算法的辨識(shí)結(jié)果中都存在一定的狀態(tài)斷點(diǎn)問題,導(dǎo)致負(fù)荷辨識(shí)的準(zhǔn)確率降低;而2 層模型CNN-LSTM 和CNN-HMM 相較于單獨(dú)模型在一定程度上優(yōu)化了辨識(shí)結(jié)果的非連續(xù)性,提高了負(fù)荷辨識(shí)的準(zhǔn)確率,且HMM 比LSTM 的優(yōu)化效果更為顯著,本文提出的CNN-HMM 算法具有更高的精度。結(jié)合表2 中的評(píng)價(jià)指標(biāo)對(duì)比,可在數(shù)據(jù)上證實(shí)這一觀點(diǎn)。雖然在精確度P′和召回率R上,本文算法并非是最優(yōu)的,即本文算法在所有對(duì)比算法中并不具有最強(qiáng)的抗誤檢和抗漏檢的能力,但是對(duì)于能綜合反映辨識(shí)結(jié)果的可靠程度指標(biāo)Fscore,提出的算法取得了0.987 9 的最高值;對(duì)于反映負(fù)荷辨識(shí)結(jié)果與實(shí)際運(yùn)行狀態(tài)之間差異的Wasserstein 距離,提出的算法取得了最小值,而d值越小表明算法解決識(shí)別錯(cuò)誤斷點(diǎn)的能力越強(qiáng)。綜上所述,本文算法對(duì)于Type-Ⅲ型工商業(yè)負(fù)荷的辨識(shí)效果優(yōu)于其他對(duì)比算法,并且具有最高的辨識(shí)準(zhǔn)確率,能達(dá)到97.9%。
表2 待辨識(shí)負(fù)荷的辨識(shí)結(jié)果Table 2 Identification results of load to be identified
圖4 辨識(shí)結(jié)果對(duì)比Fig.4 Comparison of identification results
用戶的用電行為是指在什么時(shí)間用了什么電器產(chǎn)生了多大的負(fù)荷,通過NILM 技術(shù)可以方便地獲得各電器的使用情況,進(jìn)而可以對(duì)各電器的用電信息如啟停時(shí)間、持續(xù)時(shí)間及用電量等進(jìn)行統(tǒng)計(jì),以得到用戶準(zhǔn)確的用電行為,從而幫助電網(wǎng)公司制定供需互動(dòng)策略。
附錄A 圖A7 為根據(jù)負(fù)荷辨識(shí)結(jié)果得到的電梯負(fù)荷和鍋爐負(fù)荷一天的用能統(tǒng)計(jì)。由圖A7(a)可知,電梯負(fù)荷的運(yùn)行具有明顯的時(shí)間特性,主要用電行為集中在09:00—23:00,而在00:00—06:00 時(shí)段內(nèi)幾乎沒有運(yùn)作,且工作日的運(yùn)行時(shí)長(zhǎng)較周末的略長(zhǎng),這與電梯負(fù)荷所處的學(xué)校環(huán)境有關(guān),電梯的運(yùn)行時(shí)段與學(xué)生上下課時(shí)段重合。由圖A7(b)可知,鍋爐負(fù)荷的運(yùn)行幾乎與時(shí)間無(wú)關(guān),因其處于供能站內(nèi),要滿足站內(nèi)所有的供熱需求,所以鍋爐負(fù)荷每天的工作時(shí)間都很長(zhǎng),用能量很大,且工作日與周末的用能并沒有很大區(qū)別。
為有效辨識(shí)Type-Ⅲ型負(fù)荷,本文提出了基于深度CNN-HMM 的非侵入式負(fù)荷辨識(shí)算法。首先,根據(jù)互信息原理進(jìn)行特征選擇并去除冗余特征,采用參數(shù)搜索確定最優(yōu)時(shí)間窗口長(zhǎng)度和特征數(shù)目;由于ResNet-50 網(wǎng)絡(luò)可有效解決深度網(wǎng)絡(luò)訓(xùn)練過程中梯度消失的問題,將其作為深度CNN 模型的架構(gòu),提取負(fù)荷的多維特征,并完成初次辨識(shí);根據(jù)初次辨識(shí)結(jié)果,計(jì)算HMM 的參數(shù),并完成負(fù)荷的二次辨識(shí),從而優(yōu)化CNN 模型辨識(shí)中存在的辨識(shí)結(jié)果非連續(xù)性問題;最后,與其他負(fù)荷辨識(shí)算法的對(duì)比測(cè)試結(jié)果表明,本文算法能有效辨識(shí)Type-Ⅲ型工商業(yè)電力負(fù)荷,具有更好的準(zhǔn)確率和辨識(shí)精度。
下一步的工作重點(diǎn)是研究Type-Ⅲ型負(fù)荷運(yùn)行時(shí)的典型狀態(tài)辨識(shí)問題。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。