陳 飛, 楊 超, 魯 杰
(貴州大學 電氣工程學院, 貴陽 550025)
隨著經(jīng)濟和科技的發(fā)展,人們對能源的需求逐漸增大。 這也導致自然界中化石能源的逐漸衰減。人們已開始意識到節(jié)約能源對人類發(fā)展的重要性。對于居民的負荷用電占比也逐漸增大,因此居民節(jié)能用電對緩解能源消耗也發(fā)揮著重要的作用[1]。20 世紀80 年代由美國學者Hart 提出一種基于非侵入式的負荷監(jiān)測技術(shù)(non-intrusive load monitoring,NILM)的用電負荷識別技術(shù)[2]。 該技術(shù)為居民實時提供了家用負荷用電信息。
隨著智能電網(wǎng)和大數(shù)據(jù)的不斷發(fā)展,國內(nèi)外機構(gòu)的研究學者逐漸投入到NILM 的研究當中。 文獻[3]針對家用負荷識別特征量難以優(yōu)化,以及識別算法收斂性較差的問題,于是提出用暫態(tài)特征作為特征量,然后運用DTW 算法計算測試模板與參考模板之間的相似度,從而達到有效的識別,但是對于功率相同的負荷會出現(xiàn)混淆的情況,因而識別率不高。 文獻[4]采用家電的穩(wěn)態(tài)基波電流和諧波作負荷特征的參數(shù),用改進的雞群算法作為負荷識別算法,可以準確地識別在各種復雜情況下的多種電器,但是當負荷特征出現(xiàn)重疊時,其識別準確率卻較低。文獻[5]針對在低頻采樣中負荷識別的研究,提出了基于多特征序列融合的非侵入式負荷辨識方法,此方法具有較高的辨識度和準確率,但對于家電負荷的功率相近的可以進一步進行優(yōu)化。 文獻[6]選取了采用低頻采樣得到的家用電器的穩(wěn)態(tài)電流作負荷特征,將離散差分進化算法應(yīng)用在居民側(cè)負荷分解上,能夠準確分解連續(xù)可變型、多工作模式型等復雜的家電負荷,但是可以發(fā)現(xiàn)當電流發(fā)生疊加時,對小電流的家電負荷識別精度下降。
上述研究都是在已知負荷類型的基礎(chǔ)上,且大部分是采用的有功和無功功率作為負荷特征進行負荷識別,當有些負荷的功率相近時,會出現(xiàn)無法準確地識別電器類型。 針對以上研究問題的不足,于是在傳統(tǒng)功率特征的基礎(chǔ)上引入負荷的總諧波畸變率(THD)作為新的負荷特征。 其次,再分別使用粒子群算法優(yōu)化支持向量機和使用蜉蝣算法優(yōu)化支持向量機進行家用負荷的負荷識別。 最后,采用實測數(shù)據(jù)進行實驗驗證,可以得到采用蜉蝣算法優(yōu)化支持向量機比起粒子群算法優(yōu)化支持向量機將具有更加良好的準確性。
在非侵入式負荷識別過程中,常常選用傳統(tǒng)有功P和無功Q作為負荷識別的特征。 研究時,可通過采集模塊得到的電壓和電流,計算得出有功P和無功Q的數(shù)據(jù),具體計算公式如下所示:
其中,P,Q,V,I分別表示有功功率、無功功率、電壓以及電流;φ表示為電壓和電流之間的相位差;k為諧波次數(shù)。 有功和無功負荷特征可以用來準確識別大功率電器種類,然而對于低功率的電器種類的識別不是很準確[7]。 由于不同負荷電流中所含諧波成分有所差別,故在采樣電流數(shù)據(jù)的基礎(chǔ)上,對各個負荷采用快速傅里葉變換得到其負荷電流的不同頻率諧波。 在本文中除了選取傳統(tǒng)有功P和無功Q作負荷特征外,還選用了不受諧波干擾的基波功率因數(shù)λ和負荷的總諧波畸變率(THD) 作為負荷特征以解決傳統(tǒng)功率特征識別不足的問題。這里可給出研究分述如下。
(1)基波的功率因數(shù)。 此時需用到的數(shù)學公式為:
其中,P1表示基波的有功功率,Q1表示基波的無功功率。
(2)負荷的總諧波畸變率(THD)。THD指的是電流全部諧波含量均方根與基波均方根之比,其表達式為:
其中,I(k) 表示第k次電流諧波分量的均方根值;I(1) 表示電流的基波分量的均方根值。
蜉 蝣 算 法( Mayfly Algorithm, MA) 是 由Zervoudakis 等人在2020 年研發(fā)提出、可用于解決FS 問題的一種新型智能優(yōu)化算法[8]。 這是一種混合方法,結(jié)合了經(jīng)典優(yōu)化方法(例如PSO 、GA 和FA)的優(yōu)點。 不僅尋優(yōu)能力強,而且有著較大研究價值。 分析可知,蜉蝣屬于星翅目(Ephemeroptera)昆蟲,是古翅目昆蟲的一部分。 由于這些昆蟲主要在英國的5 月出現(xiàn),因此得名Mayfly。 據(jù)估計,全世界有超過3 000 種蜉蝣。 從卵中孵化出來后,還需花費數(shù)年時間才能長成水生若蟲,當其準備成年時才會浮出水面。 一只成年蜉蝣的壽命只有幾天,直至完成繁殖目標。 為了吸引雌性蜉蝣,大多數(shù)雄性蜉蝣將成群結(jié)隊與雌性蜉蝣進行婚慶舞蹈。 交配過程僅持續(xù)幾秒鐘,之后會將卵滴入水中,并且循環(huán)持續(xù)進行。 在Allan 等人[9]的著作中則詳細提及了前述過程[10]。 MA 的組成部分可闡釋為如下步驟[11]:
(1)雄性蜉蝣的運動。 由于雄性蜉蝣的運動方式總是成群結(jié)隊,因此對于每一只雄性蜉蝣總是要根據(jù)自己和鄰居的經(jīng)驗來調(diào)整位置。 雄性蜉蝣位置更新公式為:
其中,表示雄性蜉蝣在時間步長為t時在搜索空間中的當前位置,xi t+1是通過在當前位置上添加速度vit+1來改變的新位置。研究發(fā)現(xiàn)雄性蜉蝣需要行進至水面上幾米處表演舞蹈來吸引雌性蜉蝣,此時假設(shè)其發(fā)展速度不是很快,且會不斷地移動。 因此推得,雄性蜉蝣的計算公式為:
其中,是蜉蝣i在j維度t時刻的速度;代表t時刻的位置;α1和α2是社會作用的正吸引系數(shù);pbest是代表蜉蝣訪過的歷史最佳位置;gbest代表最佳蜉蝣位置;β是蜉蝣的能見度系數(shù),控制蜉蝣的能見范圍;γp表示當前位置與pbest的距離;γg表示當前位置與gbest的距離。 對應(yīng)的距離公式如下所示:
對于種群中最好的蜉蝣而言,表演其獨有的上下舞蹈有著至關(guān)重要的意義。 故,這些最好的蜉蝣就必須不斷地改變移動的速度,在這種情況下,計算公式可寫為:
其中,d是舞蹈系數(shù),r為[-1,1]之間的隨機數(shù)。 這種上下移動在算法中引入了一個隨機元素。
(2)雌性蜉蝣的運動。 與雄性蜉蝣不同的是,雌性蜉蝣不會成群結(jié)隊,而只會飛向雄性蜉蝣去尋求繁殖。假設(shè)yi t為在時刻t時的蜉蝣i,對應(yīng)的位置可通過增加速度來予以更新:
考慮到吸引過程是隨機的,研究時可將其建模為一個確定性過程。 也就是說,雄性和雌性之間的吸引過程取決于當前解決方案的質(zhì)量,即性能最佳的雌性被吸引到性能最佳的雄性處,接下來依此類推。 因此,考慮到極小化問題,速度的計算公式如下:
其中,表示第i只雌性蜉蝣在t時刻的速度的第j個分量速度;表示第i只雌性蜉蝣在時間t的維度j上的位置;α2和β分別表示前文定義的引力常數(shù)和可見系數(shù);g表示重力系數(shù);γmf表示雌性蜉蝣距離雄性蜉蝣的距離;fl表示在雌性未被雄性吸引的情況下的隨機游動系數(shù);r表示一個在范圍[-1,1]的隨機數(shù)。
(3)蜉蝣交配。 交叉算子表示2 個蜉蝣的交配過程:從雄性、雌性種群中分別各選擇一個親本。 選擇父母的方式與雄性吸引雌性的方式相同。 需要指出的是,選擇既可以是隨機的,也可以基于設(shè)定的適應(yīng)度函數(shù)。 對于后者而言,最好的雌性與最好的雄性繁殖,次好的雌性與次好的雄性繁殖。 交叉的結(jié)果是產(chǎn)生2 個后代,對應(yīng)的數(shù)學公式定義如下:
其中,male是父本;female是母本;L是一個特定范圍的隨機數(shù)。
(4)蜉蝣突變。 對新生成的后代進行突變以增強算法的探索能力。 將正態(tài)分布的隨機數(shù)添加到后代變量中,如:
其中,k是正態(tài)分布的隨機值。
支持向量機(SVM)是非參數(shù)、有監(jiān)督的學習模型,其設(shè)計是立足于使分類器性能趨于更好的幾何思想[12]。 SVM 的基本原理是在特征空間中找到一個使數(shù)據(jù)集中樣本間距達到最大的分離超平面。 對于線性可分離數(shù)據(jù)集來說,支持向量機的算法目標是在N維空間(這里的N是特征的數(shù)量)中找到一個能清晰地分類數(shù)據(jù)點的最優(yōu)超平面(或決策邊界),而支持向量是最接近超平面的數(shù)據(jù)點[13]。 簡言之,SVM 算法的目標是最大化分離超平面周圍的邊界,本質(zhì)上就使其成為一個約束優(yōu)化問題。
由文獻[14]可知,求解多分類問題的實質(zhì)就是將多分類問題的求解轉(zhuǎn)換成二分類問題。 本文中針對一個M類分類問題,設(shè)給定的訓練集為:
其中,xi∈Rn,yi∈Y ={1,2,…,M},i =1,2,…,l。
由文獻[15]研究可知,將尋求最優(yōu)超平面的問題轉(zhuǎn)換成二次規(guī)劃問題,當引入適當?shù)膽土P函數(shù)C和核函數(shù)后可得到問題的目標函數(shù)為:
其中,K(xi·xj)=(φ(xi)·φ(xj)) 為核函數(shù)。在本文中,研究選用的是Guass 徑向基內(nèi)核函數(shù),即:
最終得到SVM 的最優(yōu)決策函數(shù)為:
交叉驗證(Cross Validation,CV)[16]是用來評判分類器性能好壞的一種統(tǒng)計分析方法,設(shè)計基本原理是將采集到的數(shù)據(jù)進行分組,將其中一部分作為訓練集,將另一部分用作測試集,再利用訓練集對分類器進行訓練,用測試集來測試訓練后得到的模型,從而得到分類器的性能評價指標。 在本文中,采用的是常見的交叉驗證方法K 折交叉驗證方法( Kfold Cross Validation, K-CV)。
研究時,是將采集到的數(shù)據(jù)等分為K組,并對其中每個子數(shù)據(jù)集分別選作一次驗證集,而其余的K -1 個子數(shù)據(jù)集作為訓練集,按此方式將可得到K個模型,再用K個模型最終驗證集的分類準確率的平均數(shù)來作為K-CV 分類器性能評價指標。 一般情況下,K大于等于2,在實際應(yīng)用中多是從3 開始選取,嘗試取2 時則是在采集的數(shù)據(jù)集數(shù)據(jù)量較小的情況。 K-CV 的優(yōu)點是:可以有效防止出現(xiàn)過學習和欠學習狀態(tài)的發(fā)生。
采用SVM 算法對負荷分類準確率較高,但是由于其對應(yīng)的懲罰因子C和g參數(shù)具有不確定性。 故在支持向量機的懲罰因子基礎(chǔ)上,可用MA 算法進行優(yōu)化,如此一來就可對懲罰因子C和g進行尋優(yōu)。這樣做的好處就是克服了SVM 參數(shù)的不確定性,從而提高了家用負荷辨識的準確率。 MA-SVM 算法的步驟如圖1 所示。
圖1 MA-SVM 算法流程圖Fig.1 MA-SVM algorithm flow chart
由圖1 可以看出,先以K折交叉驗證的平均準確率來作為蜉蝣算法的適應(yīng)度函數(shù),然后再初始化雄性蜉蝣、雌性蜉蝣來確定參數(shù)。 通過適應(yīng)度函數(shù)值來判斷SVM 算法中懲罰因子C和核函數(shù)g是否為最優(yōu)。 若滿足最優(yōu)參數(shù),就可得到蜉蝣算法優(yōu)化后的最佳SVM 參數(shù),最后通過實驗采集的數(shù)據(jù)進行測試,得到最佳分類結(jié)果。 若不滿足最佳參數(shù),則蜉蝣還要歷經(jīng)運動、交配、突變等操作過程,直至獲得最佳參數(shù)為止。
為驗證本文方法的運行效果,通過電能質(zhì)量分析儀設(shè)備來采集家用電器數(shù)據(jù),采集時間定為15 min,在此基礎(chǔ)上再讓家用負荷隨機啟停100 次,最后使用Powerlog 軟件來分析采集數(shù)據(jù),進行特征提取。 當?shù)玫接米鳒y試樣本和訓練樣本的數(shù)據(jù)集后,則分別采用MA-SVM 與PSO-SVM 算法進行辨識,其中,標簽一為多用鍋一(600 W)、標簽二為多用鍋二(450 W)、標簽三為暖風機(500 W)、標簽四為熱吹風(1 200 W)、標簽五為熱水壺一(1 500 W)、標簽六為熱水壺二(1 500 W)。 MA-SVM 算法的訓練集和測試集包含3 個負荷特征,分別為: 有功功率(P)、無功功率(Q) 及總負荷諧波畸變率(THD)。MA-SVM 算法參數(shù):種群數(shù)量pop =100,雄性蜉蝣數(shù)量為50、雌性蜉蝣數(shù)量為50,最大迭代次數(shù)為200 次,遠視系數(shù)為2,個體學習系數(shù)為1.0,群體學習系數(shù)為1.5。 變異率為0.01,參數(shù)a1=1,a2=1.5,a3=1.5。 SVM 的核函數(shù)為RBF,其對應(yīng)的平均適應(yīng)度值和最優(yōu)適應(yīng)度值的變化范圍如圖2 所示。
圖2 MA-SVM 算法的最佳適應(yīng)度和平均適應(yīng)度的變化Fig.2 The change of optimal fitness and average fitness of MASVM algorithm
由圖2 可以得到,當MA-SVM 模型取得最優(yōu)參數(shù)時,SVM 中最佳參數(shù)c =62.311 4,g =2.490 2。取得最佳參數(shù)后,在測試集進行驗證,運行結(jié)果如圖3 所示。
圖3 MA-SVM 算法的分類結(jié)果Fig.3 The classification results of MA-SVM algorithm
在相同數(shù)據(jù)集的基礎(chǔ)上,PSO-SVM 算法參數(shù):種群數(shù)量為pop =20,最大迭代數(shù)為200,局部搜索參數(shù)為1.5,全局搜索為1.7, 參數(shù)c1=1.5,c2=1.7。SVM 的核函數(shù)為RBF,其對應(yīng)的平均適應(yīng)度值和最優(yōu)適應(yīng)度值的變化范圍如圖4 所示。
由圖4 可以得到,當PSO-SVM 模型取得最優(yōu)參數(shù)時,SVM 中最佳參數(shù)c =12.073 5,g =2.679 4。取得最佳參數(shù)后,在測試集進行驗證,運行結(jié)果如圖5 所示。
圖4 PSO-SVM 算法的最佳適應(yīng)度和平均適應(yīng)度的變化Fig.4 The change of optimal fitness and average fitness of PSOSVM algorithm
圖5 PSO-SVM 算法的分類結(jié)果Fig.5 The classification results of PSO-SVM algorithm
在相同數(shù)據(jù)集基礎(chǔ)上,由MA-SVM、PSO-SVM和SVM 進行分類后的6 種家用負荷識別準確率詳見表1。
表1 6 種家用負荷識別準確率Tab.1 Identification accuracy of 6 kinds of household load %
由表1 可以看出,MA-SVM 算法比起傳統(tǒng)SVM和PSO-SVM 算法具有較高的負荷準確率。 對多個低功率家用負荷具有良好的識別效果。
針對一些低功率家用負荷辨識效果較差的問題,本文采用有功P、無功Q及負荷的總諧波畸變率THD作為負荷特征,研發(fā)提出了蜉蝣算法來進行參數(shù)C和g的尋優(yōu),從而改進支持向量機的方法。 研究結(jié)果表明與PSO 算法優(yōu)化效果相比,采用MASVM 對于低功率的負荷識別具有更好的準確性。