王鵬飛,任麗佳,高 燕
(上海工程技術(shù)大學(xué) 電子電氣工程學(xué)院,上海 201620)
近年來,隨著社會(huì)的高速發(fā)展,分布式電源[1]、電氣化鐵路[2]、冶金設(shè)備[3]等新型負(fù)載被大量接入電網(wǎng)。雖然它們給社會(huì)帶來了便捷與正向收益,但也成為了新型的電能質(zhì)量擾動(dòng)發(fā)生源。電力系統(tǒng)中電能質(zhì)量擾動(dòng)事件[4](Power Quality Disturbance Events,PQDEs)變得越來越多。諧波,電壓閃變,暫態(tài)震蕩等電能質(zhì)量的增多,對(duì)高精度儀器,用電設(shè)備的危害極其嚴(yán)重,甚至?xí)绊懙秸麄€(gè)電網(wǎng)的安全運(yùn)行。電能質(zhì)量擾動(dòng)具有偶發(fā)性與瞬發(fā)性的特點(diǎn),檢測擾動(dòng)類型就需要大量的數(shù)據(jù),靠人為來觀察這些數(shù)據(jù)就顯得很不現(xiàn)實(shí)。故此,一款能夠準(zhǔn)確高效的分辨電能質(zhì)量擾動(dòng)類型的分類方法,就顯得尤為重要。
電能質(zhì)量擾動(dòng)信號(hào)分類處理,其本質(zhì)是數(shù)據(jù)處理,傳統(tǒng)的特征提取方法有:小波變換(WT)[5]、模態(tài)分解(EMD)[6]、希爾伯特-黃變換(HHT)[7]、S變換[8~10]等。WT對(duì)噪聲敏感,且特征提取的優(yōu)缺與小波基的選擇有很大的關(guān)系,特征提取效果存在偶然性。EMD主要的問題是模態(tài)混疊,這會(huì)混淆IMF的時(shí)頻分布,破壞其物理意義。HHT具有充分的自適應(yīng)性和對(duì)非平穩(wěn)信號(hào)的精確分析能力。它可以同時(shí)滿足時(shí)域和頻率軸的精度要求。但是,它需要復(fù)雜的遞歸,處理時(shí)間較長。S變換窗函數(shù)的窗寬與頻率成反比,窗函數(shù)具有選擇性,時(shí)頻信號(hào)中各頻率分量的相位譜與初始信號(hào)具有固定的關(guān)系。這就使得S變換具有良好的時(shí)頻分析能力。
在分類器構(gòu)建階段,有很多模式識(shí)別的分類方法,常見的有:人工神經(jīng)網(wǎng)絡(luò)法(ANN)[11],決策樹(DT)[12],支持向量機(jī)(SVM)[13]等。ANN通過判別函數(shù)去計(jì)算已知類別的分類樣本,對(duì)于未知樣本不能做出分類,而且ANN是非線性的,需要較長的分類時(shí)間,且有較差的分類速度。DT對(duì)樣本的依賴程度高,訓(xùn)練質(zhì)量直接影響分類效果,容易局部最優(yōu),過擬合也是它常有的問題。SVM通過一個(gè)平面或是超平面將兩類樣本準(zhǔn)確無誤的劃分為兩類。特別在處理小樣本、非線性以及高維模式時(shí)可以有效的分類。SVM的分類效果受懲罰因子C和核函數(shù)參數(shù)g的影響較大,需要通過參數(shù)尋優(yōu)等方法來提高其分類能力。
為了解決電能質(zhì)量擾動(dòng)信號(hào)特征提取與分類準(zhǔn)確率提升困難的問題,本文提出了一種基于不完全S變換與CBAS優(yōu)化SVM的特征提取擾動(dòng)分類方法。首先利用不完全S變換對(duì)電能質(zhì)量特定頻率數(shù)據(jù)處理得到模矩陣,繪制時(shí)頻信號(hào)圖,運(yùn)用遞歸特征消除[14](Recursive Feature Elimination-RFE)優(yōu)化特征向量數(shù)量以減少計(jì)算時(shí)間。然后利用改進(jìn)步長變換方式的BAS算法[15]優(yōu)化SVM尋找最優(yōu)參數(shù)(c,g)。最后代入訓(xùn)練集與測試集樣本,查看分類效果。根據(jù)實(shí)驗(yàn)結(jié)果顯示,本文提出的特征提取與分類方法,具有較高的分辨準(zhǔn)確率,并且在不同的噪聲環(huán)境下也有不錯(cuò)的表現(xiàn),體現(xiàn)了其良好的識(shí)別與抗噪能力。
S變換采用了窗寬與頻率的倒數(shù)成正比的高斯窗函數(shù),窗寬不再固定不變,時(shí)頻特性更好。
擾動(dòng)信號(hào)x(t)的S變換S(τ,f)定義如下:
其中w(τ-t,f)為高斯窗函數(shù),τ為w(τ-t,f)在t軸某處的參數(shù)。式(1)、式(2)是S變換的連續(xù)函數(shù)形式,離散型式如下:
式中,N為采樣點(diǎn)數(shù),j,m=0,1,2,...,N-1;n=0,1,2,...N/2,k為窗寬調(diào)節(jié)因子[16],k值的變化會(huì)改變S變換在不同頻率條件下的時(shí)頻分辨率[17]。k值變小,S變換時(shí)間分辨率提高,k值變大,S變換頻率分辨率提高。
對(duì)于電能質(zhì)量數(shù)據(jù)中的N個(gè)離散信號(hào)x[j],j=0,1,...,N-0利用式(3)、式(4)進(jìn)行變換,可以得到一個(gè)二維復(fù)數(shù)結(jié)果矩陣,其中行對(duì)應(yīng)頻率特性,列對(duì)應(yīng)時(shí)間特性。實(shí)際頻率值為(fs/N)*n,fs是采樣頻率。復(fù)數(shù)矩陣不能全面的展示信號(hào)的特性,故需對(duì)結(jié)果矩陣求模得到幅值矩陣(記做STM)。STM可以反映信號(hào)的時(shí)頻特性[18]。
通過對(duì)STM矩陣的分析,發(fā)現(xiàn)并不是矩陣中所有頻率對(duì)應(yīng)的向量都是有用的。特征往往集中在某些特定頻率所對(duì)應(yīng)的位置上。故考慮在這些特別的頻率點(diǎn)進(jìn)行S變換,因?yàn)閷?duì)高斯窗的參數(shù)m設(shè)置了特定值,所以稱之為不完全S變換。這樣不僅能夠針對(duì)性的提取有效特征,還能夠節(jié)省計(jì)算時(shí)間。
這些特定的頻率主要有兩種,分別是奈奎斯特(Nyquist)頻率[19]及m*fk頻率。Nyquist頻率可以反映切口和尖峰的周期性[20]。fk為電網(wǎng)電能信號(hào)基頻,其值為50Hz,隨著m值的變化,可以得到不用類型電能質(zhì)量擾動(dòng)的特點(diǎn)。當(dāng)m=1時(shí),m*fk為基頻,可以找出電壓暫升/暫降/中斷/閃變等特性;當(dāng)m=3,5,7,9時(shí),m*fk所對(duì)應(yīng)的頻率為奇次諧波主要存在的頻率段,就能反映出擾動(dòng)信號(hào)諧波特性[21];當(dāng)m=5,7,9,11,15,17,19時(shí),因m*fk所代表的頻率段包含了振蕩中心頻率[22]。所以可以反映暫態(tài)振蕩特性。圖1、圖2給出S變換與不完全S變換對(duì)隨機(jī)生成的信噪比在20~50dB間的諧波與暫態(tài)振蕩信號(hào)變換后的STM矩陣三維時(shí)頻圖。
圖1 某諧波信號(hào)S變換、不完全S變換時(shí)頻對(duì)比
圖2 某暫態(tài)振蕩信號(hào)S變換、不完全S變換時(shí)頻對(duì)比
由圖1、圖2可知:本文提出的不完全S變換對(duì)擾動(dòng)信號(hào)處理后的三維時(shí)頻圖的效果明顯好于S變換對(duì)同一信號(hào)處理得到的三維時(shí)頻圖,從而能夠更好地反映幅值、諧波頻率等各種擾動(dòng)的特點(diǎn),證明了該方法的可行性。
利用以上設(shè)定的頻率值,對(duì)電能質(zhì)量擾動(dòng)信號(hào)進(jìn)行不完全S變換后得到STM矩陣。分別求出每行每列的最值、均值及方差來分別對(duì)應(yīng)時(shí)域,頻域特征向量。行的表示為r(max)、r(min)、r(mean)、r(std),列的表示為c(max)、c(min)、c(mean)、c(std)。再引入各最值的和、均、差、方差值組成特征A1-A30。具體如表1所示。
表1 特征提取(A1-A30)
天牛須搜索算法(Beetle Antennae Search-BAS)在不知道函數(shù)的具體形式或梯度信息的情況下,可以實(shí)現(xiàn)有效的優(yōu)化。與PSO相比,BAS只有一個(gè)個(gè)體,大大減少了計(jì)算量。其具體形式如下。
第一步:在某n維空間,用xl代表左須,xr代表右須,x代表天牛頭中心,d0代表兩根觸須的間隔。為模擬自然界中天牛頭部朝向存在隨機(jī)性的設(shè)定,利用隨機(jī)向量dir表示兩觸須的隨機(jī)朝向。
歸一化為:
這樣就能得到:
第二步:對(duì)函數(shù)f,求左須與右須的值:f left=f(xl);fright=f(xr)。
第三步:將第二步的兩須值進(jìn)行比較,若fleft<f right,天牛需要向左邊移動(dòng)step個(gè)步長才能尋找最小值,即:
若fleft>f right,天牛就得向著相反的方向移動(dòng)step個(gè)步長,即:
上述情況可以利用符號(hào)函數(shù)sign寫成:
其中,normal是歸一化函數(shù)。
BAS算法,尋優(yōu)快,收斂快,但是步長變換方式不同,對(duì)算法的影響較大。關(guān)于變步長方式,常見的有兩種方式,具體情況如下所示。
變步長方式1:
其中:eta是線性變步長參數(shù),其取值范圍為[0.1,1],通常取值為0.95;
變步長方式2:
其中:temp為引入的新變量,step0為初始步長值。
上面兩種變步長方法都是線性形式,前期步長縮小快,后期相對(duì)緩慢。這就會(huì)使得BAS算法全局搜索能力減弱,出現(xiàn)算法早熟現(xiàn)象。針對(duì)這一現(xiàn)象,提出一種新的步長改變策略,如式(15)所示:
按照式(15)變換步長,步長變換為非線性,步長會(huì)隨著迭代次數(shù)的增加而減小。式中δstart為初始步長,δend為迭代到最大次數(shù)的步長,T是最大迭代次數(shù)。
相較于BAS變步長方式,CBAS的步長變化為初始時(shí)步長下降速度慢,之后隨著迭代次數(shù)的增加下降速度逐漸變快。這樣就解決了BAS全局尋優(yōu)較弱的缺點(diǎn),均衡了BAS的局部和全局尋優(yōu)能力。
支持向量機(jī)(SVM)是一種具有出色學(xué)習(xí)性能的模式識(shí)別方法,在電力系統(tǒng)的故障診斷,負(fù)荷預(yù)測等領(lǐng)域都有成功的應(yīng)用。但核函數(shù)參數(shù)與懲罰因子這兩個(gè)參量的變化會(huì)影響SVM的分類效果。故引用優(yōu)化后的CBAS算法對(duì)SVM進(jìn)行性能調(diào)優(yōu),具體步驟如下所示。
步驟一:初始化天牛須搜索算法,設(shè)定初始質(zhì)心及兩須坐標(biāo)、兩須間的距離、初始步長、最大迭代次數(shù)。
步驟二:設(shè)置懲罰因子c及核函數(shù)參數(shù)g的尋優(yōu)范圍,一般c的范圍為[0.1,100],g的范圍為[0.01,100]。在給定范圍內(nèi)隨機(jī)初始化CBAS,并將樣本送入診斷模型。
步驟三:算法尋優(yōu)內(nèi)行為,自行對(duì)比左右須值并選擇朝值小的一方運(yùn)動(dòng)一個(gè)步長。
步驟四:CBAS完成一次運(yùn)動(dòng)后,會(huì)記錄全局氣味最大的點(diǎn),如果本次迭代后,全局氣味最大值優(yōu)于先前的最優(yōu)值,CBAS就會(huì)保留此次的全局氣味最優(yōu)點(diǎn)作為新的最優(yōu)值,并保存對(duì)應(yīng)的參數(shù)值。
步驟五:判斷是否達(dá)到最大迭代次數(shù),若未達(dá)到,就返回步驟三繼續(xù)尋優(yōu)。
步驟六:滿足條件,結(jié)束尋優(yōu),SVM最優(yōu)參數(shù)值,對(duì)應(yīng)全局氣味最優(yōu)值取值時(shí)的參數(shù),將這兩個(gè)參數(shù)代入SVM中,利用樣本集進(jìn)行訓(xùn)練,并使用測試集驗(yàn)證性能。
CBAS優(yōu)化SVM流程圖如圖3所示。
圖3 CBAS-SVM模型實(shí)現(xiàn)流程
為了驗(yàn)證本文所提模型的實(shí)際分類效果,采用文獻(xiàn)[4~8]的數(shù)學(xué)模型,隨機(jī)產(chǎn)生包括電壓驟升驟降、閃變、中斷、諧波、暫態(tài)振蕩、諧波+暫升暫降、暫態(tài)振蕩+閃變、諧波+暫態(tài)振蕩在內(nèi)的10種,共240組數(shù)據(jù),其中訓(xùn)練樣本及測試樣本分別為200個(gè)和40個(gè)。
上述擾動(dòng)信號(hào),隨機(jī)加入信噪比為40db、30db、20db的白噪聲,SVM核函數(shù)選擇RBF核函數(shù),設(shè)置SVM參數(shù)值分別為c=0.5216,g=4.3510(此處c,g為CBAS尋找到的最優(yōu)參數(shù));實(shí)驗(yàn)利用不完全S變換后得到的結(jié)果矩陣,實(shí)驗(yàn)利用表1中的特征量來訓(xùn)練分類器,特征量數(shù)目相對(duì)較多,且存在一定的重復(fù)特征或無用特征,故采用遞歸特征消除的方法反復(fù)的構(gòu)建SVM模型來不斷地減少特征集的規(guī)模并選擇合適的特征量。排除對(duì)分類效果不能產(chǎn)生較大提升的非關(guān)鍵性特征,選取分類效果最優(yōu)的特征組F={A1,A2,A5,A7,A10,A16,A17,A18,A22,A24,A28}作為訓(xùn)練特征矩陣,輸入分類模型中。在訓(xùn)練組對(duì)模型多次訓(xùn)練后利用測試組驗(yàn)證分類準(zhǔn)確率及分類所耗時(shí)長。
按照上述參數(shù)配置好CBAS-SVM模型,將240組樣本隨機(jī)打亂輸入該模型,該模型會(huì)自行選擇200組數(shù)據(jù)作為訓(xùn)練組,及40組數(shù)據(jù)作為測試組,多次實(shí)驗(yàn),利用平均數(shù)值來體現(xiàn)模型性能,極大的提升了模型預(yù)測的說服力。模型預(yù)測十次,記錄每次的結(jié)果。該模型性能穩(wěn)定,十次預(yù)測結(jié)果并無太大偏差,選取30db下第五次的預(yù)測結(jié)果如圖4所示。從圖4中可以看出CBAS-SVM模型對(duì)電能質(zhì)量問題的預(yù)測值可以做到和實(shí)際值完全一致,偶有幾次會(huì)出現(xiàn)95%的準(zhǔn)確率。另外為了體現(xiàn)CBAS-SVM模型的優(yōu)勢,還分別采用了SVM和PSO-SVM在相同條件下對(duì)同一數(shù)據(jù)做了預(yù)測分析,同樣的記錄了各自每次的實(shí)驗(yàn)結(jié)果,并選取30db下第五次的預(yù)測效果如圖5所示。
圖4 CBAS-SVM對(duì)特殊負(fù)載的預(yù)測結(jié)果曲線
圖5 不同模型對(duì)特殊負(fù)載的預(yù)測結(jié)果曲線
結(jié)合圖4、圖5可看出,SVM模型未對(duì)(c,g)參數(shù)優(yōu)化,故其預(yù)測效果雖能大體上呈現(xiàn)測試組數(shù)據(jù)的實(shí)際類型,但總體正確率不高;PSO-SVM的預(yù)測曲線,大致上和實(shí)際值曲線吻合,但是個(gè)別數(shù)值存在偏差嚴(yán)重的問題。由此,傳統(tǒng)SVM及PSO-SVM模型對(duì)數(shù)據(jù)處理后的預(yù)測結(jié)果準(zhǔn)確率明顯低于CBAS-SVM的預(yù)測效果。
為了更直觀地區(qū)分這三種模型的性能差異,本文列舉了三種預(yù)測結(jié)果的平均精度及其所耗費(fèi)的時(shí)間,詳細(xì)記錄在表2中。
表2 三種模型的預(yù)測準(zhǔn)確率及耗時(shí)
由表2可看出,在不同的信噪比條件下CBAS-SVM的預(yù)測準(zhǔn)確率最高,且相較于另外兩種分類方式受噪聲影響程度更低。其運(yùn)行時(shí)長也是得到了明顯的縮短,比耗時(shí)相對(duì)較短的PSO-SVM的時(shí)間還縮短了進(jìn)57.73%。由此可得出結(jié)論:CBAS-SVM模型能夠顯著提升預(yù)測準(zhǔn)確率,且針對(duì)相同數(shù)據(jù)分類耗時(shí)更短,性能最優(yōu),更適合工程應(yīng)用。
本文首先,利用不完全S變換針對(duì)性的提取電能質(zhì)量擾動(dòng)信號(hào)特定頻率波形特點(diǎn),大大減少了特征提取的計(jì)算量。其次,提出新的步長改進(jìn)方式,改善了BAS算法易出現(xiàn)算法早熟,全局尋優(yōu)能力較弱的問題,均衡了算法的性能。并利用CBAS算法對(duì)SVM兩個(gè)參數(shù)進(jìn)行尋優(yōu),提升了CBAS-SVM模型的綜合性能。利用不完全S變換提取多特征建立特征矩陣分別輸入RF、PSO-SVM、CBAS-SVM模型進(jìn)行結(jié)果對(duì)比,實(shí)驗(yàn)證明,提出的基于不完全S變換的CBAS-SVM模型不僅具有較高的分辨準(zhǔn)確率,而且耗時(shí)更短,實(shí)時(shí)性更佳。