王世旭,呂干云
(浙江師范大學(xué)數(shù)理與信息工程學(xué)院,金華 3210042)
基于標(biāo)簽傳播半監(jiān)督學(xué)習(xí)的電壓暫降源識(shí)別
王世旭,呂干云
(浙江師范大學(xué)數(shù)理與信息工程學(xué)院,金華 3210042)
針對(duì)帶標(biāo)簽(類(lèi)別已知)的電壓暫降歷史樣本數(shù)據(jù)有限且不易獲得的情況,引入基于標(biāo)簽傳播半監(jiān)督學(xué)習(xí)的電壓暫降源識(shí)別方法。首先從電壓暫降信號(hào)中提取了五類(lèi)暫降信號(hào)特征,建立了K-近鄰圖模型,并實(shí)現(xiàn)了圖模型上的標(biāo)簽傳播。分析了圖模型參數(shù)k、α對(duì)標(biāo)簽傳播結(jié)果的影響,同時(shí)與神經(jīng)網(wǎng)絡(luò)、最小二乘支持向量機(jī)等監(jiān)督學(xué)習(xí)算法的識(shí)別結(jié)果進(jìn)行了對(duì)比。仿真結(jié)果表明,在歷史數(shù)據(jù)較少的情況下,標(biāo)簽傳播算法比傳統(tǒng)監(jiān)督學(xué)習(xí)算法具有更高的識(shí)別準(zhǔn)確率且實(shí)時(shí)性好。
電壓暫降源識(shí)別;標(biāo)簽傳播;半監(jiān)督;特征提取;K-近鄰圖模型
電壓暫降是指供電電壓有效值快速下降至額定值的10%~90%的事件,其典型持續(xù)時(shí)間為0.5~30個(gè)周波[1]。隨著計(jì)算機(jī)、電動(dòng)機(jī)驅(qū)動(dòng)器、可編程控制器等電壓暫降敏感設(shè)備的廣泛使用,在生產(chǎn)過(guò)程中,電壓暫降造成的生產(chǎn)延遲或者中斷給大多數(shù)的工業(yè)用戶(hù)帶來(lái)了巨大的經(jīng)濟(jì)損失[2-3]。造成電壓暫降的原因主要有三類(lèi):故障、感應(yīng)電機(jī)啟動(dòng)、變壓器激磁涌流。電壓暫降源識(shí)別研究是電壓暫降分析、評(píng)估、采取有效補(bǔ)償措施等工作的基礎(chǔ),具有重要的意義[4]。
目前電壓暫降源識(shí)別主要是在運(yùn)用小波變換、S變換等數(shù)學(xué)工具對(duì)電壓暫降信號(hào)進(jìn)行特征提取的基礎(chǔ)上通過(guò)神經(jīng)網(wǎng)絡(luò)、模糊邏輯、支持向量機(jī)、關(guān)聯(lián)向量機(jī)、貝葉斯準(zhǔn)則等監(jiān)督學(xué)習(xí)算法進(jìn)行分類(lèi)從而得到識(shí)別結(jié)果[5-10]。以上用于電壓暫降源識(shí)別的方法取得了良好的效果,但大多需要相對(duì)較多的帶標(biāo)簽電壓暫降信號(hào)樣本(即暫降源類(lèi)別已知)。然而實(shí)際中的電壓暫降歷史數(shù)據(jù)有限,且不同原因引起的電壓暫降分布并不均(大多電壓暫降是由短路故障引起的,同時(shí)在短路故障電壓暫降中,通常超過(guò)70%的電壓暫降是由單相接地故障引起的[11]),這將導(dǎo)致部分類(lèi)別的電壓暫降信號(hào)歷史樣本極少,使得以上方法的實(shí)際效果難以得到保證。
與傳統(tǒng)的監(jiān)督學(xué)習(xí)只利用帶標(biāo)簽樣本、無(wú)監(jiān)督學(xué)習(xí)只關(guān)注不帶標(biāo)簽樣本不同,半監(jiān)督學(xué)習(xí)研究綜合利用少量帶標(biāo)簽和大量的不帶標(biāo)簽樣本提高學(xué)習(xí)性能,成為當(dāng)前機(jī)器學(xué)習(xí)和模式識(shí)別的重要研究領(lǐng)域之一[12]。近幾年,半監(jiān)督學(xué)習(xí)已經(jīng)在互聯(lián)電網(wǎng)動(dòng)態(tài)控制、電力電纜局部放電模式識(shí)別等電力領(lǐng)域得到初步的應(yīng)用[13-14]。標(biāo)簽傳播算法LP (label propagation)[15]是基于圖的半監(jiān)督學(xué)習(xí)方法之一,其不受樣本分布的局限、控制參數(shù)少、易于實(shí)現(xiàn)。本文將LP算法用于電壓暫降源識(shí)別,在帶標(biāo)簽樣本較少的情況下取得了良好的識(shí)別效果。
LP算法通過(guò)在圖上傳播樣本標(biāo)簽的方式來(lái)解決分類(lèi)問(wèn)題。圖中的每一個(gè)節(jié)點(diǎn)對(duì)應(yīng)著一個(gè)樣本(包括帶標(biāo)簽和不帶標(biāo)簽的樣本),而圖中的兩個(gè)節(jié)點(diǎn)之間的邊的大小表示對(duì)應(yīng)的兩個(gè)樣本之間的相似度[15]。
首先假設(shè){(x1,y1),(x2,y2),…,(xl,yl)}為帶標(biāo)簽樣本集,用L表示,l為帶標(biāo)簽的樣本個(gè)數(shù),y∈{1,2,…,C}。{xl+1,xl+2,…,xl+u}為不帶標(biāo)簽樣本集,用U表示,u為不帶標(biāo)簽的樣本個(gè)數(shù)。通常l?u,總的樣本數(shù):
把所有的樣本作為節(jié)點(diǎn)建立圖G,用節(jié)點(diǎn)i與節(jié)點(diǎn)j之間邊的大小wij表示節(jié)點(diǎn)之間的相似度,可以得到節(jié)點(diǎn)的相似度矩陣W[15]:
式中,α為超參數(shù)。根據(jù)相似的樣本應(yīng)具有相同的標(biāo)簽的聚類(lèi)假設(shè),節(jié)點(diǎn)的標(biāo)簽通過(guò)邊傳播到它的近鄰節(jié)點(diǎn),在傳播過(guò)程中,邊越大的節(jié)點(diǎn)之間,越容易實(shí)現(xiàn)標(biāo)簽傳播。故由節(jié)點(diǎn)的相似度矩陣可以得到一個(gè)n×n的概率轉(zhuǎn)移矩陣P[15]:
式中,pij為節(jié)點(diǎn)i的標(biāo)簽向節(jié)點(diǎn)j轉(zhuǎn)移的概率。同時(shí)定義一個(gè)與帶標(biāo)簽樣本集對(duì)應(yīng)的l×C的標(biāo)簽矩陣YL,其第i行代表第i個(gè)帶標(biāo)簽樣本的標(biāo)簽向量,對(duì)i∈L有[15]:
式中,c∈{1,2,…,C}。下面介紹節(jié)點(diǎn)的標(biāo)簽矩陣f,f為一n×C矩陣,其中前l(fā)行為fL。概率轉(zhuǎn)移矩陣P和標(biāo)簽矩陣f是LP算法中的兩個(gè)基本矩陣。LP算法的目的是要計(jì)算出節(jié)點(diǎn)的標(biāo)簽矩陣f,算法的基本流程如下[15]。
2.1 電壓暫降特征提取
S變換是在連續(xù)小波變換和短時(shí)傅里葉變換基礎(chǔ)上結(jié)合發(fā)展起來(lái)的一種時(shí)頻分析方法,具有良好的時(shí)頻分析能力,它在電壓擾動(dòng)和諧波檢測(cè)方面取得豐富的成果[6]。為了識(shí)別三相短路、兩相短路、單相短路、電動(dòng)機(jī)啟動(dòng)、變壓器投切五類(lèi)電壓暫降源,本文基于暫降的三相電壓幅值信息,采用S變換對(duì)電壓暫降信號(hào)的以下五類(lèi)11個(gè)特征量進(jìn)行了提取。
1)諧波特征。電壓暫降發(fā)生前后的a、b、c相電壓諧波增量:
式中,Ulsag、Uhsag、Ulpre、Uhpre分別指暫降期間、發(fā)生前的基波有效值和總諧波有效值。
2)幅值跳變次數(shù)。通過(guò)觀測(cè)S模矩陣各頻率幅值變化來(lái)確定幅值突變次數(shù)。短路故障引起的暫降幅值突變次數(shù)可達(dá)兩次或兩次以上;而電動(dòng)機(jī)引起的暫降只存在一次幅值突變。
3)三相恢復(fù)斜率。不同原因引起的暫降有著不同的a、b、c相恢復(fù)斜率:
4)暫降時(shí)間特征。a、b、c相電壓暫降持續(xù)時(shí)間與平穩(wěn)時(shí)間之比:
式中:T是電壓暫降持續(xù)時(shí)間;Tw指平穩(wěn)時(shí)間即基波電壓幅值在最低點(diǎn)附近的持續(xù)時(shí)間。
5)三相不平衡度。根據(jù)對(duì)稱(chēng)分量法可求得正序、負(fù)序電壓離散序列u1(k)、u2(k),然后分別求出電壓正序、負(fù)序的均方根值,便可求出三相不平衡度θ:
2.2 電壓暫降源識(shí)別
2.2.1 建立K-近鄰圖模型
在基于圖的算法中,往往構(gòu)造一個(gè)高質(zhì)量的圖比選擇具體算法更加有意義。稀疏圖與全連接圖不同,不相似節(jié)點(diǎn)間沒(méi)有冗余連接,一般在實(shí)際應(yīng)用中的性能較好。本文選擇建立K-近鄰圖取代上文的全連接圖。圖中每個(gè)節(jié)點(diǎn)只和一部分節(jié)點(diǎn)相連,即構(gòu)造一個(gè)n×n的概率轉(zhuǎn)移矩陣,使得標(biāo)簽只在近鄰之間傳播:
式中,xi、xj∈(L∪U),N(xi)表示xi的近鄰。
2.2.2 暫降源標(biāo)簽傳播
K-近鄰圖建立之后,根據(jù)LP算法的基本流程容易實(shí)現(xiàn)電壓暫降信號(hào)樣本的標(biāo)簽在圖模型上的傳播,即實(shí)現(xiàn)電壓暫降源的識(shí)別。隨著迭代次數(shù)的增加,識(shí)別準(zhǔn)確率逐漸提高,但經(jīng)多次仿真發(fā)現(xiàn),在少數(shù)傳播過(guò)程中,迭代結(jié)束時(shí)的識(shí)別準(zhǔn)確率會(huì)稍低于迭代過(guò)程末段的識(shí)別準(zhǔn)確率。因此本文將迭代停止條件設(shè)置為
ε為一極小的正數(shù),以替代常用的迭代停止條件為(收斂):
仿真結(jié)果表明這樣設(shè)置并不顯著影響識(shí)別準(zhǔn)確率甚至好于原設(shè)置情況下的結(jié)果,且運(yùn)行時(shí)間明顯減少。標(biāo)簽傳播過(guò)程結(jié)束后,查找矩陣fU各行中的最大值,其對(duì)應(yīng)的列號(hào)即為不帶標(biāo)簽樣本的標(biāo)簽,fU是標(biāo)簽矩陣f的子矩陣:
仿真分析在一臺(tái)2.79 GHz、2.80 GHz Pentium (R)D CPU、內(nèi)存512 MB的PC機(jī)上進(jìn)行,仿真工具M(jìn)atlab2009a。通過(guò)Simulink工具箱建立電路模型,基頻為50 Hz,采樣頻率為6.4 kHz。隨機(jī)改變電路模型中的電源、負(fù)荷、線段、變壓器、故障和電機(jī)等參數(shù),產(chǎn)生五類(lèi)電壓暫降信號(hào)樣本共100個(gè)作為總樣本集。
3.1 標(biāo)簽傳播過(guò)程
從總樣本集中隨機(jī)取出每類(lèi)2個(gè)作為帶標(biāo)簽樣本集,其余的樣本去掉標(biāo)簽組成不帶標(biāo)簽樣本集,以測(cè)試算法識(shí)別效果。設(shè)置ε=0.000 1,k=8,α=0.4。標(biāo)簽傳播過(guò)程中前50次迭代的識(shí)別率和識(shí)別準(zhǔn)確率變化曲線如圖1所示。圖中識(shí)別率為帶標(biāo)簽樣本(包含初始帶標(biāo)簽和傳播過(guò)程中獲得標(biāo)簽的初始不帶標(biāo)簽樣本)在所有樣本中所占的比例,識(shí)別準(zhǔn)確率為初始的不帶標(biāo)簽樣本中獲得正確標(biāo)簽的樣本所占的比例。需要說(shuō)明的是,本文中fU初始化為零矩陣。
圖1 識(shí)別率和識(shí)別準(zhǔn)確率的變化Fig.1Variation of identification rate and identification accuracy
由建立的K-近鄰圖可知,不帶標(biāo)簽樣本不是從帶標(biāo)簽樣本處學(xué)習(xí)獲得類(lèi)別標(biāo)簽,而是從其k個(gè)近鄰處學(xué)習(xí)獲得類(lèi)別標(biāo)簽。取樣本的三個(gè)特征建立的三維標(biāo)簽傳播過(guò)程如圖2所示。
圖(a)為初始的狀況(三相短路、兩相短路、單相短路、電動(dòng)機(jī)啟動(dòng)、變壓器投切五類(lèi)電壓暫降源樣本每類(lèi)兩個(gè),其余的電壓暫降源樣本類(lèi)別未知),圖(b)、(c)、(d)分別是迭代次數(shù)為1、10、40時(shí)標(biāo)簽傳播的情況(圖1中已用虛線標(biāo)出)??煽闯觯?/p>
(1)在傳播過(guò)程中不帶標(biāo)簽的樣本逐漸減少,圖(a)中除了每類(lèi)2個(gè)帶標(biāo)簽的樣本之外,其余全為不帶標(biāo)簽的樣本;圖(b)中不帶標(biāo)簽的樣本已大大減少,識(shí)別率達(dá)到43.33%。隨著迭代次數(shù)增加,圖(c)、(d)中已不存在不帶標(biāo)簽的樣本,即已對(duì)所有電壓暫降樣本的產(chǎn)生原因都做出了一個(gè)基本的判斷。
(2)在識(shí)別率達(dá)到100%(即不存在不帶標(biāo)簽的樣本)后的傳播過(guò)程中,樣本的標(biāo)簽仍然會(huì)發(fā)生變化,隨之識(shí)別準(zhǔn)確率發(fā)生變化,圖(c)、(d)對(duì)應(yīng)識(shí)別準(zhǔn)確率分別為82.22%和88.89%??梢?jiàn),在整個(gè)標(biāo)簽傳播的過(guò)程中,電壓暫降樣本的類(lèi)別得到了不斷的校正,對(duì)于每個(gè)電壓暫降樣本,以求找到造成暫降的盡可能準(zhǔn)確的原因。
3.2 模型參數(shù)影響分析
基于圖的半監(jiān)督學(xué)習(xí)算法在構(gòu)造圖時(shí)常常遇到以下兩個(gè)問(wèn)題:①相似度函數(shù)的超參數(shù)不易控制;②樣本的近鄰個(gè)數(shù)k難以確定。目前多采用人工設(shè)置的方法。為了研究圖模型參數(shù)對(duì)標(biāo)簽傳播結(jié)果的影響,選用與上文相同的帶標(biāo)簽和不帶標(biāo)簽樣本集,對(duì)不同k、α?xí)r的識(shí)別準(zhǔn)確率及運(yùn)行時(shí)間進(jìn)行了仿真分析,結(jié)果如圖3所示。
圖2 標(biāo)簽傳播過(guò)程Fig.2Process of label propagation
圖3 參數(shù)k、α對(duì)識(shí)別準(zhǔn)確率和運(yùn)行時(shí)間的影響Fig.3The influence of parameters k and α’s on identification accuracy and running time
由圖3可見(jiàn),首先,當(dāng)k較小時(shí)識(shí)別準(zhǔn)確率明顯偏低,因?yàn)樵趉較小時(shí)會(huì)造成不連接圖,在α較大時(shí),識(shí)別準(zhǔn)確率同樣偏低;其次,當(dāng)α較小時(shí),運(yùn)行時(shí)間明顯增加,運(yùn)行時(shí)間對(duì)k的大小相對(duì)不敏感。同時(shí),經(jīng)過(guò)對(duì)不同樣本個(gè)數(shù)時(shí)的情況的進(jìn)一步仿真,發(fā)現(xiàn)當(dāng)樣本個(gè)數(shù)較少和相對(duì)較多的情況下,參數(shù)k、α對(duì)識(shí)別準(zhǔn)確率和運(yùn)行時(shí)間的影響有明顯的不同。因此后文針對(duì)樣本個(gè)數(shù)較少和相對(duì)較多的情況設(shè)置了不同的參數(shù)值。
3.3 識(shí)別效果對(duì)比
從總樣本集中依次隨機(jī)取出每類(lèi)樣本1~10個(gè)作為帶標(biāo)簽樣本集,剩余的作為不帶標(biāo)簽樣本集,對(duì)于徑向基神經(jīng)網(wǎng)絡(luò)RBF-NN(radial basis function neural networks)和最小二乘支持向量機(jī)LS-SVM(least squares support vector machine)則前者作為訓(xùn)練樣本集,后者作為測(cè)試樣本集。設(shè)置LS-SVM中的參數(shù)σ=4.5、w=10,同時(shí),參考上節(jié)的結(jié)論,樣本個(gè)數(shù)較少為5~15時(shí),設(shè)置LP中k=15、α=0.4,樣本個(gè)數(shù)為20~50時(shí)設(shè)置k=10、α= 0.1。三種方法各隨機(jī)運(yùn)行100次的平均識(shí)別準(zhǔn)確率以及運(yùn)行時(shí)間如表1所示。
容易看出,在樣本個(gè)數(shù)為5~25時(shí),LP算法的識(shí)別準(zhǔn)確率比RBF-NN、LS-SVM平均高出17.82%和6.54%,樣本個(gè)數(shù)為30~50時(shí),LP算法的識(shí)別準(zhǔn)確率比RBF-NN、LS-SVM平均高出5.72% 和3.33%,同時(shí)其運(yùn)行時(shí)間短且并沒(méi)有隨樣本個(gè)數(shù)增加而顯著變化的趨勢(shì)。
表1 RBF-NN、LS-SVM和LP的結(jié)果對(duì)比Tab.1Comparison results of RBF-NN,LS-SVM and LP
基于圖的半監(jiān)督學(xué)習(xí)有良好的數(shù)學(xué)基礎(chǔ),近年來(lái)受到了廣泛的關(guān)注,并取得了不少有價(jià)值的成果。LP算法在眾多基于圖的半監(jiān)督學(xué)習(xí)算法中具有基礎(chǔ)性的地位,本文將LP算法應(yīng)用于電壓暫降源的識(shí)別,在K-近鄰圖模型上實(shí)現(xiàn)了暫降源標(biāo)簽傳播,并根據(jù)圖模型參數(shù)對(duì)標(biāo)簽傳播結(jié)果的影響對(duì)參數(shù)進(jìn)行了分段設(shè)置,取得了比傳統(tǒng)監(jiān)督學(xué)習(xí)算法更好的識(shí)別效果。在實(shí)際中,電壓暫降事件頻繁發(fā)生,可利用監(jiān)測(cè)設(shè)備采集到的少量類(lèi)別已知和大量類(lèi)別未知的暫降信號(hào)的電壓幅值、相位等信息有效地完成電壓暫降源的識(shí)別。但同目前大多數(shù)半監(jiān)督算法應(yīng)用一樣,所研究的樣本為不含噪聲樣本,LP算法的抗噪性能、克服算法對(duì)帶標(biāo)簽樣本的敏感性、標(biāo)簽傳播過(guò)程的控制策略等問(wèn)題還有待研究。
[1]Lidong Zhang,Bollen M H J.Characteristic of voltage dips (sags)in power system[J].IEEE Trans on Power Delivery,2000,15(2):827-832.
[2]Bollen M H J.Understanding Power Quality Problems:Voltage Sags and Interruptions[M].New York:IEEE Press,1999.
[3]鐘慶,林凌雪,易楊,等(Zhong Qing,Lin Lingxue,Yi Yang,et al).電壓暫降問(wèn)題蒙特卡羅仿真模型比較(Comparisons among the Monto-Carlo simulation models of voltage sags)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào)(Proceedings of the CSU-EPSA),2010,22(6):143-146.
[4]徐永海,趙燕(Xu Yonghai,Zhao Yan).基于短時(shí)傅里葉變換的電能質(zhì)量擾動(dòng)識(shí)別與采用奇異值分解的擾動(dòng)時(shí)間定位(Identification of power quality disturbance based on short-term Fourier transform and disturbance time orientation by singular value decomposition)[J].電網(wǎng)技術(shù)(Power System Technology),2011,35(8):174-180.
[5]賈勇,何正友,趙靜(Jia Yong,He Zhengyou,Zhao Jing).基于小波熵和概率神經(jīng)網(wǎng)絡(luò)的配電網(wǎng)電壓暫降源識(shí)別方法(A method to identify voltage sag sources in distribution network based on wavelet entropy and probability neural network)[J].電網(wǎng)技術(shù)(Power System Technology),2009,33(16):63-69.
[6]李國(guó)棟,丁寧,徐永海(Li Guodong,Ding Ning,Xu Yonghai).基于Mamdani型模糊推理的電壓暫降源識(shí)別(Voltage sag disturbance recognition based on Mamdani fuzzy inference)[J].華北電力大學(xué)學(xué)報(bào)(Journal of North China Electric Power University),2010,37(2):43-48.
[7]呂干云,孫維蒙,汪曉東,等(Lü Ganyun,Sun Weimeng,Wang Xiaodong,et al).電力系統(tǒng)電壓暫降源定位方法綜述(Review on methods for voltage sag source location in power system)[J].電力系統(tǒng)保護(hù)與控制(Power System Protection and Control),2010,38(23):241-245.
[8]呂干云,吳傳滿(mǎn),孫維蒙,等(Lü Ganyun,Wu Chuanman,Sun Weimeng,et al).基于RVM和ANF的電壓暫降檢測(cè)識(shí)別(Detection and identification of voltage sags based on RVM and ANF)[J].電力系統(tǒng)保護(hù)與控制(Power System Protection and Control),2011,39(12):65-68.
[9]周雒維,管春,盧偉國(guó)(Zhou Luowei,Guan Chun,Lu Weiguo).多標(biāo)簽分類(lèi)法在電能質(zhì)量復(fù)合擾動(dòng)分類(lèi)中的應(yīng)用(Application of multi-label classification method to catagorization of multiple power quality disturbances)[J].中國(guó)電機(jī)工程學(xué)報(bào)(Proceedings of the CSEE),2011,31 (4):45-50.
[10]朱蘇航,呂干云(Zhu Suhang,Lü Ganyun).利用遺傳支持向量機(jī)進(jìn)行電壓暫降信號(hào)識(shí)別(Voltage sag signal identification with GA-SVM)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào)(Proceedings of the CSU-EPSA),2012,24(1):84-87.
[11]Leborgne R C,Olguin G,Bollen M H J.Sensitivity analysis of stochastic assessment of voltage dips[C]//International Conference on Power System Technology,Singapore,Singapore:2004.
[12]Wang Fei,Zhang Changshui.Label propagation through linear neighborhoods[J].IEEE Trans on Knowledge and Data Engineering,2008,20(1):55-67.
[13]余濤,周斌,陳家榮(Yu Tao,Zhou Bin,Chan Ka-Wing).基于Q學(xué)習(xí)的互聯(lián)電網(wǎng)動(dòng)態(tài)最優(yōu)CPS控制(Q-learning based dynamic optimal CPS control methodology for interconnected power systems)[J].中國(guó)電機(jī)工程學(xué)報(bào)(Proceedings of CSEE),2009,29(19):13-19.
[14]姚林朋,王輝,錢(qián)勇,等(Yao Linpeng,Wang Hui,Qian Yong,et al).基于半監(jiān)督學(xué)習(xí)的XLPE電纜局部放電模式識(shí)別研究(Pattern recognition of partial discharge in XLPE cable based on semi supervised learning)[J].電力系統(tǒng)保護(hù)與控制(Power System Protection and Control),2011,39(14):40-46.
[15]Zhu X J.Semi-supervised Learning with Graphs[D].Pittsburgh:Carnegie Mellon University,2005.
Voltage Sag Sources Identification Based on Label Propagation Semi-supervised Learning
WANG Shi-xu,Lü Gan-yun
(Department of Information Science and Engineering,Zhejiang Normal University,Jinhua 3210042,China)
In view of the situation that data for the historical voltage sags sample is limited and difficult to obtain,an approach for voltage sag sources identification based on label propagation semi-supervised learning is introduced.Firstly,five classes of voltage sag features are extracted from voltage sag information,and K-nearest neighbors graph model is constructed,finally label propagation on the graph model is realized.Then,the influences of parameters k and α on identification accuracy and running time are analyzed.At the same time,the identification results obtained through the proposed approach are compared with the supervised learning algorithm of neural network and least squares support vector machine.The simulation results verify that compared with traditional supervised learning algorithm,the approach based on label propagation algorithm has higher identification accuracy and runs faster with few labeled samples.
voltage sag sources identification;label propagation(LP);semi-supervised;feature extraction;K-nearest neighbors graph model
TM711
A
1003-8930(2013)04-0034-05
王世旭(1987—),男,碩士研究生,研究方向?yàn)槿斯ぶ悄茉陔娏ο到y(tǒng)中的應(yīng)用。Email:tianybamboo@163.com
2012-06-19;
2012-08-10
國(guó)家自然科學(xué)基金項(xiàng)目(51107120);浙江省自然科學(xué)基金項(xiàng)目(Y1090182);浙江師范大學(xué)計(jì)算機(jī)軟件與理論省級(jí)重中之重學(xué)科開(kāi)放基金;浙江省教育廳科研項(xiàng)目(Y201120550)
呂干云(1976—),男,博士,副教授,研究方向?yàn)殡娔苜|(zhì)量及人工智能在電力系統(tǒng)中的應(yīng)用。Email:ganyun_lv@zjnu.cn