陳新美 潘笑顏 路光輝 牧繼清 姬 波
1(許昌開普檢測技術(shù)有限公司 河南 許昌 461000)2(鄭州大學(xué)信息工程學(xué)院 河南 鄭州 450002)3(許繼集團有限公司 河南 許昌 461000)
?
基于樸素貝葉斯的局部放電診斷模型
陳新美1潘笑顏2*路光輝3牧繼清3姬波2
1(許昌開普檢測技術(shù)有限公司河南 許昌 461000)2(鄭州大學(xué)信息工程學(xué)院河南 鄭州 450002)3(許繼集團有限公司河南 許昌 461000)
針對局部放電故障診斷問題,提出一種基于樸素貝葉斯的局部放電診斷模型,并對模型中的樸素貝葉斯的應(yīng)用方法進行詳細研究。該模型由四部分組成:信號的接收及處理、譜圖產(chǎn)生、特征提取和樸素貝葉斯分類。診斷流程: 首先由UHF傳感器接收局部放電信號并交于信號調(diào)理單元處理;然后基于處理后的信號產(chǎn)生三維譜圖,提取譜圖的典型特征;最后采用樸素貝葉斯算法進行故障診斷。該模型已作為插件嵌入到某一電力設(shè)備生產(chǎn)企業(yè)的變壓器監(jiān)測產(chǎn)品中。實際測試表明該模型較好地滿足了應(yīng)用需求。
局部放電樸素貝葉斯診斷模型特征提取
局部放電[1,2]是指因為電場不均勻,高壓設(shè)備絕緣的局部區(qū)域發(fā)生的發(fā)電。由于局部放電具有重復(fù)性,雖然短時間內(nèi)不會影響設(shè)備的正常運行但時間長了會形成電樹枝,最終導(dǎo)致絕緣擊穿。針對局部放電信號的特征提取和模式識別問題,國內(nèi)外許多學(xué)者進行了深入研究。文獻[3]在全封閉氣體絕緣開關(guān)設(shè)備上采集放電指紋數(shù)據(jù),并提取了12種特征,利用復(fù)合神經(jīng)網(wǎng)絡(luò)來提高局部放電識別率;文獻[4]提出利用主成分分析的方法對變壓器局部放電原始特征參數(shù)進行降維,并提取出新的主成分因子,通過概率神經(jīng)網(wǎng)絡(luò)分類器對降維前和降維后的特征向量進行訓(xùn)練和識別;文獻[5]利用超聲波法提取局部放電信號,得到局放分布譜圖,獲得局部特征參數(shù),通過支持向量機分類算法對典型缺陷信號進行模式識別;文獻[6]使用自適應(yīng)最優(yōu)核(AOK)的時間-頻率表示法獲取局部放電的UHF信號。然后,基于時間-頻率矩陣由非負(fù)矩陣分解輔助主成分分析(NMF-PCA),最后,所提取的特征被用作模糊k近鄰(FkNN)分類器的輸入矢量,以獲得對PD識別結(jié)果。
這些研究針對局放診斷問題提出了很好的思路和方法。但是大都局限于診斷算法的研究,未涉及應(yīng)用領(lǐng)域中多階段整體建模問題。在實際應(yīng)用中,局放診斷主要涉及四個階段:放電信號接收及處理,譜圖產(chǎn)生,特征提取和算法分類。它們構(gòu)成了一個密切關(guān)聯(lián)的整體,不可分割。因此,本文提出了一種基于樸素貝葉斯的局部放電診斷模型。該模型利用基于電磁波的UHF檢測法提取局部放電信號,產(chǎn)生局部放電譜圖,基于譜圖進行特征提取,最終通過樸素貝葉斯分類算法進行模式識別,給出故障診斷結(jié)果。實測表明,作為某變壓器監(jiān)測產(chǎn)品的插件,本模型是可行的和有效的。
局部放電診斷模型如圖1所示。該模型包括四個部分:信號的接收及處理、譜圖產(chǎn)生、特征提取、樸素貝葉斯分類。流程是:從開關(guān)設(shè)備上接收局部放電信號并進行去噪處理,依次產(chǎn)生PRPS/PRPD/N-P/Q-P譜圖,基于以上譜圖進行特征提取,并采用樸素貝葉斯算法進行故障診斷。
圖1 基于樸素貝葉斯的局部放電診斷模型
局部放電信號經(jīng)UHF傳感器(天線)和高頻傳輸電纜,送到信號調(diào)理單元,經(jīng)高頻濾波、放大、檢波,再通過多路信號傳輸電纜,由高速數(shù)據(jù)采集單元進行數(shù)據(jù)采集和抗干擾處理。接收及處理流程如圖2所示。
圖2 信號接收和處理過程圖
1) UHF天線傳感器:采集局部放電的超高頻信號,提取能夠反映局部放電信息的特征量,如放電量、放電次數(shù)、放電相位等。天線傳感器是局部放電信號接收和處理的關(guān)鍵設(shè)備,要求駐波比小、方向性系數(shù)高。
2) 信號調(diào)理單元:采用帶通濾波及選頻放大技術(shù)和包絡(luò)檢波技術(shù),實現(xiàn)了對信號的窄帶化處理,有效抑制噪聲,濾除UHF傳感器輸出信號的超高頻成分,僅保留信號的幅值和相位信息,從而降低數(shù)據(jù)采集系統(tǒng)的要求和減少數(shù)據(jù)量的處理。
3) 數(shù)據(jù)采集單元:數(shù)據(jù)采集單元要考慮采樣率、模擬帶寬、單雙通道、單通道最大存儲能力等。采集卡選用杭州西湖電子研究所生產(chǎn)設(shè)計的UHF采集模塊,采樣率為20M,經(jīng)過檢波、濾波抽點后采用TCP/IP通信協(xié)議與裝置CPU進行信息交互。采集卡完成所有的采集和抗干擾處理,抽點后的數(shù)據(jù)以每周波256個點,連續(xù)采集1秒,同時4個通道的采樣數(shù)據(jù)以TCP/IP傳送到主CPU,每秒鐘的數(shù)據(jù)流量為:256×4×50(周波)×4(通道)=0.19 MByte。
4) 信號處理:對采集到的信號進行抗干擾處理,濾除干擾信號,然后對局放信號進行放電特征量提取、放電模式識別。最后通過IEC 61850規(guī)約把處理后的放電量、放電類型等上送至綜合監(jiān)測單元。
采用IEC61850通信協(xié)議,將局部放電信息,包括最大放電量及平均放電量、放電次數(shù)、放電相位、放電類型上送,單位時間長度選定為1 s(50周波),生成局部放電的工頻周期波形圖、二維譜圖(φ~q圖和φ~n圖)和三維譜圖(φ~q~n圖)。模型中圖譜產(chǎn)生的方法如下:
1) 采用二維數(shù)組存儲處理后的信號,該數(shù)組的三個列向量分別代表相位區(qū)間、幅值區(qū)間、次數(shù);
2) 由二維數(shù)組生成三維PRPS譜圖,數(shù)組的三個列向量分別對應(yīng)三維圖的XYZ軸;
3) 由PRPS譜圖生成PRPD譜圖,其方法為:定義一個三維數(shù)組存放PRPS數(shù)據(jù),PRPS[i][j][k]。k代表放電相位,3.6度間隔,取值范圍為0~99;j代表放電強度,按照dB值或者百分比處理,取值范圍0~99;i代表放電周波序號,取值范圍為1~50。計算方法參照式(1)。
(1)
4) 累計PRPD的j坐標(biāo)值得N-P譜圖,參照式(2):
(2)
5) 統(tǒng)計PRPD的k坐標(biāo)值最大值得Q-P譜圖,參照式(3):
Qmax[k]=max(j)
(3)
模型中有選擇性的提取了譜圖的25個主要特征。其中前11個來自PRPD譜圖,后14個來自N-P譜圖和Q-P譜圖。特征信息見表1-表3所示。
表1 基于PRPD譜圖提取的特征
表2 基于N-P譜圖提取的特征
表3 基于Q-P譜圖提取的特征
① 第I象限的放電集中度:0~90度相位域范圍放電脈沖的比率,計算公式為式(4)。
(4)
② 第I和II象限不對稱度:先計算II象限即90~180度相位域范圍放電的比率,再計算不對稱度,即兩個象限集中度的差值。計算公式為式(5)、式(6)。
(5)
fA13=f12-f13
(6)
③ 負(fù)半周放電次數(shù)均值,參照式(7)。
(7)
④ 負(fù)半周放電次數(shù)方差,參照式(8)。
(8)
⑤ 負(fù)半周放電總次數(shù)峰度,參照式(9)。
(9)
⑥ 負(fù)半周放電總次數(shù)偏度,參照式(10)。
(10)
⑦ 相位區(qū)域平均值:每個相位區(qū)間的脈沖數(shù)與相位值的乘積累加和與脈沖總數(shù)的比值,參照式(11)。
(11)
⑧ 正半周放電次數(shù)的峰度和偏度參照負(fù)半周放電次數(shù)的峰度和偏度的計算公式。放電頻度取對數(shù),參照式(12)、式(13)。
(12)
f19=log10(Ne+1)
(13)
⑨ 第III象限的放電集中度:180~270度相位域范圍放電的比率,參照式(14)。放電強度平均值,參照式(15)。
(14)
(15)
Qmax[k]為最大的放電強度。
⑩ 負(fù)半周放電強度峰度,參照式(16)-式(18)。
(16)
(17)
(18)
(19)
正半周放電強度峰度和偏度參照負(fù)半周放電強度峰度和偏度的計算公式。
樸素貝葉斯算法的主要思想是:將事件的先驗概率和后驗概率聯(lián)系起來,利用先驗信息和樣本數(shù)據(jù)確定事件的后驗概率。為了簡化分類運算,樸素貝葉斯分類器在估計類條件概率時假設(shè)屬性之間條件獨立[7]。
給定一個實例數(shù)據(jù)集E,E={X1,…,Xn,C}。其中X1,X2,…,Xn,是屬性變量,C是類型變量,其取值為{c1,c2,…,cm},Xi的取值為xi。實例Ii={x1,x2,…,xn}屬于cj的概率由貝葉斯表示為:
P(cj|x1,x2,…,xn)=P(x1,x2,…,xn|cj)×P(cj)
(20)
其中類cj的先驗概率是P(cj),類cj的條件概率是P(x1,x2,…,xn|cj),類cj的后驗概率是P(cj|x1,x2,…,xn)。樸素貝葉斯選擇后驗概率最大的類cj為該實例Ii的類標(biāo)簽。
從訓(xùn)練數(shù)據(jù)估計后驗概率時有一個問題:如果有一個屬性的類條件概率為0,則整個類的后驗概率就為0。樸素貝葉斯分類器無法分類這樣的記錄。為了解決這個問題,使用m估計方法來估計條件概率,即:
(21)
其中,n為類yj中的實例總數(shù),nc是類yj的訓(xùn)練樣例中取值xi的樣例數(shù),m是稱為等價樣本大小的參數(shù),p是用戶指定的參數(shù)[6]。
在本模型中考慮到放電數(shù)據(jù)的特點,分別使用兩種方法估計連續(xù)屬性的類條件概率:① 離散化每一個連續(xù)的屬性,用相應(yīng)的離散區(qū)間替換連續(xù)屬性值。典型的無監(jiān)督離散化方法為等寬離散化方法和等頻離散化方法。② 高斯分布表示連續(xù)屬性的類條件概率分布,均值μ和方差σ2是該分布的兩個參數(shù)。對每個類yi,屬性Xi的類條件概率為:
(22)
等寬離散化算法和等頻離散化算法是兩類典型的無監(jiān)督離散化方法。如算法1、算法2所示。等寬離散化方法是將屬性的值域劃分成具有相同寬度的區(qū)間[6]。等頻離散化方法是試圖將相同數(shù)量的對象放進每個區(qū)間[8]。
算法1等寬離散化算法
要求:數(shù)據(jù)集S,實例數(shù)n,屬性個數(shù)m,類型個數(shù)k,離散區(qū)間數(shù)L
輸入:數(shù)據(jù)集S,離散區(qū)間數(shù)L
輸出:離散化后的數(shù)據(jù)集合SS
方法:
1.for i in m do
2.計算第i個屬性的最大值maxi和最小值mini
3.計算第i個屬性的離散化寬度
widthi=(maxi-mini)/L
4.切點集
gatheri={mini+widthi,mini+
2*widthi,…,mini+(L-1)*widthi}
5.end for
6. SS = S
7.for i in n do
8.for j in m do
9.if SSij>= mini&& SSij<= mini+t*widthi
10.SSij= t
11.end for
12.end for
13.return SS
算法2等頻離散化算法
要求:數(shù)據(jù)集S,實例數(shù)n,屬性個數(shù)m,類型個數(shù)k,,要分的份數(shù)a
輸入:數(shù)據(jù)集S
輸出:離散化后的數(shù)據(jù)集合SS
方法:
1. width = n/a
2. SS = S
3. for j in m
4.按SS的第j列升序排列
5. for k in a
6.SS的第j列的(k-1)*width到k*width行都賦值為k
7.end for
8.end for
9.return SS
6.1實驗數(shù)據(jù)集
實驗數(shù)據(jù)是來自現(xiàn)場的63例放電數(shù)據(jù),包括11種放電類型:分別為尖刺放電,絕緣子表面放電,均勻噪聲,手機干擾,隨機干擾,懸浮放電,沿面放電,噪聲,噪聲信號,金屬顆粒和自由金屬顆粒。為了保證實驗的合理性,采用十次十折交叉法來求取診斷正確率的總平均值作為平均正確率。
6.2實驗分析
分別使用兩種估計連續(xù)屬性的類條件概率的方法做實驗,以便得到最好的計算連續(xù)屬性的類條件概率的方法。
表4展示了等寬離散化并使用m估計的實驗結(jié)果,表5展示了等頻離散化并使用m估計的實驗結(jié)果,表6展示了使用m估計的等寬離散化方法最優(yōu)份數(shù)和等頻離散化方法的最優(yōu)份數(shù)。表7展示了兩種計算連續(xù)屬性的類條件概率的方法的結(jié)果,從表7中可以看出第一種方法比第二種方法好,并且第一種方法中等寬離散化比等頻離散化的分類正確率高,高出2.5%。
表4 等寬離散化的實驗結(jié)果(m估計)
表5 等頻離散化的實驗結(jié)果(m估計)
表6 最優(yōu)份數(shù)
表7 最高正確率對比
6.3實驗結(jié)論
由于貝葉斯分類估計連續(xù)屬性的類條件概率的方法對局部放電診斷有顯著的影響,本文詳細研究了兩種估計連續(xù)屬性的類條件概率的方法,進而方便模型的建立。實驗表明第一種方法優(yōu)于第二種方法,并且第一種方法中的等寬離散化優(yōu)于等頻離散化。
本文模型已作為重要插件嵌入到某一電力設(shè)備生產(chǎn)企業(yè)的變壓器監(jiān)測產(chǎn)品中。該產(chǎn)品的主要功能是對電力設(shè)備絕緣性能進行連續(xù)實時監(jiān)測,當(dāng)絕緣劣化發(fā)生局部放電時,判斷電力設(shè)備是否存在缺陷,指出缺陷類型以及缺陷位置,為電力設(shè)備的維修和保養(yǎng)提供決策依據(jù)。本模型的任務(wù)是通過對局部放電信號的提取、分析,給出故障診斷結(jié)果。實際測試表明本模型較好地滿足了應(yīng)用需求。
[1] Wu Qingyan,Liu Guoqiang,Xia Zhengwu,et al.The study of Archimedean spiral antenna for partial discharge measurement[J].International Conference on Intelligent Control and InformationProcessing(ICICIP),2013,5(4):694-698.
[2] Chen S,Czaszejko T.Partial discharge test circuit as a spark-gap transmitter[J].IEEE Electrical Insulation Magazine,2011,27(3):36-44.
[3] 李培江,朱曉錦,尤婷.基于神經(jīng)網(wǎng)絡(luò)GIS局部放電模式的識別[J].中國電力,2013,46(10):60-63.
[4] 宛津莎,尚海昆.基于主成分分析和概率神經(jīng)網(wǎng)絡(luò)的變壓器局部放電模式識別[J].電力自動化設(shè)備,2013,33(6):27-31.
[5] 任永恒.基于SVM算法的局部放電模式識別[J].電力科技,2014(16):153-154.
[6] Ke Wang,Jizhong Li,Shuqi Zhang,et al.Time-frequency features extraction and classification of partial discharge UHF signals[J].Electronics and Electrical Engineering(ISEEE),2014:1231-1235.
[7] 王芳,鄭建柏.基于樸素貝葉斯分類的變壓器故障診斷[J].電力安全技術(shù),2013,15(9):32-34.
[8] Pangning Tan,Michael Steinbach,Vipin Kumar.數(shù)據(jù)挖掘?qū)д揫M].范明,范宏建,譯.北京:人民郵電出版社,2011.
[9] 丁劍,白鳳偉.一種基于相似性度量的離散化方法[J].西北師范大學(xué)學(xué)報:自然科學(xué)版,2012,48(5):43-47.
[10] 張偉.基于歸一化投影直方圖不變矩的圖像特征提取[J].計算機工程,2011,37(1):226-228.
[11] 鮑永勝.局部放電脈沖波形特征提取及分類技術(shù)[J].中國電機工程學(xué)報,2013,33(28):168-175.
[12] 李劍,孫才新,杜林,等.局部放電圖像組合特征提取方法[J].高電壓技術(shù),2004,30(6):11-13.
[13] 王國強,朱永利,劉利鵬.變壓器局部放電的分步特征分析與模式識別[J].電測與儀表,2013,50(9):6-10.
[14] 禹建麗,卞帥.基于BP神經(jīng)網(wǎng)絡(luò)的變壓器故障診斷模型[J].系統(tǒng)仿真學(xué)報,2014,26(6):1343-1349.
A PARTIAL DISCHARGE DIAGNOSIS MODEL BASED ON NA?VE BAYES
Chen Xinmei1Pan Xiaoyan2*Lu Guanghui3Mu Jiqing3Ji Bo2
1(Xuchang Ketop Testing Technology Co.,Ltd, Xuchang 461000,Henan,China)2(SchoolofInformationEngineering,ZhengzhouUniversity,Zhengzhou450002,Henan,China)3(XUJIGROUPCorporation,Xuchang461000,Henan,China)
For the problem of partial discharge fault diagnosis, we present a Na?ve Bayes-based partial discharge diagnosis model, and study in detail the application method of Na?ve Bayes in the model. The model consists of four components: reception and processing of signals, spectrum maps generation, feature extraction and Na?ve Bayes classification. The diagnosis flow is as follows: first the UHF sensor is used to receive partial discharging signals and transmits them to signal conditioning unit for processing. Then based on the processed signals the model generates three-dimensional spectrum map, and extracts typical features of the map. Finally it uses Na?ve Bayesian algorithm to diagnose the faults. The model as an important plug-in has been embedded into the transformer monitoring products of an enterprise of power equipment production. Practical tests show that the model well satisfies the application requirements.
Partial dischargeNa?ve BayesianDiagnosis modelFeature extraction
2015-05-11。國家自然科學(xué)基金項目(61170223);河南人才培養(yǎng)聯(lián)合基金項目(U1204610);河南省科技攻關(guān)計劃項目(132102210404)。陳新美,工程師,主研領(lǐng)域:自動化裝置和智能組件檢測。潘笑顏,碩士。路光輝,高工。牧繼清,助理工程師。姬波,副教授。
TP3
A
10.3969/j.issn.1000-386x.2016.09.012