杜 英,王 超,楊 杰,王 倩
(四川省電力公司經(jīng)濟技術(shù)研究院,成都 610000)
隨著連入物聯(lián)網(wǎng)的設(shè)備日趨多元化,物聯(lián)網(wǎng)技術(shù)對于建設(shè)狀態(tài)全面感知的智能電網(wǎng)有著至關(guān)重要的意義。相關(guān)學者在該方面進行了深入研究,周翔等[1]基于混沌理論和K-means算法對通過振動信號對變壓器有載分接開關(guān)運行狀態(tài)進行監(jiān)測取得良好的效果;趙莉[2]等采用k-means算法對海量用電數(shù)據(jù)進行分析,通過對算法進行改進克服其局部最優(yōu)解的缺陷,快速對用戶用電信息數(shù)據(jù)進行建模;王子龍等[3]為解決傳統(tǒng)K-means算法初始中心點的選擇隨機性導致模型易陷入局部最優(yōu)的問題進行改進,提出基于樣本權(quán)重改進方法取得良好的效果;王丹丹等[4]為解決重疊目標分割方法不能保留部分輪廓問題,提出采用K-means聚類算法對圖像進行分割,進而提取蘋果目標實現(xiàn)多果重疊目標分割與重建;謝娟英等[5]針對基因數(shù)據(jù)集區(qū)分問題,提出基于統(tǒng)計相關(guān)性和K-means的混合基因選擇算法,成功實現(xiàn)對基因子集的區(qū)分。
徐雄等[6]為分析水電機組轉(zhuǎn)輪葉片與轉(zhuǎn)輪室故障信號特征,采用K-Means聚類算法結(jié)合萊特準則對水電機組故障進行預測,檢測準確度得到了大幅提升。張威[7]提出一種基于K-means聚類分析的負荷估計算法,用于估算電網(wǎng)中缺失和未來的測量值,能夠準確的對未來負荷進行估算。
在電力系統(tǒng)中變壓器開關(guān)控制器作為配電變壓器智能控制的主要部件,性能會直接影響變壓器工作的穩(wěn)定性、可靠性和安全性,據(jù)國內(nèi)外統(tǒng)計表明:開關(guān)控制器所有引起的變壓器事故占總事故的20%以上,主要為機械故障,嚴重影響電力系統(tǒng)的穩(wěn)定性。本文設(shè)計一種改進K-means算法的電力變壓器開關(guān)控制器在線監(jiān)測系統(tǒng),構(gòu)建智能化系統(tǒng),使其具備智能判斷、自適應調(diào)節(jié)、故障診斷等能力。
機械振動包含著設(shè)備狀態(tài)、工作模式等大量的設(shè)備運行信息,可根據(jù)振動信號對設(shè)備的運行狀態(tài)進行判斷。在變壓器開關(guān)切換過程中振動信號會呈現(xiàn)出明顯的強時變、非線性特征,在使用常規(guī)方法對其進行分析時不能有效的得出信號中隱含的狀態(tài)信息。為解決上述問題,趙彤[8]等根據(jù)機械振動的混沌特性,將相點空間重構(gòu)技術(shù)用于對機械正常和故障狀態(tài)進行識別,取得良好效果。
相點重構(gòu)技術(shù)通過相互作用的其他分量來判斷當前分量的演化,同時相關(guān)分量的信息演化也隱含在當前分量的發(fā)展當中,從信號的世界序列數(shù)據(jù)分析得出所有信號的狀態(tài)信息[9]。
假定檢測系統(tǒng)的的一維振動信號為x(i)的時間序列如式(1)所示:
表達式中t0為被測信號的起始時間點的位置;Δt為時間間距;n為時間序列的長度。可將上述公式擴展為p維q個向量,表達式如式(2)所示:
式(2)中:σ為延遲時間,q個向量構(gòu)成了一個重構(gòu)信號的相空間。在信號的相空間重構(gòu)過程中,延遲時間σ刻畫了式(2)中各個坐標分量間的相關(guān)性。當σ值過大時,相鄰兩點幾乎不相關(guān),重構(gòu)的信號彌散;當σ過小時,相鄰兩點相關(guān)性較強,重構(gòu)的信號被壓縮。
通過自相關(guān)函數(shù)和互信息法等方法確定延遲時間σ主要,通過線性理論進行自相關(guān)函數(shù)相關(guān)度的計算,使用互信息值作為兩個隨機變量間關(guān)聯(lián)程度的評價依據(jù)。根據(jù)變壓器開關(guān)的振動規(guī)律,選取互信息法計算延遲時間。假設(shè)振動信號如式(1)所示:
在經(jīng)歷時間延遲σ后的振動信號如式(2)所示:
此時信號E和R的互信息I(E,R)如式(3)所示:
式(3)中:i為離散數(shù)值ei的標號,ei和qj為離散數(shù)值,j為離散數(shù)值rj的標號;Pr(rj)為延遲信號Q中的采樣點的值為rj的概率;Pe(ei)為振動信號E中采樣點值為ei的概率;Per(si,qj)為E中采樣點的值為ei且R中采樣點的值為rj的概率。
不同延遲時間下信號的互信息曲線可通過式(3)計算得到,一般以互信息值曲線中第一個極小值點作為延遲時間。圖1為變壓器開關(guān)在切換過程中振動信號的互信息值曲線,當延遲的時間間隔為11時,振動信號互信息值首次出現(xiàn)極小值,取該值作為振動信號的延遲時間。
圖1 振動信號互信息值曲線
完成相空間重構(gòu)后,由高維相空間的相點組成的相軌跡圖替代原有的振動信號,在變壓器開關(guān)不同工作狀態(tài)下呈現(xiàn)出不同的相軌跡,可從相軌跡圖形中得到開關(guān)切換過程中的動力學特性。在傳統(tǒng)K-means聚類分析算法中,初始聚類中心具有隨機性,缺乏自適應性將直接影響結(jié)果的準確性。為改善初始聚類隨機性缺陷,通過以下步驟自動確定初始聚類中心和聚類數(shù)目:
步驟1:對給出的數(shù)據(jù)集D,求得其數(shù)據(jù)集內(nèi)各樣本的密度β及對應的樣本元素權(quán)重θ,將數(shù)據(jù)集D中密度最大的元素b1作為聚類中心集合B中,得到的集合C={b1},同時將距離b1點距離小于平均樣本距離的點進行刪除。
步驟2:選擇樣本密度θ與樣本距離乘積最大數(shù)值的點,作為第二個初始聚類中心b2,將b2添加到集合B中,得到集合B={b1,b2},將距離與距離b2點距離小于平均樣本距離的點進行刪除。不斷重復上述步驟直到取完所有給出的數(shù)據(jù)集D,此時集合B={b1,b2,...,bk},得到具有k個元素的初始聚類,即集合D中的所有樣本點。
步驟3:對給定的數(shù)據(jù)集D進行K-means聚類運算,將初始聚類中心B作為輸入,直到數(shù)據(jù)穩(wěn)定聚類中心穩(wěn)定,并輸出結(jié)果。
改進的K-means算法流程圖如圖2所示。
圖2 改進的k-means算法流程
采用自制的LabVIEW振動測試臺對型號SII-M-220KVA運行過程中的振動信號進行測試,將用于收集振動信號的傳感器分別放置變壓開關(guān)兩側(cè),考慮到其沖擊特性和振動信號頻率范圍約為50Hz~50kHz,選擇傳感器采樣頻率為51.2kHz,得到實驗數(shù)據(jù)如圖3所示。
圖3 振動信號圖
在變壓器開關(guān)出現(xiàn)斷裂的情況下,信號典型波峰之間的時間間隔會隨之增大,同時振動幅值出現(xiàn)下降;當開關(guān)出現(xiàn)主觸頭松動故障時,信號波峰對應的時間間隔出現(xiàn)與開關(guān)出現(xiàn)斷裂時不同,可見振動信號的形態(tài)與開關(guān)的運行狀態(tài)有明顯的相關(guān)性,截取不同故障出現(xiàn)時間段的振動信號,采用K-means方法對振動信號進行分析。
本次試驗環(huán)境采用的是:Intel?Corei9-12900k、16GB內(nèi)存、GTX3080顯卡、Windows10操作系統(tǒng)、MatlabR2016a。為方便數(shù)據(jù)的順利的輸入避免測試過程中的噪點干擾,保證實驗結(jié)果的正確性,對得到的振動信號數(shù)據(jù)先進行預處理,去掉局部離散點,同時對數(shù)據(jù)進行歸一化處理,計算過程如式(4)所示:
采用準確度ACR、分割系數(shù)PC、劃分熵系數(shù)PE作為對k-means算法優(yōu)劣的指標,各指標具體計算公式如式(5)~式(7)所示:
準確度ACR:
分割系數(shù)PC:
分割系數(shù)PC的取值范圍在[1/m,1]之間,其值越接近于上限表明結(jié)果聚類效果較好,其結(jié)果越靠近1/m,表明結(jié)果模糊,聚類效果較差。
劃分熵系數(shù)PE:
PE取值區(qū)間為[0,logkm],其值越接近下限表明聚類效果越好,當其數(shù)值越接近logkm時,表明聚類效果較差。
本次實驗采用WK-means算法、ZKmeans算法、DCK-means算法、經(jīng)典K-means算法和本文方案進行對比分析,將每種算法對數(shù)據(jù)集D進行計算,結(jié)果取平均值,表1為5種方案測試結(jié)果。
表1 各方案對比分析
準確度方面改進K-means算法比WK-means算法高出17.7%,較ZKmeans算法準確度高出11.5%,比DCKmeans算法高1.9%,與傳統(tǒng)K-means算法相比準確度高9.5%,改進后k-means準確度明顯提高。在迭代速度方面,改進K-means算法的迭代次數(shù)與初始聚類中心的選擇有著較大的聯(lián)系,迭代次數(shù)與DCK-means算法一致都為5次,DCK-means算法在尋找初始點考慮了距離和密度因素,與其他算法相比更具全局性,故迭代次數(shù)較少,本文采用的改進K-means算法在初始聚類中心的尋找過程中引入平均樣本距離和樣本密度,結(jié)合了數(shù)據(jù)集局部與宏觀特征,減少了異常因素的影響使樣本距離的度量更準確,得到的初始聚類中心分布更為合理,迭代次數(shù)與傳統(tǒng)K-means算法相比明顯降低,有利于減少運行時間。
分割系數(shù)PC其值越接近于上限1,表明算法擬合效果越好,改進K-means算法取得0.751,與傳統(tǒng)算法相比大幅提高20.4%,同時也高于其他三種算法。劃分熵系數(shù)PE數(shù)值越接近下限,表明算法的擬合效果越好,改進K-means算法取得0.342,與傳統(tǒng)K-means算法相比大幅下降37.2%,小于其他對比算法。綜合準確度ACR、分割系數(shù)PC、劃分熵系數(shù)PE來看,改進K-means聚類算法的擬合校核和迭代次數(shù)都得到了明顯提高,
為對變壓器開關(guān)的工作狀態(tài)進行實現(xiàn)實時監(jiān)控,通過對傳統(tǒng)的K-means聚類算法進行改進,建立基于振動信號的故障診斷方法。在K-means聚類算法選取初始聚類中心的過程中,通過結(jié)合樣本密度、元素權(quán)重和樣本距離等因素,改善了傳統(tǒng)算法易陷入局部最優(yōu)解的缺陷。為驗證改進后算法的準確性,采用自制的LabVIEW振動測試臺對模擬變壓器開關(guān)振動,分別采用WK-means算法、ZKmeans算法等進行對比分析,從綜合準確度ACR、分割系數(shù)PC、劃分熵系數(shù)PE方面對不同算法進行對比分析,結(jié)果表面改進后K-means算法擬合效果明顯優(yōu)于對比算法,為變壓器開關(guān)故障檢測提供了一種新的思路。