譚丕成,羅正亮,潘 虹,張雁靖
(1.湖南五凌電力科技有限公司,湖南 衡陽 421127;2.河海大學(xué) 能源與電氣學(xué)院,江蘇 南京 211100)
在水電機(jī)組運(yùn)行過程中不乏各種故障的出現(xiàn),嚴(yán)重影響水力發(fā)電安全性、穩(wěn)定性以及運(yùn)行效率。以致針對機(jī)組運(yùn)行狀態(tài)以及運(yùn)行中所存在故障問題的研究變得十分必要[1]。在前人的研究中,針對水電機(jī)組故障診斷的傳統(tǒng)方法多依賴于人工經(jīng)驗(yàn)或提取并分解振動信號,將其作為特征量輸入已有數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)上的分類函數(shù)或分類模型,進(jìn)行機(jī)組狀態(tài)識別[2]。但由于傳感器數(shù)據(jù)眾多,若未能綜合考慮各傳感器信號間的相互影響、將多傳感器信號進(jìn)行信息互補(bǔ)和優(yōu)化組合處理,則無法對機(jī)組運(yùn)行狀態(tài)提出更為綜合、全面、一致性的解釋[3~6];加之機(jī)組振動信號具有非線性、非平穩(wěn)性等特征,使得傳統(tǒng)的研究方法無法予以較高的時(shí)效性以及準(zhǔn)確性。
目前,馬氏距離因其可衡量樣本相似程度這一特性被國內(nèi)外學(xué)者廣泛應(yīng)用于衡量設(shè)備運(yùn)行狀態(tài)以及模式識別領(lǐng)域的研究中,具有較高故障確診、排查成功率。如艾延延等[7]應(yīng)用馬氏距離結(jié)合EEMD與小波變化完成對軸承振動信號的拆分以實(shí)現(xiàn)故障診斷;張紅飛等[8]提出通過改進(jìn)馬氏距離,結(jié)合滑動窗口對空壓機(jī)進(jìn)行狀態(tài)評估;駱志高等[9]在拉伸件裂紋識別上,引入馬氏距離作為評判標(biāo)準(zhǔn)提高工件識別準(zhǔn)確率;且越來越多的學(xué)者[10~14]將馬氏距離應(yīng)用在軸承等旋轉(zhuǎn)機(jī)械上,都成功實(shí)現(xiàn)對設(shè)備運(yùn)行狀態(tài)的評估。
綜上,可以發(fā)現(xiàn)針對馬氏距離在水力機(jī)械故障診斷領(lǐng)域中的應(yīng)用研究少之又少,在目前水電機(jī)組存在大量傳感器的背景下,若通過數(shù)據(jù)融合可更好地實(shí)現(xiàn)對多傳感器數(shù)據(jù)變化的分析,從而實(shí)現(xiàn)對機(jī)組運(yùn)行狀態(tài)的評估。對此,本文引入馬氏距離與多傳感器數(shù)據(jù)融合,利用馬氏距離在表征數(shù)據(jù)樣本之間相似程度方面的優(yōu)異性能,排除多個(gè)傳感器數(shù)據(jù)變量之間相關(guān)性的干擾[15],并充分發(fā)揮數(shù)據(jù)融合模式所具有的在故障定位上高準(zhǔn)確性與可靠性等優(yōu)點(diǎn),建立水電機(jī)組運(yùn)行狀態(tài)綜合指標(biāo),在保證快速性和高準(zhǔn)確性的基礎(chǔ)上實(shí)現(xiàn)對機(jī)組運(yùn)行狀態(tài)識別。最后,基于湖南五凌電廠機(jī)組實(shí)際數(shù)據(jù)進(jìn)行實(shí)驗(yàn)仿真模擬,驗(yàn)證該方法的有效性與優(yōu)越性。
馬氏距離是一種無量綱參數(shù),由印度統(tǒng)計(jì)學(xué)家馬哈拉諾比斯所提出,以表示被測數(shù)據(jù)協(xié)方差距離,進(jìn)而以此度量樣本集之間相似程度[16]。樣本相似程度反映為距離值大小,成對應(yīng)比例關(guān)系。其定義為:設(shè)有兩樣本x、y,均為含有n個(gè)變量的行向量,則x與y對應(yīng)的馬氏距離可表示為[17]:
其中,協(xié)方差矩陣計(jì)算公式為:
作為距離指標(biāo),馬氏距離具有平移不變性、旋轉(zhuǎn)不變性和仿射不變性[18]等優(yōu)質(zhì)特性。其突出特點(diǎn)在于不受數(shù)據(jù)物理量基本屬性影響、將樣本中特性關(guān)聯(lián)關(guān)系與總體特征集中反映、且建立于以樣本總體分布為基礎(chǔ)且總體分布一致的特征量上[19]。
傳感器數(shù)據(jù)融合意為將分布在不同位置的多個(gè)同類或不同類傳感器的數(shù)據(jù)資源綜合,采用計(jì)算機(jī)技術(shù)對其進(jìn)行分析,消除多傳感器信息之間可能存在的冗余和矛盾,加以互補(bǔ),降低其不確實(shí)性,獲得被測對象的一致性解釋與描述,從而提高系統(tǒng)決策、規(guī)劃、反應(yīng)的快速性和正確性,使系統(tǒng)獲得更充分的信息。其信息融合在包括數(shù)據(jù)層融合、特征層融合、決策層融合[20~21]。
多傳感器數(shù)據(jù)融合最終目的是消除單個(gè)傳感器的局限性,往往單一的傳感器在整個(gè)傳感器系統(tǒng)中無法通過數(shù)據(jù)變化直觀地顯示數(shù)據(jù)背后所代表的結(jié)果,需要數(shù)據(jù)融合以提高整個(gè)測量系統(tǒng)的精準(zhǔn)度,增強(qiáng)數(shù)據(jù)的可信度,提高精度,擴(kuò)展系統(tǒng)的時(shí)間、空間覆蓋率,增加系統(tǒng)的實(shí)時(shí)性和信息利用率等[22,23]。因此,多傳感器系統(tǒng)往往比單傳感器系統(tǒng)更具有優(yōu)越性和對系統(tǒng)描述的代表性。
具體多傳感器數(shù)據(jù)融合過程步驟包括[24]:
(1)獲取信號。從多傳感器數(shù)據(jù)終端接受不同量綱數(shù)據(jù),為進(jìn)行統(tǒng)一管理,需將被測量所具有的不同特征轉(zhuǎn)化為計(jì)算機(jī)可接受的數(shù)字量。
(2)信號預(yù)處理。對所取信號采取去噪過程處理,提高被測數(shù)據(jù)精準(zhǔn)度。
(3)特征提取與關(guān)聯(lián)分析。分析并尋找數(shù)據(jù)中貢獻(xiàn)度或潛在貢獻(xiàn)度較大特征變量,對其進(jìn)行關(guān)聯(lián)性分析,實(shí)現(xiàn)數(shù)據(jù)挖掘第一步-數(shù)據(jù)層融合。將其作為被測對象原始數(shù)據(jù)用以提取。
(4)信息融合計(jì)算。數(shù)據(jù)挖掘初始化后需進(jìn)行特征信息融合與決策信息融合,利用計(jì)算機(jī)程序算法實(shí)現(xiàn)數(shù)據(jù)信息融合后續(xù)過程,獲得符合預(yù)設(shè)精度下融合信息結(jié)果,若結(jié)果不滿足要求,則返回至步驟2重新實(shí)現(xiàn)信息新一輪預(yù)處理-融合過程。
簡要融合過程如圖1所示。
圖1 多傳感器數(shù)據(jù)融合過程
為構(gòu)建以馬氏距離為基礎(chǔ)進(jìn)行多傳感器數(shù)據(jù)融合的水電機(jī)組故障診斷模型,需結(jié)合馬氏距離與多傳感器數(shù)據(jù)融合的相關(guān)理論知識,具體步驟為:
(1)在水電機(jī)組模式識別上需采集持續(xù)時(shí)間內(nèi)機(jī)組不同運(yùn)行狀態(tài)時(shí)傳感器監(jiān)測數(shù)據(jù),
(2)對所采取初始數(shù)據(jù)進(jìn)行信號轉(zhuǎn)換、降噪處理以及特征值提取等多傳感器數(shù)據(jù)融合初始步驟。
(3)將提取特征值后具有代表性的數(shù)據(jù)進(jìn)行多傳感器數(shù)據(jù)融合,可得到連續(xù)時(shí)間段內(nèi)的馬氏距離值。
(4)根據(jù)距離值變化浮動情況衡量數(shù)據(jù)彼此相似程度。并結(jié)合機(jī)組實(shí)際運(yùn)行情況,從而實(shí)現(xiàn)對機(jī)組運(yùn)行狀態(tài)的識別。若出現(xiàn)距離值變化波動大但核實(shí)機(jī)組并無故障存在的現(xiàn)象,則返回至步驟(2),重新實(shí)現(xiàn)對初始數(shù)據(jù)的預(yù)處理。具體流程圖2所示。
圖2 基于馬氏距離的數(shù)據(jù)融合流程圖
數(shù)據(jù)來源于湖南五陵水電廠抽水蓄能機(jī)組,機(jī)組額定功率200MW,發(fā)電機(jī)型號為SF200-56/11950,立軸半傘式。傳感器采集模式為整周期采集模式,保證連續(xù)存儲周期數(shù)是16,每個(gè)周期256點(diǎn),時(shí)間分辨率精確到0.1ms。多傳感器數(shù)據(jù)包括機(jī)組上導(dǎo)軸承、推力軸承和水導(dǎo)軸承的X、Y方向擺度信號,上機(jī)架、頂蓋的X、Y、Z方向振動信號,以及蝸殼與尾水管的壓力等數(shù)據(jù)。
數(shù)據(jù)時(shí)間段為2015年8月24日至2015年8月29日。分析基于matlab平臺,根據(jù)電站歷史運(yùn)行數(shù)據(jù)與對應(yīng)工況,建立正常與故障兩種運(yùn)行工況下的訓(xùn)練與測試樣本數(shù)據(jù)庫。24日至26日機(jī)組運(yùn)行狀態(tài)正常無故障出現(xiàn),27日機(jī)組停機(jī)無數(shù)據(jù),28日機(jī)組運(yùn)行開始出現(xiàn)故障,故障持續(xù)至29日數(shù)據(jù)測量結(jié)束。故以28日前后分為正常與故障測試樣本,用以驗(yàn)證本文所提方法。
此外,為凸顯基于馬氏距離-數(shù)據(jù)融合的方法在數(shù)據(jù)深度挖掘與表征數(shù)據(jù)樣本相似度上具備的優(yōu)異性、高效性,設(shè)置了基于單傳感器與基于歐氏距離-數(shù)據(jù)融合的機(jī)組運(yùn)行診斷,以達(dá)到對比說明的目的。
為充分具體驗(yàn)證基于馬氏距離—數(shù)據(jù)融合能夠在數(shù)據(jù)反應(yīng)層面上所具備的有效性與精確性,將8月24日~29日水電機(jī)組采集的多傳感器數(shù)據(jù)融合信號保存為十分鐘間隔的多組信號,以馬氏距離融合連續(xù)時(shí)間內(nèi)多傳感器數(shù)據(jù),結(jié)果如圖3所示。
觀察圖3大范圍數(shù)據(jù)波動可分析得:對比28日機(jī)組首次開機(jī)前后,馬氏距離均值從6.1突變至13,增長幅度為113%,且在機(jī)組開機(jī)后所持續(xù)時(shí)間段內(nèi),馬氏距離值并未回歸至開機(jī)前所維持大致數(shù)值,約為開機(jī)前數(shù)據(jù)均值的1.5~2倍,由此次變化可大致確定機(jī)組運(yùn)行狀態(tài)已發(fā)生改變。且根據(jù)與電站工作人員所核實(shí),故障發(fā)生時(shí)間也可確定為8月28日1點(diǎn)10分附近,在當(dāng)日機(jī)組上機(jī)架、水車室、蝸殼以及尾水管等處出現(xiàn)異常聲音,在之后的開機(jī)運(yùn)行過程中并未消除。結(jié)合圖3中28日開機(jī)后馬氏距離值的變化趨勢,可見,馬氏距離可準(zhǔn)確地實(shí)現(xiàn)對機(jī)組運(yùn)行狀態(tài)的識別。
圖3 多傳感器數(shù)據(jù)融合馬氏距離變化曲線(10min間隔)
為進(jìn)一步說明圖3所反應(yīng)數(shù)值變化表明機(jī)組運(yùn)行狀態(tài)已然發(fā)生改變,且強(qiáng)調(diào)變化程度具備足以說明問題的能力,進(jìn)而驗(yàn)證此次距離值波動并非傳感器故障、數(shù)據(jù)變化異常或?qū)嶒?yàn)流程有誤所致。對此,從增強(qiáng)實(shí)驗(yàn)嚴(yán)謹(jǐn)性與科學(xué)性的角度出發(fā),將正常測試樣本與訓(xùn)練樣本數(shù)據(jù)庫中所存有機(jī)組運(yùn)行數(shù)據(jù)進(jìn)行馬氏距離計(jì)算,如圖4所示。線1、線2分別代表測試樣本與正常、故障訓(xùn)練樣本所得值。
從圖4數(shù)據(jù)變化曲線對比中,所得信息為:兩線均值對比明顯,線1至線2的增長幅度為95%左右,且數(shù)值活動區(qū)間較后者大,兩者易于區(qū)分。根據(jù)馬氏距離基本概念,距離值越小數(shù)據(jù)越相似,可知正常訓(xùn)練樣本相較于故障訓(xùn)練樣本,與正常測試數(shù)據(jù)更為相似,與機(jī)組實(shí)際運(yùn)行情況相吻合。
圖4 正常工況下測試樣本與訓(xùn)練樣本馬氏距離
隨后將故障測試樣本與機(jī)組訓(xùn)練樣本數(shù)據(jù)進(jìn)行馬氏距離計(jì)算,線1、線2分別代表故障樣本與正常、故障訓(xùn)練樣本所計(jì)算結(jié)果。如圖5所示。
通過圖5數(shù)據(jù)變化對比,可以發(fā)現(xiàn)圖5所凸顯現(xiàn)象與圖4有所相似,即兩線對比明顯,均值相差程度亦接近于兩倍,足以表明相差程度較大。不同之處在于此圖表明故障訓(xùn)練樣本與故障測試數(shù)據(jù)更為接近,亦與實(shí)際運(yùn)行情況相吻合。
綜上,通過將圖4~5測試樣本與訓(xùn)練樣本進(jìn)行馬氏距離值的對比并結(jié)合機(jī)組實(shí)際運(yùn)行情況,表明圖3馬氏距離值的變化并非數(shù)據(jù)融合過程中存在偶然性、突發(fā)性的傳感器數(shù)據(jù)波動或是融合過程不嚴(yán)謹(jǐn)?shù)痊F(xiàn)象所致,相反,此距離值變化切實(shí)反應(yīng)機(jī)組運(yùn)行狀態(tài)存在問題,準(zhǔn)確地實(shí)現(xiàn)了對機(jī)組運(yùn)行狀態(tài)的識別。
圖5 故障工況下測試樣本與訓(xùn)練樣本馬氏距離
為驗(yàn)證單一傳感器數(shù)據(jù)分析所具有的局限性,無法完成海量數(shù)據(jù)的深度挖掘,進(jìn)行了基于單一傳感器的數(shù)據(jù)分析。樣本數(shù)據(jù)來源于2015年8月24日到8月29日中隨機(jī)選出的兩部分傳感器,所測數(shù)據(jù)分別為上機(jī)架X、Y向水平振動,令其數(shù)據(jù)變化曲線對應(yīng)為線1、線2,繪制時(shí)間-數(shù)據(jù)變化關(guān)系圖,如圖6所示。
根據(jù)圖6曲線變化,可看出:①線1振動位移值變化不平穩(wěn),數(shù)值可觀測區(qū)間與振動均值波動范圍均較線2大;線2數(shù)據(jù)變化較線1穩(wěn)定,均值整體在12附近,無大波動。② 28日前后線1觀測均值變化區(qū)間為21至27,且在測試后期存在較大水平的上升;而線2在28日前后觀測均值無明顯波動。
進(jìn)一步分析可知,在故障發(fā)生時(shí),只有部分傳感器數(shù)據(jù)會發(fā)生變化。如果對應(yīng)傳感器信號變化幅度較小,存在無法及時(shí)準(zhǔn)確的判斷機(jī)組運(yùn)行狀態(tài)的可能性。表明以單傳感器數(shù)據(jù)為基礎(chǔ)進(jìn)行故障診斷的方法具有不可忽視的局限性,因此,將多個(gè)傳感器信號進(jìn)行融合,比較其綜合指標(biāo)在不同運(yùn)行狀態(tài)下的數(shù)值表征,成為解決該問題的必然選擇。
為驗(yàn)證本文所提基于馬氏距離數(shù)據(jù)融合的優(yōu)越性,進(jìn)行基于歐氏距離的多傳感器數(shù)據(jù)融合實(shí)驗(yàn),計(jì)算水電機(jī)組綜合運(yùn)行狀態(tài)指標(biāo),并與基于馬氏距離方法的結(jié)果進(jìn)行對比分析。
以8月24日~29日的測試數(shù)據(jù)為測試樣本,10min為間隔,計(jì)算連續(xù)一段時(shí)間內(nèi)水電機(jī)組多傳感器融合信號的歐氏距離變化,結(jié)果如圖7所示。
圖6 單傳感器數(shù)據(jù)隨時(shí)間變化折線圖
觀察圖7可知:① 歐氏距離值起伏次數(shù)多,且前后數(shù)值變化大。在24日機(jī)組初始運(yùn)行過程中,出現(xiàn)距離值下落后持續(xù)一段時(shí)間又迅速、短暫的回升情況;在26日機(jī)組運(yùn)行時(shí)間段內(nèi),存在4次距離值變化較大現(xiàn)象,多為突發(fā)性增長,具體表現(xiàn)為數(shù)值在增長后開始跌落。②對比28日前后距離值變化情況,再次開機(jī)后并未出現(xiàn)迅速的回升情況,機(jī)組運(yùn)行一段時(shí)間后,方才出現(xiàn)緩慢上升趨勢。③在貫穿數(shù)據(jù)樣本的測試過程中,歐氏距離值并無1~2個(gè)穩(wěn)定的均值,即通過28日前后數(shù)據(jù)平均水平的對比無法看出明顯差異,進(jìn)而無法由歐氏距離值變化揭示開機(jī)前后機(jī)組運(yùn)行狀態(tài)的區(qū)別。
圖7 基于歐氏距離和多傳感器融合的曲線變化(10分鐘間隔)
對比圖3與圖7不難發(fā)現(xiàn),基于歐氏距離的方法數(shù)值無法保持長時(shí)間的穩(wěn)定態(tài)勢,在電站故障診斷實(shí)際應(yīng)用中,若采用歐氏距離作為多傳感器的數(shù)據(jù)融合,無法精準(zhǔn)地判別機(jī)組運(yùn)行狀態(tài)。而基于馬氏距離的方法,數(shù)值變化波動次數(shù)少,變化小,在數(shù)據(jù)上不容易產(chǎn)生干擾,更易看出正常樣本與故障樣本不同之處,能如實(shí)反映機(jī)組運(yùn)行狀態(tài)。
綜上所述,結(jié)合實(shí)驗(yàn)數(shù)據(jù)與機(jī)組實(shí)際運(yùn)行狀況,表明基于馬氏距離-數(shù)據(jù)融合的模式識別方法可準(zhǔn)確地識別機(jī)組的運(yùn)行狀態(tài),提高了機(jī)組整體運(yùn)行狀態(tài)識別的可靠性與準(zhǔn)確性,較單傳感器的故障診斷和基于歐氏距離的數(shù)據(jù)融合,可避免數(shù)據(jù)精度不高與易產(chǎn)生干擾等問題,具有顯著優(yōu)勢。
(1)實(shí)驗(yàn)結(jié)果表明,基于馬氏距離-數(shù)據(jù)融合的方法相較于本文所提其它兩種方法,具有低干擾性、高準(zhǔn)確性與高可靠性等優(yōu)異之處,具備數(shù)據(jù)深度挖掘的能力,能有效、精確地判別機(jī)組的運(yùn)行狀態(tài)。這一方法對于機(jī)組電站運(yùn)行而言具有重要參考意義。
(2)傳感器數(shù)據(jù)繁多,若結(jié)合神經(jīng)網(wǎng)絡(luò)或深度學(xué)習(xí)等方法,能在融合精確性與時(shí)效性上有進(jìn)一步的提高。