殷振興
(江蘇省淮沭新河管理處,江蘇 淮安 223005)
泵站主要承擔(dān)水資源調(diào)度任務(wù),當(dāng)泵站運(yùn)行狀態(tài)劣化到一定程度,機(jī)組正常運(yùn)行受到影響,無(wú)法正常生產(chǎn)工作,則泵站系統(tǒng)出現(xiàn)故障[1]。 機(jī)械故障的特點(diǎn)主要表現(xiàn)為潛在性、漸發(fā)性、耗損性等[2],對(duì)于泵站機(jī)組中水泵與電機(jī)等旋轉(zhuǎn)機(jī)械,主要有基礎(chǔ)松動(dòng)、軸承故障、油膜振蕩等故障,這些旋轉(zhuǎn)機(jī)械中幾乎過(guò)半故障均為轉(zhuǎn)軸引起[3],轉(zhuǎn)軸故障一般為不對(duì)中故障、油膜渦動(dòng)及轉(zhuǎn)子質(zhì)量不平衡等[4],因此,對(duì)轉(zhuǎn)軸進(jìn)行故障檢測(cè)保證轉(zhuǎn)軸正常運(yùn)行具有重要意義,有利于梯級(jí)泵站更好地運(yùn)行。
針對(duì)多要素不確定性故障,根據(jù)深度學(xué)習(xí)理論知識(shí)構(gòu)建稀疏自編碼器,可完成泵站故障特征表達(dá),再結(jié)合支持向量機(jī)(SVM)良好的分類能力建立自編碼的SVM故障檢測(cè)模型,以達(dá)到泵站不確定性故障檢測(cè)目的。
近年來(lái)深度學(xué)習(xí)在科研領(lǐng)域被廣泛應(yīng)用,相比之前的神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)深度神經(jīng)網(wǎng)絡(luò)(Deep neural network,DNN)算法在輸入與輸出層間包含了多于一層的隱含層,是一種前饋人工神經(jīng)網(wǎng)絡(luò),識(shí)別率提高了一個(gè)檔次。
自動(dòng)編碼是一種典型的無(wú)監(jiān)督學(xué)習(xí),本質(zhì)是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的一層隱含層,其目的是為了表達(dá)網(wǎng)絡(luò)的輸入等于輸出這一等式[9]。 若多層神經(jīng)網(wǎng)絡(luò)也被視為一個(gè)多層結(jié)構(gòu)編碼系統(tǒng),其輸出均等于輸入,提取出每個(gè)隱含層的激活值,便得到多組原始數(shù)據(jù)的新表達(dá)方式,其激活值與原始數(shù)據(jù)形成新的特征映射。這便是一個(gè)特征學(xué)習(xí)的過(guò)程,亦是自動(dòng)編碼可行性的出發(fā)點(diǎn)。
隱藏神經(jīng)元的數(shù)量較大,可能比輸入像素的數(shù)量還多,若不稀疏化將無(wú)法得到輸入的壓縮表示。Hinton提出的一種防止神經(jīng)網(wǎng)絡(luò)過(guò)度擬合的Dropout方法[10],是一種解決此問(wèn)題的技術(shù)。稀疏編碼前后的模型對(duì)比如圖1,關(guān)鍵是在訓(xùn)練期間從神經(jīng)網(wǎng)絡(luò)中隨機(jī)丟棄單位(及其連接)。 可以防止過(guò)多單元之間的相互適應(yīng)。在訓(xùn)練期間,從指數(shù)數(shù)量級(jí)的不同“稀疏”網(wǎng)絡(luò)中抽取樣本。在測(cè)試時(shí),通過(guò)簡(jiǎn)單地使用具有較小權(quán)重的單個(gè)未稀疏網(wǎng)絡(luò),很容易近似平均所有這些稀疏網(wǎng)絡(luò)的預(yù)測(cè)效果。
圖1 稀疏編碼前后的模型對(duì)比
若為一個(gè)分類問(wèn)題,神經(jīng)網(wǎng)絡(luò)在得到編碼數(shù)據(jù)后將數(shù)據(jù)輸入輸出層得到結(jié)果,其輸出層僅依據(jù)結(jié)果比重進(jìn)行類別劃分,缺少一個(gè)尋優(yōu)的決策過(guò)程。而SVM對(duì)事物劃分是依據(jù)事物本身特征進(jìn)行二次尋優(yōu),得到有效的尋優(yōu)分類面。
綜合稀疏自動(dòng)編碼與支持向量機(jī)的特點(diǎn),建立了稀疏自編碼支持向量機(jī)模型,泵站故障檢測(cè)原理如圖2。
圖2 泵站故障檢測(cè)原理
為驗(yàn)證SVM對(duì)轉(zhuǎn)軸油膜渦動(dòng)故障檢測(cè)的可行性,在正常運(yùn)行與油膜渦動(dòng)倍頻上各取100組能量分布數(shù)據(jù)。通過(guò)觀察頻譜結(jié)構(gòu)發(fā)現(xiàn)二者在1~4倍頻成分上分布相似,但半頻成分上,正常運(yùn)行時(shí)所取樣本值較小,而油膜渦動(dòng)時(shí)卻近似為1,可見(jiàn)油膜渦動(dòng)時(shí)與正常運(yùn)行情況有明顯區(qū)別。
利用SVM進(jìn)行測(cè)試,發(fā)現(xiàn)油膜渦動(dòng)時(shí)在振動(dòng)頻率特征分布上區(qū)分度較正常運(yùn)行時(shí)大,與觀察頻譜結(jié)構(gòu)規(guī)律一致,正確率100%。 實(shí)驗(yàn)測(cè)試結(jié)果顯示自編碼的SVM亦可達(dá)到滿意的檢測(cè)結(jié)果,表明SVM在小樣本故障簡(jiǎn)單情況下檢測(cè)的有效性。
若遇到更為復(fù)雜的情況,SVM檢測(cè)方法是否可以繼續(xù)保持良好的檢測(cè)性能,下面做進(jìn)一步驗(yàn)證。
同樣各取100組正常運(yùn)行樣本和不對(duì)中樣本數(shù)據(jù),觀察發(fā)現(xiàn)兩者在頻率分布上差異性較小,均存在較為豐富的高頻成分,無(wú)法通過(guò)頻譜結(jié)構(gòu)得出檢測(cè)結(jié)論。
對(duì)100組樣本數(shù)據(jù)建立檢測(cè)不對(duì)中故障SVM,模型懲罰因子c取5000,核函數(shù)寬度取100。 結(jié)果表明正確率僅70%,SVM分類器無(wú)法獲得不對(duì)中故障知識(shí),從而亦無(wú)法得到高精確度的檢測(cè)結(jié)果。
根據(jù)前述設(shè)計(jì)計(jì)算原理與方法進(jìn)行無(wú)監(jiān)督學(xué)習(xí)構(gòu)造多層自動(dòng)編碼層,并基于訓(xùn)練數(shù)據(jù)通過(guò)BP算法對(duì)整體編碼系統(tǒng)開(kāi)展微調(diào),稀疏自編碼系統(tǒng)微調(diào)的迭代精度曲線如圖3。
圖3 稀疏自編碼系統(tǒng)微調(diào)迭代精度曲線
圖3顯示了稀疏自編碼器微調(diào)過(guò)程,即兩類信息在保持原始信息不變時(shí)編碼特征又一次組合,亦可以表述為泵站故障特征重構(gòu)特征的過(guò)程??梢钥闯?,0~60s時(shí),整個(gè)編碼系統(tǒng)精度波動(dòng)較大但整體呈上升趨勢(shì),表明在0~60s迭代時(shí)精度上升較快,效果提升明顯。 60s后逐漸收斂于一個(gè)固定值。
為保證與實(shí)驗(yàn)輸入數(shù)據(jù)維度一致,選取h3層數(shù)據(jù)輸入已訓(xùn)練好的SVM。
微調(diào)后,抽取h3層編碼數(shù)據(jù)進(jìn)行SVM的模型訓(xùn)練。取10組泵站不對(duì)中故障數(shù)據(jù)進(jìn)行模型測(cè)試,稀疏自編碼的SVM測(cè)試結(jié)果能夠準(zhǔn)確檢測(cè)出對(duì)應(yīng)的泵站故障,正確率達(dá)100%,遠(yuǎn)高于了僅使用SVM分類器正確率的70%。 表明稀疏自編碼的SVM對(duì)于泵站不對(duì)中故障檢測(cè)具有可行性、有效性。
為檢驗(yàn)?zāi)P蜋z測(cè)精度提高是否受到特征提取的影響,模型編碼層對(duì)故障數(shù)據(jù)是否具有有效的特征提取能力,提取編碼后的數(shù)據(jù)進(jìn)行比較分析:
(1)首先將原始數(shù)據(jù)經(jīng)過(guò)稀疏自動(dòng)編碼器編碼,使原始特征重新分布到現(xiàn)在的5個(gè)維度上。
(2)其次使用樣本類間距離評(píng)價(jià)特征提取效果,隨機(jī)從正常樣本及不對(duì)中故障樣本各選2組進(jìn)行計(jì)算類間距離。
(3)最后從這兩類中各選1組計(jì)算樣本距離(隨機(jī)進(jìn)行5次取平均值),樣本類間距離如表1。
表1 樣本類間距離
視2組數(shù)據(jù)距離越短為同一類別可能性越大[11],未編碼數(shù)據(jù)計(jì)算類間距離均接近于0。表明數(shù)據(jù)相似大,難以做出正確區(qū)分。編碼后樣本數(shù)據(jù)之間的距離均較大,編碼前后兩類數(shù)據(jù)分布如圖4和圖5。
圖4 未編碼兩類數(shù)據(jù)分布
圖5 編碼后兩類數(shù)據(jù)分布
可以看出編碼增加了兩類數(shù)據(jù)的類間距離,即通過(guò)編碼使得本來(lái)相似度大的頻率特征重新分布。表明編碼層對(duì)于兩類數(shù)據(jù)得到了較好的特征表達(dá),驗(yàn)證了其有效提取特征的能力。
實(shí)驗(yàn)結(jié)果表明稀疏自編碼的SVM識(shí)別故障方法與SVM方法對(duì)比結(jié)果顯著,但是否對(duì)于其他識(shí)別方法仍具有優(yōu)勢(shì),下面以相同結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)開(kāi)展進(jìn)一步實(shí)驗(yàn),分別從檢測(cè)時(shí)間、訓(xùn)練精度、測(cè)試精度3個(gè)方面對(duì)比不同檢測(cè)方法的實(shí)驗(yàn)結(jié)果,不同檢測(cè)方法實(shí)驗(yàn)結(jié)果如圖6。
圖6 不同檢測(cè)方法實(shí)驗(yàn)結(jié)果
(1)檢測(cè)時(shí)間。3種方法所用時(shí)間分別為7.1,3.2,1.8s,稀疏自編碼的SVM檢測(cè)方法耗時(shí)最長(zhǎng),可能是因?yàn)橄∈枳跃幋a的SVM模型復(fù)雜度較高,運(yùn)算量較大。
(2)訓(xùn)練精度。 3種方法訓(xùn)練精度分別為97.9%,93.2%,82.4%,稀疏自編碼的SVM的檢測(cè)方法在訓(xùn)練集上出現(xiàn)了最好的檢測(cè)結(jié)果,依次為BP神經(jīng)網(wǎng)絡(luò)和SVM。
(3)測(cè)試精度。 3種方法測(cè)試精度分別為100%,50%,70%,稀疏自編碼的SVM的檢測(cè)方法在測(cè)試集上表現(xiàn)出顯著的優(yōu)越性,這是因?yàn)镾VM求解分類面時(shí),只受支持向量影響,而與其他樣本無(wú)關(guān)。 稀疏自編碼的SVM結(jié)合了自編碼器的特征提取能力及SVM較強(qiáng)的分類面尋優(yōu)能力。
從實(shí)驗(yàn)結(jié)果可知,SVM檢測(cè)方法耗時(shí)最少,但訓(xùn)練精度與測(cè)試精度均較差,BP神經(jīng)網(wǎng)絡(luò)的檢測(cè)方法雖然在訓(xùn)練集上表現(xiàn)了較好的檢測(cè)結(jié)果,但測(cè)試集的結(jié)果只有50%,稀疏自編碼的SVM雖然耗時(shí)稍長(zhǎng),但魯棒性強(qiáng),識(shí)別精度最高。 此外稀疏自編碼的SVM檢測(cè)方法在故障檢測(cè)中擺脫了人工特征提取的局限性,在泵站故障檢測(cè)中表現(xiàn)出良好的優(yōu)越性。
(1)對(duì)于有限樣本情況下,稀疏自編碼的SVM檢測(cè)方法在泵站故障檢測(cè)可獲得較高的精度,驗(yàn)證了方法的可行性、正確性及有效性。
(2)對(duì)比了SVM、稀疏自編碼的SVM、BP神經(jīng)網(wǎng)絡(luò)3種泵站故障檢測(cè)方法,得出稀疏自編碼的SVM雖然耗時(shí)稍長(zhǎng),但魯棒性強(qiáng),識(shí)別精度最高。 此外稀疏自編碼的SVM檢測(cè)方法在故障檢測(cè)中擺脫了人工特征提取的局限性,在泵站故障檢測(cè)中表現(xiàn)出良好的優(yōu)越性。