孫 鑫,陳海松,王 清
(陸軍工程大學(xué),野戰(zhàn)工程學(xué)院,江蘇 南京210001)
移動(dòng)電站作為一種移動(dòng)式的獨(dú)立電源,在工程作業(yè)中的主要作用是提供動(dòng)力或者照明供電,通常使用在礦井、洞穴、建筑工地等場(chǎng)所,由于這些場(chǎng)所揚(yáng)塵多、潮濕,工作環(huán)境較為惡劣,而發(fā)電機(jī)作為電站核心部件,長(zhǎng)久處于該種環(huán)境下極易導(dǎo)致故障頻發(fā),且不同作業(yè)環(huán)境下故障類型不同,為故障排除帶來(lái)困難。實(shí)現(xiàn)對(duì)移動(dòng)電站發(fā)電機(jī)故障快速準(zhǔn)確的診斷識(shí)別,不僅有利于提高作業(yè)效率,對(duì)保證作業(yè)人身安全也具有較大意義。針對(duì)移動(dòng)電站及其發(fā)電機(jī)的故障診斷,很多學(xué)者提出了有效方法,如小波分析[1]、故障字典診斷法和灰色預(yù)測(cè)診斷法[2]、BP神經(jīng)網(wǎng)絡(luò)[3]等,但這些方法較多的依賴于人工經(jīng)驗(yàn),要求具有一定的先驗(yàn)知識(shí),而淺層人工神經(jīng)網(wǎng)絡(luò)挖掘故障信息、提取故障特征和識(shí)別設(shè)備故障狀況的能力有限,還可能產(chǎn)生維數(shù)災(zāi)難等問(wèn)題,因此這些方法很難達(dá)到理想效果。深度置信網(wǎng)絡(luò)由 Hinton[4]自 2006 年提出后,Tamilselva[5]、Tran[6]等使用DBN(Deep Belief Network,DBN)分別對(duì)飛機(jī)發(fā)動(dòng)機(jī)和壓縮機(jī)進(jìn)行故障診斷,效果明顯,取得了相比機(jī)器學(xué)習(xí)算法更好的診斷精度。
本文利用DBN從底層到頂層逐步獲取移動(dòng)電站發(fā)電機(jī)故障特征,在對(duì)初始數(shù)據(jù)進(jìn)行簡(jiǎn)單預(yù)處理之后,無(wú)需過(guò)多的專業(yè)知識(shí)即可完成發(fā)電機(jī)故障的診斷,減少人為因素的影響,擁有較好的普適性和實(shí)用性。
深度學(xué)習(xí)網(wǎng)絡(luò)能夠模擬人的大腦,建立與人思維相似的分析和學(xué)習(xí)結(jié)構(gòu)[7],來(lái)解釋相關(guān)數(shù)據(jù),如圖像、聲音、文本等。深度置信網(wǎng)絡(luò)是一種非監(jiān)督貪婪逐層訓(xùn)練的神經(jīng)網(wǎng)絡(luò),通過(guò)不斷的實(shí)驗(yàn)與驗(yàn)證,DBN展現(xiàn)了優(yōu)異的特征提取和訓(xùn)練算法,能很好的表達(dá)出初始數(shù)據(jù)與最終輸出之間的復(fù)雜映射關(guān)系。
深度置信網(wǎng)絡(luò)是基于限制玻爾茲曼機(jī)堆棧而成的,其基本機(jī)構(gòu)如圖1所示。該圖展示的是一個(gè)含有3個(gè)限制玻爾茲曼機(jī)的DBN結(jié)構(gòu)示意圖,每個(gè)RBM都有相對(duì)的輸入與輸出,即可見(jiàn)層與隱含層。如最初的RBM1中,原始數(shù)據(jù)按照樣本的維度輸入作為可見(jiàn)層v1,其輸出層h1,兩者之間的連接權(quán)重為w1;在RBM2中,RBM1的輸出h1作為其輸入v2,經(jīng)過(guò)連接權(quán)重w2輸出為h2,以此類推下去。每個(gè)RBM都是采用非監(jiān)督的貪婪學(xué)習(xí),使得輸出層能最大似然的表示輸入,因此通過(guò)多層RBM,實(shí)現(xiàn)了最初數(shù)據(jù)的特征提取。最后在輸出層加上softmax函數(shù)完成對(duì)故障模式的分類識(shí)別。
圖1 DB N結(jié)構(gòu)示意圖
深度置信網(wǎng)絡(luò)的訓(xùn)練主要包含兩個(gè)過(guò)程,一是基于RBM由下自上的前向傳播,二是在BP算法下進(jìn)行自頂向下的反向微調(diào)。
在前向傳播中,Hinton提出了對(duì)比散度算法[8],以n次(n一般取1)吉布斯采樣完成快速參數(shù)更新,使RBM訓(xùn)練得以有效完成,更新公式為:
其中<*>data表示輸入數(shù)據(jù),<*>recon表示重建后的數(shù)據(jù),m為慣性系數(shù),控制參數(shù)受上一次影響的程度,η為正向?qū)W習(xí)率。單個(gè)RBM的參數(shù)訓(xùn)練完畢之后,將其輸出作為下一個(gè)RBM輸入循環(huán)以上步驟即可,從而完成所有RBM的參數(shù)初始化。
反向微調(diào)時(shí)使用BP算法,將分類誤差自頂向下傳播,對(duì)初始化的權(quán)重和偏置進(jìn)行微調(diào),更新公式為:
其中,α為微調(diào)學(xué)習(xí)率。通過(guò)反向微調(diào)完成整個(gè)網(wǎng)絡(luò)的參數(shù)優(yōu)化,達(dá)到整體網(wǎng)絡(luò)性能最優(yōu)。
基于學(xué)者對(duì)發(fā)電機(jī)故障的分析[9-11],結(jié)合實(shí)際工作,確定相應(yīng)指標(biāo)作為輸入。對(duì)故障種類進(jìn)行編號(hào),記為1,2,…,m,為與正常工作時(shí)的指標(biāo)進(jìn)行對(duì)比,添加正常工作狀態(tài)下的參數(shù),編號(hào)為0,共m+1種輸出類別標(biāo)簽。
為降低各指標(biāo)之間的數(shù)量級(jí)差別,減少量綱對(duì)預(yù)測(cè)的影響,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,作為后期DBN網(wǎng)絡(luò)輸入。
(1)對(duì)于部分為0的數(shù)據(jù),將其賦值為10-8,避免運(yùn)算過(guò)程中出現(xiàn)分母為0導(dǎo)致溢出;
(2)為提高數(shù)據(jù)隨機(jī)性,將所有樣本隨機(jī)打亂組成樣本集,按比例組成訓(xùn)練集和測(cè)試集;
(3)將數(shù)據(jù)進(jìn)行歸一化處理,調(diào)整到[0,1]之間,調(diào)整方式為:
其中,x′為調(diào)整后的數(shù)據(jù),xmax和xmin為指標(biāo)特征的最大和最小值,
DBN的結(jié)構(gòu)參數(shù)主要包括數(shù)據(jù)輸入維度、輸出維度、RBM數(shù)量(隱含層數(shù)量)、各隱含層節(jié)點(diǎn)數(shù)。其中,數(shù)據(jù)輸入維度由輸入樣本集的指標(biāo)維度確定,輸出維度一般由故障類別總數(shù)確定。這里主要需要人為確定的參數(shù)為隱含層數(shù)L和各隱含層節(jié)點(diǎn)數(shù)nl,由于這兩個(gè)參數(shù)的確定尚無(wú)理論依據(jù),本文采取文獻(xiàn)[9]中提出的經(jīng)驗(yàn)公式進(jìn)行確定:
ni和no分別表示三層神經(jīng)網(wǎng)絡(luò)的輸入與輸出節(jié)點(diǎn)數(shù),由于深度神經(jīng)網(wǎng)絡(luò)中第i個(gè)RBM的輸出為第i+1個(gè)RBM的輸入,因此對(duì)于第k個(gè)隱含層ni=hk-1,代入到式12,得到:
其中第一層輸入h0=n0。
而關(guān)于層數(shù)的確定,一方面過(guò)少的層數(shù)易造成數(shù)據(jù)欠擬合,使得訓(xùn)練在訓(xùn)練集上表現(xiàn)就很差。另一方面,當(dāng)層數(shù)過(guò)多時(shí),則對(duì)分類特征具有更詳細(xì)的表達(dá),但是容易造成過(guò)擬合,雖然在訓(xùn)練集上表現(xiàn)很好,但泛化能力較差。因此,需要選取在合理的范圍之內(nèi),由于沒(méi)有確定的理論依據(jù),通常2-3層可以滿足需求,若想找到具體問(wèn)題的最佳層數(shù),需要通過(guò)實(shí)驗(yàn)確定。
分類問(wèn)題中,一般采用交叉熵作為損失函數(shù),而添加正則化項(xiàng)可防止模型過(guò)擬合,本文最終的損失函數(shù)為:
λ為懲罰系數(shù),其值越大,對(duì)較大的權(quán)重值懲罰越大,從而控制目標(biāo)權(quán)重在較為合理的區(qū)間取值。p?i、pi分別表示數(shù)據(jù)輸出的真實(shí)值與預(yù)測(cè)值。
基于以上分析,移動(dòng)電站發(fā)電機(jī)故障診斷模型流程為:
(1)采集發(fā)電機(jī)指標(biāo),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,記錄故障標(biāo)簽,劃分訓(xùn)練集與測(cè)試集;
(2)設(shè)定網(wǎng)絡(luò)各項(xiàng)參數(shù),如網(wǎng)絡(luò)層數(shù)、節(jié)點(diǎn)數(shù)與學(xué)習(xí)率、迭代次數(shù)等超參數(shù);
(3)以樣本輸入維度為第一個(gè)RBM的輸入,通過(guò)對(duì)比散度算法不斷調(diào)整該RBM的權(quán)重與偏置,實(shí)現(xiàn)局部參數(shù)最優(yōu);
(4)將第一個(gè)RBM輸出作為第二個(gè)RBM輸入,重復(fù)3,直至所有RBM訓(xùn)練完畢;
(5)根據(jù)softmax層輸出與實(shí)際標(biāo)簽對(duì)比,利用BP反向傳播算法,將誤差進(jìn)行反傳至各個(gè)RBM,微調(diào)權(quán)重與偏置,得到全局最優(yōu)參數(shù);
(6)判定是否達(dá)到停止條件,若是,停止迭代并輸出,否則繼續(xù)訓(xùn)練。
為驗(yàn)證模型有效性,使用某型拖車式移動(dòng)電站進(jìn)行實(shí)驗(yàn)驗(yàn)證。確定以下14項(xiàng)指標(biāo)作為輸入:工作線電壓、工作電流、工作頻率、發(fā)電機(jī)轉(zhuǎn)速、勵(lì)磁電壓、勵(lì)磁電流、水溫、油壓、油溫、蓄電池電壓、電機(jī)軸承溫度、發(fā)電機(jī)外殼溫度、發(fā)電機(jī)振動(dòng)量、絕緣電阻。從這些指標(biāo)可以看出,很多參數(shù)之間具有復(fù)雜聯(lián)系,如勵(lì)磁電壓與勵(lì)磁電流、發(fā)電機(jī)外殼溫度與發(fā)電機(jī)振動(dòng)量之間可能存在某種隱形函數(shù)關(guān)系,傳統(tǒng)方法很難處理,并且隨著維數(shù)的拓展,淺層神經(jīng)網(wǎng)絡(luò)也逐步喪失可行性,該種情況下宜使用提出的DBN方法進(jìn)行分析。
實(shí)驗(yàn)設(shè)置了發(fā)電機(jī)軸承曠動(dòng)、熔絲燒斷、調(diào)壓器調(diào)整不當(dāng)、電刷接觸不良、風(fēng)扇損壞、潤(rùn)滑脂缺少、繞組受潮共7種故障,加上正常運(yùn)行狀態(tài),共8類輸出。為保證數(shù)據(jù)能充分反映發(fā)電機(jī)工作實(shí)際情況,水溫、油壓、油溫、電機(jī)軸承溫度和外殼溫度統(tǒng)一設(shè)定為穩(wěn)定運(yùn)行30 min之后測(cè)量所得。
所有故障采樣間隔為5 s。其中,每個(gè)故障取500組數(shù)據(jù),共5000個(gè)樣本,每個(gè)樣本14個(gè)維度,打亂后構(gòu)成整個(gè)數(shù)據(jù)集。對(duì)于標(biāo)簽數(shù)據(jù),為便于計(jì)算輸出誤差,將故障編號(hào)轉(zhuǎn)換為獨(dú)熱編碼,如熔絲燒斷編號(hào)為2,轉(zhuǎn)換為[0 0 1 0 0 0 0 0 0],采樣結(jié)果按照前述數(shù)據(jù)預(yù)處理方法進(jìn)行歸一化,得到表1樣本數(shù)據(jù)。
表1 預(yù)處理后部分?jǐn)?shù)據(jù)
根據(jù)前文描述,隱含層數(shù)可從最少的2層開(kāi)始,考慮輸入數(shù)據(jù)維度為14,并不大,本文設(shè)為2層。節(jié)點(diǎn)數(shù)按照經(jīng)驗(yàn)公式計(jì)算為11,將其作為參考值帶入,前向?qū)W習(xí)率與微調(diào)學(xué)習(xí)率取為0.001,慣性權(quán)重為0.9,迭代次數(shù)為50次。為去除隨機(jī)性影響,每次計(jì)算結(jié)果重復(fù)實(shí)驗(yàn)20次,取平均值,損失函數(shù)采用交叉熵,正則化系數(shù)為0.000 2。訓(xùn)練集為按比例隨機(jī)在所有樣本中抽取,剩余樣本作為測(cè)試集。
為說(shuō)明與其它傳統(tǒng)故障診斷或淺層神經(jīng)網(wǎng)絡(luò)的區(qū)別,將DBN與BP、SVM方法進(jìn)行對(duì)比,為保證環(huán)境的一致性,其中三層BP采用的隱含層節(jié)點(diǎn)數(shù)為11,激活函數(shù)同樣為sigmoid,學(xué)習(xí)率、迭代次數(shù)與慣性系數(shù)均與DBN一致。SVM采用RBF作為核函數(shù),訓(xùn)練集與測(cè)試集按照從1∶9到9∶1的比例進(jìn)行試驗(yàn),取20次實(shí)驗(yàn)平均值,準(zhǔn)確率表示為模型預(yù)測(cè)類別正確的樣本占測(cè)試總樣本的百分比,結(jié)果如表2。
表2 DB N、BP、S V M準(zhǔn)確率
從圖2實(shí)驗(yàn)結(jié)果可知:
圖2 不同方法結(jié)果對(duì)比圖
(1)但從DBN準(zhǔn)確率變化曲線來(lái)看,從第三組開(kāi)始網(wǎng)絡(luò)的預(yù)測(cè)準(zhǔn)確率就已經(jīng)高達(dá)98%以上,并且隨著訓(xùn)練樣本比例的增加最終遞增到100%,說(shuō)明樣本越多,對(duì)模型提高其準(zhǔn)確性具有更大的幫助,而且DBN對(duì)樣本數(shù)據(jù)集劃分比例變動(dòng)不是很敏感,具有一定的魯棒性。
(2)三種算法比較來(lái)看,在同樣迭代到40次時(shí),BP尚未找到合適的參數(shù)擬合,效果最差。而SVM具有與DBN相當(dāng)?shù)木?,即使在樣本比例?∶9時(shí),仍然可以達(dá)到75.19%的準(zhǔn)確率,此時(shí)DBN參數(shù)訓(xùn)練還嚴(yán)重欠擬合,導(dǎo)致其準(zhǔn)確率接近隨機(jī)結(jié)果。但當(dāng)實(shí)驗(yàn)進(jìn)行到編號(hào)3時(shí),DBN具有相對(duì)較高的準(zhǔn)確率,而SVM在最后還可能出現(xiàn)波動(dòng)。整體實(shí)驗(yàn)表明,DBN用于發(fā)電機(jī)故障診斷切實(shí)可行,且相對(duì)淺層網(wǎng)絡(luò)和傳統(tǒng)方法具有更高的準(zhǔn)確率和穩(wěn)定性。
本文基于深度置信網(wǎng)絡(luò)較強(qiáng)的特征提取能力,構(gòu)建了針對(duì)移動(dòng)電站發(fā)電機(jī)的故障診斷模型,通過(guò)正向傳播和反向微調(diào),優(yōu)化網(wǎng)絡(luò)參數(shù)。驗(yàn)證了更多的測(cè)試樣本有利于增加模型的預(yù)測(cè)準(zhǔn)確率,表明DBN對(duì)劃分的訓(xùn)練集和測(cè)試集比例變化具有一定的抵抗能力。通過(guò)與BP、SVM等算法的比較,進(jìn)一步說(shuō)明了DBN具有高精度、魯棒性的優(yōu)點(diǎn)[12]。