趙書濤, 王二旭, 陳秀新, 王科登,李小雙
(1.華北電力大學(xué) 電氣與電子工程學(xué)院, 河北 保定 071003; 2. 華北電力大學(xué) 控制與計算機工程學(xué)院, 河北 保定 071003)
電動機的可靠運行是游梁式采油機正常工作的基礎(chǔ). 采油井所處背景環(huán)境復(fù)雜,加之三相電機驅(qū)動大型游梁式采油機工況的特殊三相電機驅(qū)動大型游梁式采油機工況的特殊性,對其進(jìn)行準(zhǔn)確故障診斷實際上更為困難. 電動機機械故障常表現(xiàn)為軸承偏心、繞組短路、堵轉(zhuǎn)或供電電源故障等[1]. 前人的研究大多集中在電機振動信號和定子電流信號[2-4],對于電流信號分析診斷故障而言,由于與故障存在相關(guān)性的頻率分量較小,直接對電動機機械故障不夠敏感;利用非侵入式振動信號診斷電機故障方法簡單有效,實用性強,通常采用壓電式加速度傳感器采集信號,但傳感器安裝和耦合方式影響信號頻率響應(yīng)范圍. 鑒于聲音信號可由非接觸式傳感器獲取,測量頻帶寬,且往往伴隨電機振動同源產(chǎn)生,可以有效彌補振動傳感器非剛性連接問題和頻帶限制產(chǎn)生的失效現(xiàn)象. 探索聲振信號聯(lián)合互補的處理方法,利用非侵入式多傳感器監(jiān)測優(yōu)勢,對大型異步電機進(jìn)行故障診斷具有重要研究價值.
許多學(xué)者研究了聲振聯(lián)合方法診斷高壓斷路器運行狀態(tài),文獻(xiàn)[5]對聲振信號進(jìn)行改進(jìn)集合經(jīng)驗?zāi)J椒纸?,對分解后固有模態(tài)函數(shù)(IMF)求其二維譜熵作為特征向量進(jìn)行故障診斷. 文獻(xiàn)[6]利用互補總體經(jīng)驗?zāi)B(tài)分解算法對聲振信號進(jìn)行分解,求取IMF分量的能量系數(shù)、樣本熵、功率譜熵作為特征向量進(jìn)行故障診斷. 文獻(xiàn)[7]對聲振信號進(jìn)行局部均值分解,然后對PF分量求取近似熵作為特征向量進(jìn)行故障診斷. 上述方法對斷路器故障診斷取得了一定效果,但僅限于將聲振信號兩者進(jìn)行機械地聯(lián)合,未考慮背景情況和聲振信號差異性互補. 在分布式油井所處的惡劣環(huán)境下,如何發(fā)揮聲振信號聯(lián)合優(yōu)勢進(jìn)行設(shè)備故障診斷更有挑戰(zhàn)性.
聲振信號分析有Fourier變換、小波變換、EMD分解、LMD分解等,其特征提取方法常依靠人工選擇和專家知識,故障模式識別算法主觀性過強,容易造成故障信息的遺漏和丟失[8]. 遴選、提取特征后再選擇合適的分類器進(jìn)行故障分類,樣本數(shù)據(jù)變動時需要有針對性地不斷對特征閾值和方法進(jìn)行調(diào)整,診斷模型及算法總體泛化能力差[9]. 隨著深度學(xué)習(xí)理論的不斷發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)在圖像識別、語音識別等領(lǐng)域得到了廣泛應(yīng)用. CNN作為典型的深度學(xué)習(xí)算法,具備強大的特征學(xué)習(xí)能力,自適應(yīng)性好、運行速度快,具備良好的自學(xué)習(xí)和并行處理能力,在機械設(shè)備的故障診斷中具有一定優(yōu)勢[10-11]. 文獻(xiàn)[12]把電機的電流信號進(jìn)行CNN的故障診斷,文獻(xiàn)[13]對軸承振動信號進(jìn)行了單層卷積,文獻(xiàn)[14]對振動信號進(jìn)行EEMD分解,然后構(gòu)造特征數(shù)據(jù)集. 上述研究對機械故障診斷取得了一定效果,但缺乏對信號提純處理,其特征提取過程復(fù)雜,需要人工干預(yù),且受到樣本數(shù)據(jù)量限制造成故障識別準(zhǔn)確率不高,沒有把CNN的自學(xué)習(xí)和分類能力最大化.
針對游梁式采油機配套的大型三相電動機,本文提出聯(lián)合運行中聲音和振動信號特征各自頻帶優(yōu)勢,運用濾波處理后的數(shù)據(jù)擴容,構(gòu)成足量數(shù)據(jù)樣本輸入CNN進(jìn)行故障識別的新方法,其流程如圖1所示.
采油井分布于野外或道路兩旁,人文背景和抽油泵皮帶連接噪聲嚴(yán)重影響電機運行信號的質(zhì)量,非平穩(wěn)聲音時間序列有明顯形態(tài)特征,診斷故障的第一步要基于背景噪聲庫聯(lián)合稀疏表示對此類噪進(jìn)行處理.
電機旋轉(zhuǎn)驅(qū)動抽油泵上下往復(fù)運動,限于振動傳感器安裝方式信號呈現(xiàn)可靠的窄帶(量程一定,靈敏度與有效頻率平方成反比)特點,僅靠低頻振動信號顯然不能覆蓋電機發(fā)生故障的全部頻率范圍,因此需要同源聲音信號對振動進(jìn)行頻帶互補拓展.
將疊頻后聲振信號轉(zhuǎn)化為一維形式,避免原始信號空間序列相關(guān)性遭到破壞,再利用數(shù)據(jù)擴容提供1D-CNN所需數(shù)據(jù),最后采用一維卷積神經(jīng)網(wǎng)絡(luò)對聲振信號進(jìn)行故障診斷. 實現(xiàn)本文提出方法的關(guān)鍵環(huán)節(jié)在于聲振信號去噪、頻帶互補拓展、以及CNN輸入數(shù)據(jù)擴容和診斷方法優(yōu)化過程.
考慮采油井現(xiàn)場聲振信號的頻帶特點,首先建立背景噪聲庫去除模板噪聲,利用稀疏表示去除聲音信號的殘余噪聲,再將振動和聲音有機聯(lián)合控制表征故障信息的頻率范圍,提純的原始樣本數(shù)據(jù)為電機故障診斷準(zhǔn)確率的提高奠定了基礎(chǔ).
采油機工作現(xiàn)場夾雜風(fēng)聲、打雷聲、汽笛聲和人語聲等環(huán)境噪聲,也會出現(xiàn)抽油機皮帶摩擦、減速箱異響和游梁機械運行噪聲. 在采集這些背景噪聲樣本形成特征庫基礎(chǔ)上,第1步通過拾音器獲得聲音信號進(jìn)行雙門限端點檢測計算起始點,再使用Mel倒譜系數(shù)(MFCC)獲取頻域信息,提取背景信號特征,最后采用動態(tài)時間規(guī)整進(jìn)行模板匹配(DTW)去除模板噪聲.
針對仍有殘余噪聲、信噪比不高的電機聲音信號,根據(jù)其尖峰和突變形態(tài)特征差異明顯特點,第2步采用一個或者幾個形態(tài)結(jié)構(gòu)去逼近,即稀疏表示,利用廣義K-奇異值分解(K-SVD)算法求得基于稀疏和冗余的訓(xùn)練字典,得到降噪后的信號.K-SVD訓(xùn)練能夠有效反應(yīng)信號結(jié)構(gòu),選用沖擊原子構(gòu)建冗余字典,然后再用0范數(shù)貪婪算法中的正交匹配追蹤(OMP)算法選擇原子進(jìn)行模型逼近,達(dá)到50次迭代后停止,原始信號(去除模板噪聲)減去殘余背景信號從而實現(xiàn)去噪[15]. 本文對某平原地區(qū)采油井Y2-280M-8型電動機的聲音信號進(jìn)行上述信號處理過程,如圖2所示.
(a)去噪前
(b)去噪后
由上圖和多種實際信號驗證,去噪后聲信號的背景噪聲明顯減少,原始信號細(xì)節(jié)信息被保留,均方誤差和平均絕對誤差降低,聲信號的信噪比得到了提高.
選用頻率為1~10 000 Hz壓電式(CK 8605)傳感器和頻率為20~20 000 Hz的(WM-025N)拾音器,同時采集電機運行振動和聲音信號. 以電機載荷過重情況為例,聲振信號雖為同源,頻譜分布明顯不同,如圖3所示.
(a)振動信號頻譜
(b)聲音信號頻譜
實測信號分析結(jié)果可以看出振動譜峰只出現(xiàn)在3 kHz以下,顯然無法全面反應(yīng)電機的多類型故障. 實際上,傳感器頻率響應(yīng)曲線是出廠時剛性連接下測得的,而在實際壓電式加速度應(yīng)用強磁吸附或膠粘很難達(dá)到剛性連接[16],其頻響曲線差異如圖4所示.
圖4 CK 8605傳感器頻率響應(yīng)曲線
圖4中,橫坐標(biāo)是實測頻率值,縱坐標(biāo)是幅值比較值,等于20log(A2/A1),A2為所測點頻率振幅,A1為所測全部數(shù)據(jù)平均振幅. 非剛性方式連接的傳感器頻響范圍減小30%,最佳頻率響應(yīng)為0.1~7 kHz,測電機高頻振動容易造成信號失真.
電機故障診斷中聲振信號同源,振動傳感器直接與電機本體吸附,信號在7 kHz以內(nèi)有很強抗擾性;聲音傳感器置于電機附近,信號頻率可達(dá)20 kHz. 本文將去噪后的聲音信號,先采用有限長單位沖激響應(yīng)(finite impulse response,F(xiàn)IR)帶通濾波器濾除低于7 kHz和高于20 kHz聲音信號,再采用低通濾波器濾除7 kHz以上振動信號,將兩者互補特性聯(lián)合從而可以精準(zhǔn)地掌握整個故障階段的信息,為卷積神經(jīng)網(wǎng)絡(luò)準(zhǔn)確診斷故障提供精準(zhǔn)的樣本數(shù)據(jù).
CNN作為深度學(xué)習(xí)的典型代表,是由輸入層、卷積層、池化層、全連接層和輸出層組成的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖5所示. 每一層的權(quán)值矩陣與特征矩陣進(jìn)行卷積,前一層的卷積結(jié)果經(jīng)過激活函數(shù)運算會輸出成為下一個神經(jīng)元,以便構(gòu)造下一層對應(yīng)的特征.
卷積層通過卷積核對輸入數(shù)據(jù)進(jìn)行卷積,利用非線性激活函數(shù)構(gòu)造特征矢量. 同一個卷積核在卷積過程中共享參數(shù),故一個卷積核得到一類特征. 計算公式為
(1)
圖5 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
通常選擇修正線性單元(rectified linear unit,ReLU)作為非線性激活函數(shù),可以使得一部分的神經(jīng)元輸出為0,減少參數(shù)的相互依賴,提高網(wǎng)絡(luò)的稀疏性. ReLU的計算公式為
(2)
池化層通過池化核對輸入數(shù)據(jù)進(jìn)行縮放映射,對數(shù)據(jù)降維同時提取特征. 池化包含平均池化和最大池化,其變換函數(shù)為
t∈[(j-1)W+1,jW].
(3)
CNN的輸出層對最后一個池化層的輸出進(jìn)行全連接,然后采用Soft-Max分類器解決多分類問題,模型為
O=f(bo+fvwo).
(4)
式中:bo為偏差向量,fv為特征矢量,wo為權(quán)值矩陣.
分別對Y2-280M-8型45 kW三相電動機進(jìn)行正常運行、軸承偏心、載荷過重和定子繞組短路試驗,在不同狀態(tài)下采集聲音和振動信號數(shù)據(jù)樣本. 每類樣本采集600組數(shù)據(jù),每組數(shù)據(jù)包含50 000個采樣點,分割樣本長度設(shè)定為1 024. 2/3組數(shù)據(jù)樣本用作訓(xùn)練,1/3組數(shù)據(jù)樣本作為測試. 1D-CNN的特征提取層由卷積層和池化層組成,在進(jìn)行池化操作前,選擇ReLU作為激活函數(shù)增加模型的非線性. 選定兩個特征提取層,其特征提取層設(shè)置卷積核數(shù)量分別為32和64,設(shè)定卷積核尺寸為1×15,池化層采用大小為1×2,步長為2的最大池化,兩個全連接層的節(jié)點分別設(shè)置為256和64. 采用RMSprop優(yōu)化器,初始學(xué)習(xí)率設(shè)置為0.03,衰減率為 0.99,迭代次數(shù)為500,模型的訓(xùn)練步驟如圖6所示.
圖6 模型訓(xùn)練示意圖
3.3.1 重疊式數(shù)據(jù)擴容
實現(xiàn)1D-CNN準(zhǔn)確電機故障診斷必須有大量的一維訓(xùn)練樣本作為支撐,針對1D-CNN需求數(shù)據(jù)量大、數(shù)據(jù)獲取時間長的特點采取重疊式數(shù)據(jù)擴容,數(shù)據(jù)擴容后模型在相同的采樣率下獲得同等數(shù)量樣本所需的時間更短,縮減了1D-CNN的故障診斷時間. 擴容示意圖如圖7所示.
圖7 數(shù)據(jù)擴容示意圖
采用有重疊樣本分割可以完整保留相鄰樣本的相關(guān)性,同時避免樣本截斷導(dǎo)致的特征丟失. 對長度為N的信號x,設(shè)置樣本長度為L,重疊率為λ,擴容分割方法如下:
2)求取每個分割樣本,其中第i個樣本在原信號的位置表示為
xi=X[(i-1)×L×(1-λ)+(0:1)×L],
(5)
式中:i∈[1,n],xi為分割后的樣本數(shù)據(jù).
樣本分割長度太短可以提高模型收斂速度,節(jié)省訓(xùn)練時間,但是易造成非線性特征信息缺失;樣本分割長度太長會影響模型收斂速度,影響診斷的實時性,經(jīng)過試驗分析,本文設(shè)定λ為0.5.
3.3.2 模型結(jié)構(gòu)優(yōu)化
卷積神經(jīng)網(wǎng)絡(luò)由于特殊結(jié)構(gòu)使得其具有很強的泛化能力,但是對于采油機而言,電動機通過皮帶拖動減速箱使游梁做上下沖程運動導(dǎo)致數(shù)據(jù)變動很大,限制了1D-CNN泛化性能和準(zhǔn)確率的提高.
1D-CNN的卷積核之間存在相關(guān)性,而相關(guān)性越小,卷積提取的特征越全面,泛化性和準(zhǔn)確率越好[17]. 為了提高泛化性和準(zhǔn)確率,本文對核函數(shù)進(jìn)行小波分解得到多分辨率小波系數(shù),選取相互正交方向的小波分解系數(shù)對卷積核誤差修改量處理去除核函數(shù)的相關(guān)性. 與此同時,對每個卷積-池化層之后增加一個局部響應(yīng)歸一化(local response normalization,LRN)降低模型所需參數(shù)較多的影響. LRN層可以模仿生物的“側(cè)抑制”機制,使響應(yīng)較大的值變得更大,響應(yīng)歸一化表示[18]為
(6)
訓(xùn)練過程中為了避免發(fā)生過擬合現(xiàn)象,在模型全連接層中引入Early-Stopping機制,其系數(shù)分別為0.5、0.01. 本文的模型結(jié)構(gòu)見表1.
表1 1D-CNN結(jié)構(gòu)表
模型采用軟件Python 與Tensorflow,操作系統(tǒng)為 MacOS,處理器為Intel(R) Core(TM) i5-4440 CPU@3.10 GHz,運行內(nèi)存為 8 GB.
對本模型進(jìn)行500次訓(xùn)練,采用最小均方誤差(mean square error,MSE)作為損失函數(shù),公式為
(7)
為了對學(xué)習(xí)到的效果進(jìn)行驗證,利用主成分分析(principal components analysis,PCA)對倒數(shù)第2層(全連接層)的學(xué)習(xí)特征進(jìn)行可視化,如圖8所示.
圖8 學(xué)習(xí)特征可視化
由圖8可知,模型各狀態(tài)下的學(xué)習(xí)特征聚集在相應(yīng)的區(qū)域內(nèi),說明模型的區(qū)分性很好.
采用 Soft-Max 作為分類器進(jìn)行分類,識別效果如圖9所示(其中圖形的上半部分指準(zhǔn)確率,下半部分指訓(xùn)練損失值). 由圖9可知,隨著訓(xùn)練次數(shù)的增加,模型的識別準(zhǔn)確率逐漸上升,在訓(xùn)練350次后準(zhǔn)確率趨于穩(wěn)定并不再提高. 與此同時,損失值逐漸下降,此時卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果最佳.
圖9 模型的準(zhǔn)確率和損失值
雖然本文設(shè)定訓(xùn)練次數(shù)為500,但迭代400次后準(zhǔn)確率不再提高且損失值相應(yīng)降為最低. 由于引入Early-Stopping機制,當(dāng)模型的準(zhǔn)確率和損失值不再顯著變化時停止模型的訓(xùn)練,有效地避免了過擬合現(xiàn)象.
經(jīng)過訓(xùn)練后,模型總的分類準(zhǔn)確率達(dá)到了97.75%,證明了聲振聯(lián)合更能全面準(zhǔn)確地反映電動機的運行狀態(tài),分類結(jié)果見表2.
表2 1D-CNN分類結(jié)果
4.2.1 聲振聯(lián)合方法效果驗證
為了驗證本文提出聲振聯(lián)合方法的有效性,將之與文獻(xiàn)[5-7]所用的傳統(tǒng)聯(lián)合方法進(jìn)行對比,結(jié)果如圖10所示.
圖10 聲振聯(lián)合診斷結(jié)果對比
由對比圖表可知,本文聯(lián)合方法進(jìn)行故障診斷的正確分類組數(shù)遠(yuǎn)高于傳統(tǒng)聯(lián)合方法,傳統(tǒng)聯(lián)合方法的總體分類準(zhǔn)確率為91.8%,說明本文提出的方法對信號預(yù)處理有效. 原因是背景噪聲庫聯(lián)合稀疏表示去噪有效抑制了背景噪聲的干擾,再使用聲信號彌補振動信號的頻段失真,通過原始樣本信號的提純控制使得CNN的學(xué)習(xí)效果更好.
4.2.2 不同模型的準(zhǔn)確率和泛化性對比
對比所提方法與SVM、BP和RVM三種智能算法的優(yōu)勢,針對同樣的訓(xùn)練樣本,采用文獻(xiàn)[14]提到的EEMD算法對原始信號(未經(jīng)預(yù)處理)進(jìn)行分解,然后利用SVM、BP和RVM進(jìn)行診斷,結(jié)果見表3. 由表3可知,CNN的分類準(zhǔn)確率遠(yuǎn)遠(yuǎn)高于其他算法,其中平均準(zhǔn)確率高于SVM平均準(zhǔn)確率11.50%,高于BP平均準(zhǔn)確率12.50%,高于RVM平均準(zhǔn)確率10.75%. 這主要得益于CNN權(quán)值共享、池化、全連接等獨特結(jié)構(gòu),這些結(jié)構(gòu)使得CNN具有尺度位移與不變性、區(qū)域感知的特點,能對特征進(jìn)行全面學(xué)習(xí),容錯能力強,彌補了其他淺層分類算法特征學(xué)習(xí)不充分、泛化能力差的缺點.
表3 不同診斷模型的結(jié)果對比
由于在實際的油田作業(yè)中數(shù)據(jù)的來源和結(jié)構(gòu)不同,故需對同種類型、不同表征的故障數(shù)據(jù)進(jìn)行分類. 因而,換用Y2-315S-8型號的電動機,采樣頻率由40 kHz變成30 kHz,換用PCB357B21型號的傳感器,同時更改傳感器安放位置,診斷結(jié)果見表4.
表4 變動后不同診斷模型的結(jié)果對比
由表4可知,傳統(tǒng)智能診斷方法在數(shù)據(jù)結(jié)構(gòu)和來源發(fā)生變動的情況下診斷準(zhǔn)確率明顯降低,而1D-CNN模型由于其優(yōu)良的泛化性能仍然保持了非常高的準(zhǔn)確率.
4.2.3 優(yōu)化模型泛化能力驗證
為了驗證優(yōu)化模型的泛化能力,使用原模型進(jìn)行對照,診斷結(jié)果如圖11所示.
圖11 不同模型診斷效果對比
由圖11可知,在數(shù)據(jù)的來源、采集參數(shù)設(shè)置、傳感器位置發(fā)生了變化的情況下,優(yōu)化后的1D-CNN模型總體診斷準(zhǔn)確率依舊達(dá)到了97.75%,遠(yuǎn)高于未優(yōu)化的模型,說明優(yōu)化后的模型對新鮮樣本的自適應(yīng)能力更強,泛化能力更好.
1)針對大型電機聲振信號的同源互補性,提出了一種基于聲振信號聯(lián)合的1D-CNN故障診斷方法,大大提高了故障診斷的準(zhǔn)確率.
2)提出基于背景噪聲庫聯(lián)合稀疏表示去噪后,進(jìn)行聲振互補聯(lián)合處理的控制信號提純新方法,對原始數(shù)據(jù)進(jìn)行了有效剪輯,為1D-CNN準(zhǔn)確診斷電機現(xiàn)場故障奠定了基礎(chǔ).
3)數(shù)據(jù)擴容為模型提供了大量數(shù)據(jù),采用LRN和核函數(shù)去相關(guān)性對模型進(jìn)行了優(yōu)化,驗證了故障診斷算法效果及其廣泛通用性,提高了1D-CNN的泛化能力.