別鋒鋒,都騰飛,龐明軍,谷 晟
(江蘇省綠色過程裝備重點(diǎn)實(shí)驗(yàn)室,江蘇 常州 213164)
管道阻塞是一種常見故障狀態(tài),近年來,聲波檢測法被廣泛應(yīng)用于對(duì)管道阻塞的判別。但由于傳感器采集的聲信號(hào)具有非線性、非平穩(wěn)的特征,同時(shí)處理多通道信號(hào)往往存在分解尺度不同的問題[1-2]。如何從非線性,非平穩(wěn)的信號(hào)中提取故障特征是狀態(tài)識(shí)別的關(guān)鍵。對(duì)于聲信號(hào)中有用信息的提取,國內(nèi)外學(xué)者進(jìn)行了大量的研究分析,提出了很多方法。主要有短時(shí)傅里葉變換、小波分析、經(jīng)驗(yàn)?zāi)B(tài)分解、局部均值分解[3-5]等。1998年Huang[6-7]等提出的經(jīng)驗(yàn)?zāi)B(tài)分解(EMD,Empirical Mode Decomposition),克服了小波分析小波基的選擇問題,可以根據(jù)信號(hào)的特征自適應(yīng)選擇基底來對(duì)信號(hào)進(jìn)行多分辨率分析,但該方法不足之處在于分解的固有模態(tài)函數(shù)(IMF,Intrinsic Mode Function)會(huì)產(chǎn)生模態(tài)混疊的情況。為降低模態(tài)混疊的影響,Wu等[8]又在EMD基礎(chǔ)上提出了集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD,Ensemble Empirical Mode Decomposition),該方法利用加入輔助白噪聲來降低模態(tài)混疊影響。YEH等[9]又對(duì)EEMD做了改進(jìn),提出了互補(bǔ)集合經(jīng)驗(yàn)分解法(CEEMD,Complete Ensemble Empirical Mode Decomposition),采用正、負(fù)成對(duì)的形式加入輔助噪聲,通過正、負(fù)抵消重構(gòu)信號(hào)中的輔助噪聲,降低模態(tài)混疊影響,并且可以減少加入的噪聲集合次數(shù),提高計(jì)算效率。完全集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN,Complete EEMD with Adaptive Noise)算法[10]克服了EEMD算法存在的不足,該方法將自適應(yīng)的白噪聲添加到EEMD算法分解的每一階段,各個(gè)模態(tài)函數(shù)分量通過計(jì)算唯一的余量信號(hào)獲取,使其分解過程既具有完整性,又能抑制噪聲成分。本文采用進(jìn)一步優(yōu)化的分解方法[11]ICEEMDAN(Improved Complete EEMD with Adaptive Noise)。該方法極大地抑制了初始分解過程引起的虛假分量和模態(tài)混疊問題,具有更好的分解結(jié)果。
神經(jīng)網(wǎng)絡(luò)作為一種人工智能的方法,目前已廣泛應(yīng)用于故障診斷領(lǐng)域。通過自組織和自適應(yīng)的學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)可以達(dá)到良好的分類效果。但是神經(jīng)網(wǎng)絡(luò)算法容易造成過擬合的問題,實(shí)際訓(xùn)練過程中需要大量的訓(xùn)練樣本。極限學(xué)習(xí)機(jī)(ELM)由于其結(jié)構(gòu)簡單,方便使用,近年來已有很大的應(yīng)用,除了解決了神經(jīng)網(wǎng)絡(luò)易產(chǎn)生過擬合的問題外,ELM只需要設(shè)置隱藏層節(jié)點(diǎn)的數(shù)量、輸入權(quán)重和隱藏元素的偏差,便可獲得全局最優(yōu)解[12]。因此,它在模式識(shí)別領(lǐng)域得到了廣泛應(yīng)用和發(fā)展。
本文將ICEEMDAN、聲壓級(jí)和ELM算法相結(jié)合來分析和識(shí)別堵塞管道的聲信號(hào)脈沖響應(yīng)信號(hào)。首先,通過ICEEMDAN信號(hào)預(yù)處理得到若干個(gè)IMF分量。其次,綜合相關(guān)系數(shù)和方差貢獻(xiàn)率作為相關(guān)判據(jù),篩選出表征管道阻塞信息的IMF分量,計(jì)算IMF分量的聲壓級(jí)構(gòu)造特征向量,然后輸入ELM進(jìn)行分類與識(shí)別。
本文第一部分將介紹ICEEMDAN算法、ELM算法以及IMF的選取原則。第二部分將介紹基于ICEEMDAN聲壓級(jí)的特征提取方法和基于ELM的模式識(shí)別方法。第三部分是實(shí)驗(yàn)分析,第四部分是結(jié)論。
EEMD算法在每次分解的開始階段,都存在一個(gè)局部均值和一個(gè)IMF分量,而真正模態(tài)分量是混合原信號(hào)和噪聲信號(hào)的平均模態(tài)分量,其中包含著一些殘余的噪聲。另一方面,在CEEMDAN算法分解過程中使用上一個(gè)模態(tài)分量分解后的殘差來計(jì)算下一個(gè)模態(tài),每一階模態(tài)計(jì)算都是連續(xù)的。而Colominas提出的ICEEMDAN算法在此基礎(chǔ)上進(jìn)行了改進(jìn)。
CEEMDAN方法在分解過程中加入的是高斯白噪聲,而ICEEMDAN方法加入的是一種特殊的白噪聲Ek(w(i)),即高斯白噪聲經(jīng)過EMD分解過后的第k個(gè)IMF分量,對(duì)每個(gè)模態(tài)分量計(jì)算信號(hào)加噪聲的局部均值,并將分解得到的IMF定義為殘差信號(hào)與局部均值的差值。ICEEMDAN分解方法大大減少了IMF分量中的殘余噪聲,改進(jìn)了傳統(tǒng)方法在分解重構(gòu)的早期階段容易產(chǎn)生虛假分量和模態(tài)混疊的不足。
定義操作符Ek(·)表示EMD分解后的第k個(gè)模態(tài)分量,M(·)表示信號(hào)的局部均值。那么E1(x)=x-M(x)。操作符表示取均值,具體的分解過程如下:
第一步:構(gòu)造x(i)=x+α0E1(w(i)),其中,w(i)表示被添加的第i個(gè)白噪聲,α0表示噪聲標(biāo)準(zhǔn)差。計(jì)算x(i)的局部均值M(x(i)),取均值得到第一個(gè)殘差分量
第二步:計(jì)算第一模態(tài)分量IMF1值
第三步:計(jì)算第二模態(tài)分量IMF2值r2,式中
使用極限學(xué)習(xí)機(jī)ELM對(duì)管道聲信號(hào)進(jìn)行模式識(shí)別。極限學(xué)習(xí)機(jī)ELM是在單隱層前饋網(wǎng)絡(luò)SLFN的基礎(chǔ)上發(fā)展起來的,而單隱層前饋網(wǎng)絡(luò)SLFN是具有一層隱含層的特殊BP神經(jīng)網(wǎng)絡(luò)[13]。ELM的體系結(jié)構(gòu)如圖1所示。
式中:wij和bi是輸入層和隱含層的權(quán)重和閾值,g(x)是隱含層神經(jīng)元的激活函數(shù),文中選用sigmoid函數(shù)。βij是隱含層和輸出層間的權(quán)值,H表示隱含層的輸出矩陣。對(duì)輸入層向量首先進(jìn)行一個(gè)線性化的計(jì)算得到wijxi+bi,然后通過激活函數(shù)g(x)計(jì)算出隱含層的輸出矩陣H,H=g(wijxi+bj),再將H乘以隱含層和輸出層間的權(quán)值βij得到輸出向量T。極限學(xué)習(xí)機(jī)在計(jì)算過程中具有以下幾個(gè)優(yōu)點(diǎn):
圖1 極限學(xué)習(xí)機(jī)(ELM)結(jié)構(gòu)圖
(1)隱含層和輸入層間的權(quán)值wij和閾值bi是隨機(jī)產(chǎn)生的,并在計(jì)算過程中保持不變。
(2)隱含層和輸出層間的連接權(quán)值βij不是通過迭代計(jì)算的方式而是通過解方程組的方式一次計(jì)算完成的,因此模型的泛化能力較強(qiáng),求解速度很快。
其中,誤差函數(shù)可由下式得出
上式的解為β^=H+T′。T′是T的轉(zhuǎn)置矩陣,H+是隱含層輸出矩陣的Moore-Penrose廣義逆。
具體的ELM計(jì)算步驟如下:
第一步為隨機(jī)產(chǎn)生隱含層和輸入層的連接權(quán)值wij和閾值bi;
第二步為選一個(gè)無限可微的激活函數(shù)g(x),本文用的是sigmoid函數(shù);
第三步為計(jì)算隱含層的輸出矩陣H,H=g(wijxi+bj);
第四步為求解隱含層和輸出層的連接權(quán)值β^。
信號(hào)處理的過程中,相關(guān)性[14]是一個(gè)非常重要的概念。通過將分解后的固有模態(tài)函數(shù)與原信號(hào)做相關(guān)性分析,尋找出與原信號(hào)相關(guān)程度大的部分,從而將信號(hào)的虛假分量剔除,提高對(duì)處理后的時(shí)頻分析信號(hào)特征提取的準(zhǔn)確率。相關(guān)系數(shù)的具體計(jì)算方式如下:
首先計(jì)算原信號(hào)和各個(gè)IMF分量的自相關(guān)函數(shù),計(jì)算公式如下
將自相關(guān)函數(shù)進(jìn)行歸一化,求各個(gè)IMF分量的自相關(guān)函數(shù)RIMF1(m)、RIMF2(m)…RIMFn(m)與原信號(hào)的自相關(guān)函數(shù)Rx(m)的相關(guān)系數(shù),相關(guān)系數(shù)的定義為
式中:N為信號(hào)采樣點(diǎn)數(shù);j代表第j個(gè)IMF分量。
因子分析法的統(tǒng)計(jì)意義表明,方差貢獻(xiàn)率可以確定因子的相對(duì)重要性[15],高的因子方差貢獻(xiàn)率說明該因子與原信號(hào)間的相互影響越大。通過計(jì)算各個(gè)IMF分量和原信號(hào)的方差貢獻(xiàn)率,篩選出影響因子較大的分量。對(duì)于采樣時(shí)間t內(nèi)采集的聲信號(hào)(含有k個(gè)數(shù)據(jù)點(diǎn)),定義各個(gè)IMF分量fi與原始信號(hào)的方差貢獻(xiàn)率計(jì)算公式如下
相關(guān)系數(shù)和方差貢獻(xiàn)率都是表示兩組信號(hào)相關(guān)性的指標(biāo),一般來說當(dāng)指標(biāo)數(shù)值大于0.3時(shí)就認(rèn)為有較強(qiáng)的相關(guān)性,IMF分量真實(shí)有效,可以予以保留。通過計(jì)算相關(guān)系數(shù)和方差貢獻(xiàn)率,綜合考慮選取包含原始信號(hào)特征的IMF分量。
聲壓表示聲波通過某種介質(zhì)時(shí),由于振動(dòng)而產(chǎn)生壓強(qiáng)的改變量。定義聲壓p為聲波在媒介中存在于某點(diǎn)的壓強(qiáng)pf與介質(zhì)在平衡狀靜壓pref的差值
由于某點(diǎn)的實(shí)際聲壓p為瞬時(shí)聲壓,而有效聲壓的計(jì)算公式為[13]
上式中的T表示信號(hào)的周期。有效聲壓Pe單位為帕斯卡(Pa),儀器儀表測得的聲壓和我們通常所指的聲壓都是有效聲壓。聲壓級(jí)是通過儀表儀器來反映人耳對(duì)聲音強(qiáng)弱的主觀判斷,符號(hào)為SPL,其定義為
其中:Pe表示有效聲壓,Pref表示參考聲壓,聲壓級(jí)的單位是分貝(dB)。
本文提出了一種基于ICEEMDAN分解和聲壓級(jí)(SPL)相結(jié)合的信號(hào)處理方法。針對(duì)管道聲信號(hào)的特征處理識(shí)別方法流程如下:
(1)對(duì)多通道采集的聲脈沖響應(yīng)信號(hào)進(jìn)行ICEEMDAN分解,得到多組不同分解尺度的IMF分量;
(2)計(jì)算各IMF分量和原信號(hào)的相關(guān)系數(shù)xg和方差貢獻(xiàn)率mseb,篩選出含有管道特征信息的主要IMF分量;
(3)計(jì)算各IMF分量的聲壓級(jí)(S1,S2,S3…)并作為管道聲信號(hào)檢測的特征值;
(4)構(gòu)造特征向量T=[S1,S2,S3…] ;
(5)將一部分特征向量用于訓(xùn)練ELM分類器,然后將剩余的測試數(shù)據(jù)輸入到ELM以識(shí)別阻塞狀態(tài)。整個(gè)流程如圖2所示。
圖2 聲信號(hào)的特征提取與模式識(shí)別圖
實(shí)驗(yàn)裝置包括4個(gè)拾音器、揚(yáng)聲器、MARC8聲卡、功率放大器和Win MLS測試軟件。如圖3所示,4個(gè)拾音器集成在一個(gè)電路板上和揚(yáng)聲器連接在一起。拾音器的靈敏度為1 V/Pa、1 kHz。揚(yáng)聲器發(fā)出聲信號(hào)后被拾音器接收,轉(zhuǎn)換為電信號(hào)。
該實(shí)驗(yàn)裝置如圖4所示,聲卡控制揚(yáng)聲器輸出大小。MARC8聲卡能夠在50 Hz~18000 Hz的頻率范圍內(nèi)發(fā)射聲能,通過揚(yáng)聲器系統(tǒng)測試軟件WinMLS產(chǎn)生最大長度為14階的偽隨機(jī)序列,拾音器有4個(gè)通道接收返回信號(hào)。兩者通過采集卡和放大器與計(jì)算機(jī)相連。實(shí)驗(yàn)時(shí)通過一個(gè)螺栓將傳感器固定在管道內(nèi)。
圖3 管道聲信號(hào)傳感器裝置圖
圖4 管道聲信號(hào)實(shí)驗(yàn)裝置圖
實(shí)驗(yàn)采樣頻率為44100 Hz。管道的材質(zhì)為黏土,長度為15 m,障礙物設(shè)置在距離揚(yáng)聲器5 m的地方,如圖5所示。
圖5 實(shí)驗(yàn)管道工況設(shè)置示意圖
為模擬實(shí)際運(yùn)行中的管道狀態(tài),一共設(shè)置4種不同的工況。A、B管道模擬管內(nèi)有流體運(yùn)行情況,A管道在距離揚(yáng)聲器5 m的地方設(shè)置了障礙物模擬管道阻塞的情形,管道內(nèi)通水。將B管道和A管道作對(duì)比,通水但不設(shè)置障礙物。C、D管道模擬管道內(nèi)無流體空載時(shí)的情形,C管道在距離揚(yáng)聲器5 m的地方設(shè)置障礙物模擬管道阻塞,D管道只為空管。當(dāng)管道中存在流體和堵塞情況時(shí),拾音器接受到的返回信號(hào)會(huì)有變化,通過區(qū)分比較采集的返回信號(hào)可以分析和辨別管道的狀態(tài)。
實(shí)驗(yàn)中通過設(shè)置A、B、C、D 4類不同狀態(tài)的管道,采集相關(guān)的原始信號(hào)的時(shí)域波形如圖6所示。
圖64 類信號(hào)時(shí)域波形圖
A、C管道內(nèi)有障礙物模擬管道阻塞情況,A、B管中有水,C、D管中無水。從圖6可以看出,4類工況下的脈沖波形表征極為相似,僅從時(shí)域圖上很難做出區(qū)分。
基于以上情況,開展對(duì)所采集的實(shí)驗(yàn)聲信號(hào)特征提取就顯得十分必要,本文提取管道聲信號(hào)聲壓級(jí)(SPL)進(jìn)行分析。首先對(duì)多通道采集的聲信號(hào)進(jìn)行ICEEMDAN分解,分解得到11個(gè)IMF分量和一個(gè)殘差余量,圖7展示了A管道聲信號(hào)通過ICEEMDAN分解得到的IMF分量(前8階)。
若對(duì)IMF直接進(jìn)行分析,很難得出原信號(hào)相關(guān)的有效特征。通過綜合比較相關(guān)系數(shù)和方差貢獻(xiàn)率這兩個(gè)參數(shù)可以篩選出IMF中的有效分量。將各個(gè)IMF分量的相關(guān)系數(shù)和方差貢獻(xiàn)率繪制成圖8。
圖8反映了各種情況下IMF分量與原信號(hào)的相關(guān)系數(shù)和方差貢獻(xiàn)率的關(guān)系,保留數(shù)值大于0.3的IMF分量。相關(guān)系數(shù)分析保留分量IMF4~I(xiàn)MF7。方差貢獻(xiàn)率分量分析中保留分量IMF5~I(xiàn)MF7,綜合考慮選取IMF4~I(xiàn)MF7分量,其余的IMF分量予以剔除。表1展示了4種工況下IMF分量的聲壓級(jí)分布。
本文使用極限學(xué)習(xí)機(jī)ELM進(jìn)行故障分類的識(shí)別。實(shí)驗(yàn)所采樣的ABCD 4種工況下的聲脈沖信號(hào)每類分為12組數(shù)據(jù),共48組數(shù)據(jù)。在4類數(shù)據(jù)中每組分別隨機(jī)選取8組共32組數(shù)據(jù)作為訓(xùn)練樣本,其余16組作為測試樣本。先對(duì)隨機(jī)選取的訓(xùn)練樣本數(shù)據(jù)進(jìn)行ICEEMDAN分解,根據(jù)相干系數(shù)和方差貢獻(xiàn)率,篩選出分量IMF4~I(xiàn)MF7,計(jì)算各個(gè)分類的聲壓級(jí)SPL,圖9給出了48組數(shù)據(jù)的IMF分量的聲壓級(jí)特征值分布,將4個(gè)IMF分量特征值構(gòu)成特征向量T=[S1,S2,S3…] ,歸一化后將特征向量T輸入ELM進(jìn)行訓(xùn)練,對(duì)12組測試樣本同樣計(jì)算出特征向量進(jìn)行驗(yàn)證。
圖7 管道聲信號(hào)的ICEEMDAN分解
表14 類管道聲信號(hào)在IMF4~I(xiàn)MF7分量的聲壓級(jí)/dB
訓(xùn)練時(shí),A類管道的信號(hào)設(shè)置為1,B類管道的信號(hào)設(shè)置為2,C類管道的信號(hào)設(shè)置為3,D類管道的信號(hào)設(shè)置為4。圖10展示了根據(jù)單次隨機(jī)樣本抽取的測試集識(shí)別準(zhǔn)確率,識(shí)別率為100%。
為了進(jìn)一步分析ELM的性能,文中隨機(jī)采樣了10次樣本數(shù)據(jù),同時(shí)使用BP神經(jīng)網(wǎng)絡(luò)和SVM進(jìn)行對(duì)比試驗(yàn)。表2給出了10次預(yù)測的準(zhǔn)確率和計(jì)算時(shí)間。
如圖11所示,極限學(xué)習(xí)機(jī)ELM具有較高的預(yù)測準(zhǔn)確率,SVM次之,BP神經(jīng)網(wǎng)絡(luò)的預(yù)測準(zhǔn)確率最差。
圖12給出了3種方法的預(yù)測計(jì)算時(shí)間,在計(jì)算機(jī)性能相同時(shí),BP神經(jīng)網(wǎng)絡(luò)由于要反復(fù)迭代需要較長的計(jì)算時(shí)間。
SVM由于應(yīng)用核函數(shù),計(jì)算時(shí)間次之,而ELM由于連接權(quán)值w和隱含層閾值b在訓(xùn)練時(shí)是隨機(jī)選擇的,并且在訓(xùn)練過程中可以保持不變,這種方法可以大大減少參數(shù)的計(jì)算量,因此在3種方法中具有較快的計(jì)算速度,再一次證明了ELM在識(shí)別準(zhǔn)確率和計(jì)算時(shí)間上的優(yōu)越性能。
圖8 各階IMF相關(guān)系數(shù)和方差貢獻(xiàn)率變化趨勢(shì)
圖9 4類管道聲信號(hào)聲壓級(jí)分布
圖10 極限學(xué)習(xí)機(jī)ELM識(shí)別圖
表2 基于ELM、SVM、BP的分類結(jié)果
圖11 基于ELM、SVM、BP分類準(zhǔn)確率識(shí)別
圖12 基于ELM、SVM、BP分類計(jì)算時(shí)間
對(duì)不同狀態(tài)的管道聲脈沖信號(hào)進(jìn)行特征提取與模式識(shí)別,具體結(jié)論如下:
(1)基于ICEEMDAN分解的方法由于是基于信號(hào)的自適應(yīng)分解,適用于非平穩(wěn)和非線性的管道聲信號(hào)的處理。
(2)理論和實(shí)驗(yàn)分析證明,本文所提出的基于相干系數(shù)和方差貢獻(xiàn)率來判斷IMF分量和原信號(hào)相關(guān)性,并以聲壓級(jí)作為聲信號(hào)處理的特征值,從而提取出特征向量的方法切實(shí)可行。
(3)給出了一種ELM分類器來對(duì)管道阻塞狀態(tài)進(jìn)行模式識(shí)別的方法,并通過與BP神經(jīng)網(wǎng)絡(luò)和SVM對(duì)比分析,證明了ELM在識(shí)別準(zhǔn)確性和耗時(shí)方面的良好效果,突出了ELM在模式識(shí)別中的優(yōu)勢(shì)。