杜文遼,劉成良,李彥明
(1.上海交通大學(xué) 機(jī)械與動(dòng)力工程學(xué)院,上海 200240,2.鄭州輕工業(yè)學(xué)院 機(jī)電工程學(xué)院,鄭州 450002)
對(duì)含有噪聲的信號(hào)進(jìn)行濾波處理是信號(hào)處理領(lǐng)域的重要課題之一。由于小波在時(shí)頻域同時(shí)具有良好的局部化功能及多分辨率特性,而受到廣泛的應(yīng)用。小波閾值濾波中,閾值的選取直接影響濾波效果。目前,確定濾波閾值的方法主要有通用閾值法、極小化風(fēng)險(xiǎn)閾值法、多假設(shè)檢驗(yàn)法和 Bayes Shrink閾值法[1]。Abramovich 和 Benjamini[2]指出,小波閾值處理過程可以看作是一個(gè)多重假設(shè)檢驗(yàn)過程,通過檢驗(yàn)小波系數(shù)是否為0,僅保留一些較顯著的系數(shù),在允許一定誤判的情況下,引入 FDR[3]準(zhǔn)則,通過step-up過程來確定小波濾波閾值。
Benjamini和Liu[4]提出了基于多假設(shè)檢驗(yàn)FDR方法的step-down過程,并且指出在假設(shè)樣本較少并有大量非真假設(shè)存在的情況下,該過程較step-up過程具有更大的勢(power)。Troendle[5]進(jìn)一步證明了合適選擇臨界常數(shù)step-up和step-down過程能夠控制FDR在給定的水平。Tamhane[6]提出了多假設(shè)檢驗(yàn)中的step-updown過程,該方法在具有最少拒絕數(shù)目先驗(yàn)知識(shí)的情況下非常有效。Sarker[7]證明了 step-up和 step-down過程在控制FDR本質(zhì)上是一致的。
本文將step-up-down過程控制FDR的方法引入到確定小波濾波閾值的算法中,該方法不僅適于具有信號(hào)噪聲先驗(yàn)知識(shí)的情況,而且也適于沒有先驗(yàn)知識(shí)的情況,并能夠加快閾值的確定過程。通過靈活設(shè)置顯著性水平,可以得到滿意的濾波效果。
對(duì)于單個(gè)假設(shè)檢驗(yàn)問題,設(shè)Θ是參數(shù)空間,θ為參數(shù)。θ∈Θ0代表原假設(shè),記為H0。與H0不相容的假設(shè)稱為備擇假設(shè),記為H1,這時(shí)θ∈Θ1。這里Θ0∩Θ1=Ω,Θ0∪Θ1=Θ。通常的檢驗(yàn)策略是控制第Ⅰ類錯(cuò)誤,即棄真錯(cuò)誤,同時(shí)盡量減小犯第Ⅱ類錯(cuò)誤,即取偽錯(cuò)誤。
同時(shí)對(duì)多個(gè)假設(shè)進(jìn)行檢驗(yàn)時(shí),情況將變得更為復(fù)雜。表1給出了m個(gè)假設(shè)檢驗(yàn)的不同結(jié)果。這時(shí)候每個(gè)檢驗(yàn)都可能同時(shí)存在第Ⅰ類錯(cuò)誤和第Ⅱ類錯(cuò)誤,如何衡量總體檢驗(yàn)的錯(cuò)誤率是不確定的。傳統(tǒng)上采用family wise錯(cuò)誤率(FWER),但在很多情況下,F(xiàn)WER過于保守。Benjamini和Hochberg[3]引入了一個(gè)新的準(zhǔn)則——錯(cuò)誤發(fā)現(xiàn)率(FDR)來衡量總體檢驗(yàn)的錯(cuò)誤率,F(xiàn)DR指在多重假設(shè)檢驗(yàn)中,錯(cuò)誤的拒絕頻數(shù)與拒絕頻數(shù)比值的數(shù)學(xué)期望,可以表示為:q=FDR=,在相同控制水平下,F(xiàn)DR控制過程較FWER控制過程拒絕更多的原假設(shè),即FDR相對(duì)寬松,從而具有更大的勢。
表1 多假設(shè)檢驗(yàn)輸出結(jié)果Tab.1 Possible outcomes from m hypothesis tests
Benjamini和 Hochberg[3]提出的多假設(shè)檢驗(yàn) FDR準(zhǔn)則(記為 BH FDR),檢驗(yàn)方法采用的是 Simes[8]提出的算法,其檢驗(yàn)過程如下:參數(shù)空間Θ中各樣本點(diǎn)為獨(dú)立同分布,設(shè) p1,p2,…,pm為檢驗(yàn)統(tǒng)計(jì)量的 p值,其大小反映了顯著性水平的高低,對(duì)應(yīng)的原假設(shè)為H(1),H(2),…,H(m)。對(duì)p值進(jìn)行排序得到序列 p(1)≤p(2)≤…≤p(m),記p(t)對(duì)應(yīng)的原假設(shè)為H(i),從最大的p值p(m)開始,依次是 p(m-1),p(m-2),…,取臨界常量 c(i)=(i/m)q,令 k=max{i∶p(i)≤c(i)},然后拒絕所有的H(i),i=1,2,…,k。這就是控制 FDR 顯著性水平在 q的step-up過程。
Benjamini和 Liu[4]給出了一種 FDR step-down 控制過程:從最小的p值p(1)開始,依次是p(1),p(2),…,取臨界常量,令k=min{i∶p(i)> c(i)},然后拒絕所有的 H(i),i=1,2,…,k??梢宰C明,該過程也能控制FDR在水平q,并且在m較小并且有大量非真假設(shè)存在的情況下,該過程較step-up過程具有更大的勢。
FDR多假設(shè)檢驗(yàn)過程要求樣本是獨(dú)立(independent)分布的,一般時(shí)序信號(hào)并不符合FDR多假設(shè)檢驗(yàn)過程的條件。正交小波變換具有很強(qiáng)的去相關(guān)特性,經(jīng)過小波變換得到的小波系數(shù)可以認(rèn)為是相互獨(dú)立的,由于小波閾值濾波可以看作是一個(gè)多假設(shè)檢驗(yàn)過程,得出FDR step-up-down小波濾波算法如下:
對(duì) pj,k按從小到大排序,即 p(1)≤p(2)≤…≤p(m),每一個(gè) pi對(duì)應(yīng)的小波系數(shù)為,對(duì)應(yīng)的原假設(shè)0)記為 H(1),H(2),…,H(m)。選擇評(píng)價(jià)常數(shù) 0≤c(1)≤c(2)≤…≤c(m)≤1,暫取 c(i)=(i/m)q,并選取 r初始值。
(2)如果p(r)≤c(r),那么拒絕原假設(shè)H(1),H(2),…,H(r),轉(zhuǎn)(4)。
(3)如果 p(r)>c(r),接受原假設(shè),H(1),H(2),…,H(r),轉(zhuǎn)(5)。
(4)令H(i)表示最后拒絕的原假設(shè)(在(2)中,i=r),如果i=m,停止并且 k=i;否則,檢查 H(i+1),如果p(i+1)>c(i+1),那么接受 H(i+1),H(i+2),…,H(m)并停止并且k=i。如果p(i+1)≤c(i+1),那么拒絕H(i+1)。令i=i+1,返回(4)。這一步中 c(i)=1-[1-min(1,mq/(m
(5)令H(i)表示最后接受的原假設(shè)(在(3)中,i=r),如果 i=1,停止并且 k=i;否則,檢查 H(i-1),如果p(i-1)≤c(i-1),那么拒絕 H(i-1),H(i-2),…,H(1)并停止并且 k=i。如果 p(i-1)> c(i-1),那么接受 H(i-1)。令 i=i-1,返回(5)。
(6)計(jì)算閾值,閾值就是上面得到的p(k)對(duì)應(yīng)的小波系數(shù),并對(duì)小波系數(shù)進(jìn)行閾值化處理。
顯然,上面算法中,如果r=m,則是step-up過程;如果r=1,則是step-down過程。當(dāng)具有r的先驗(yàn)知識(shí)的時(shí)候,也就是如果知道大約有r0個(gè)0假設(shè)為真,則取r=r0。當(dāng)沒有這個(gè)先驗(yàn)知識(shí)的時(shí)候,可以由程序生成一個(gè)隨機(jī)數(shù) r∈[1,m] 。
在對(duì)小波系數(shù)進(jìn)行閾值化處理中,常用的閾值函數(shù)有硬閾值方法和軟閾值方法兩種,硬閾值函數(shù)是不連續(xù)函數(shù),會(huì)產(chǎn)生一些間斷點(diǎn),實(shí)踐證明軟閾值效果較好[9]。對(duì)任一小波系數(shù) θ^j,k,軟閾值函數(shù)為:
T為由FDR step-up-down方法得出的小波閾值。
為了驗(yàn)證本文方法的效果,以Matlab工具箱中的典型信號(hào)heavy sine為例進(jìn)行仿真實(shí)驗(yàn)。通過對(duì)原始信號(hào)疊加白噪聲形成待處理信號(hào),利用db5小波對(duì)信號(hào)進(jìn)行5層分解,實(shí)驗(yàn)中采用前述軟閾值方法。圖1為原始信號(hào)、含噪信號(hào)及顯著性水平取0.05時(shí)經(jīng)FDR step-up-down濾波后的對(duì)比圖。為對(duì)比不同顯著性水平的影響及不同降噪方法的效果,以信噪比和最小均方誤差為度量指標(biāo),表2列出了對(duì)seavy sine含噪信號(hào)分別采用BH FDR、FDR step-up-down、heursure、sqtwolog閾值濾波后的結(jié)果。其中,對(duì)BH FDR和FDR step-updown 的顯著性水平分別取 0.05、0.2。
信噪比及最小均方誤差采用如下公式計(jì)算[10]:
從圖1可以看出,對(duì)含噪信號(hào)利用本文提出的FDR step-up-down方法濾波后,信號(hào)質(zhì)量明顯得到改善。從表2根據(jù)SNR、MSE計(jì)算出的結(jié)果來看,改變FDR顯著性水平的大小對(duì)信號(hào)質(zhì)量的改善影響也非常顯著。在大部分情況下,本文所提出的方法較經(jīng)典的BH FDR方法表現(xiàn)更佳,其性能與heursure濾波效果相當(dāng),這三種閾值都明顯優(yōu)于sqtwolog方法。分析表2還可以看到,F(xiàn)DR step-up-down方法可以根據(jù)濾波結(jié)果靈活選擇顯著性水平的大小,進(jìn)而取得比較理想的濾波效果。由于對(duì)FDR step-up-down過程r初始值的選取是采用取隨機(jī)數(shù)的方法,每執(zhí)行一次濾波過程得到的SNR、MSE會(huì)有所變化,但總體上其勢要大于FDR過程,并且在小波系數(shù)較多的情況下,可以明顯提高算法的速度。如果已知信號(hào)中噪聲點(diǎn)的先驗(yàn)知識(shí),可以根據(jù)該先驗(yàn)知識(shí)確定r的初始值,從而獲得較大的勢。
表2 heavy sine信號(hào)小波去噪前后不同閾值準(zhǔn)則對(duì)比(SNR/MSE)SNR單位:dBTab.2 The compare of wavelet de-noising of heavy sine signal with different methods(SNR/MSE)
圖1 不同信噪比heavy sine信號(hào)q=0.05時(shí)濾波效果Fig.1 The de - noising result of heavy sine signal with different SNR at q=0.05
下面用一組來自美國Case Western Reserve University電氣工程實(shí)驗(yàn)室的滾動(dòng)軸承實(shí)驗(yàn)數(shù)據(jù)來進(jìn)行實(shí)例驗(yàn)證,軸承型號(hào)SKF6205,采樣頻率為12 kHz。圖2上部分為軸承內(nèi)圈損傷的振動(dòng)加速度原始信號(hào),下部分為利用本文所提方法進(jìn)行小波分解重構(gòu)后的信號(hào),其中,選擇db5小波,顯著性水平取0.05。從圖中可以看出經(jīng)過濾波后信號(hào)質(zhì)量有了明顯改善。
圖2 滾動(dòng)軸承內(nèi)圈故障原始數(shù)據(jù)及濾波結(jié)果Fig.2 Original signal and De-noised signal of ball bearing inner race fault
圖3 不同顯著性水平下得到的信噪比Fig.3 The SNR for different significant levels
為了考察采用不同顯著性水平時(shí),F(xiàn)DR step-updown方法對(duì)濾波效果的影響,采用前述heavy sine信號(hào),疊加白噪聲信號(hào),形成SNR為21.7371的待處理信號(hào)。取顯著性水平變化范圍為0.05到0.4,步長0.01。利用db5小波對(duì)信號(hào)進(jìn)行5層分解,采用前述軟閾值方法進(jìn)行濾波。經(jīng)FDR step-up-down方法濾波后計(jì)算出對(duì)應(yīng)的SNR如圖3所示。從圖中可以看出,F(xiàn)DR step-up-down濾波效果與顯著性水平大小的選取關(guān)系很大,并且表現(xiàn)出并非簡單的線性關(guān)系。分析其中存在的原因,主要是FDR step-up-down方法初始啟動(dòng)值的影響,另外,顯著性水平反映了錯(cuò)誤拒絕原假設(shè)的情況,但是并沒有考慮到錯(cuò)誤接受備擇假設(shè)。因此,如果只選擇顯著性水平作為小波濾波閾值選擇的依據(jù),就必須根據(jù)經(jīng)驗(yàn)選擇合適的顯著性水平,或者考慮錯(cuò)誤接受備擇假設(shè)的情況進(jìn)行折中。
本文針對(duì)小波濾波算法中閾值選取問題,構(gòu)造了FDR step-up-down過程確定小波濾波閾值的新算法。在具有噪聲信息先驗(yàn)知識(shí)的前提下,可以更有效、快捷的求得閾值,但是在通常情況下,關(guān)于噪聲的先驗(yàn)知識(shí)比較難以獲得,這時(shí),用隨機(jī)數(shù)方法產(chǎn)生一個(gè)初始的啟動(dòng)值r,也同樣可以體現(xiàn)出算法的優(yōu)越性。在算法實(shí)現(xiàn)過程中,可以根據(jù)濾波效果,靈活選擇顯著性水平的大小,這是該算法的另一個(gè)優(yōu)勢。仿真實(shí)驗(yàn)表明,顯著性水平大小的選擇對(duì)濾波效果有明顯的影響,如何更進(jìn)一步將錯(cuò)誤接受擇備假設(shè)的情況考慮進(jìn)來,是下一步改進(jìn)的方向。
[1] 潘 泉,張 磊,孟晉麗,等.小波濾波方法及應(yīng)用[M] .北京:清華大學(xué)出版社,2005.
[2] Abramovich F,Benjamini Y. Thresholding of wavelet coefficients as multiple hypotheses testing procedure[J] .Lecture Notes in Statistics,1995,103:5 -14.
[3] Benjamini Y,Hochberg Y.Controlling the false discovery rate:a practical and powerful approach to multiple testing[J] .Journal of the Royal Statistical Society.Series B(Methodological),1995,57(1):289 -300.
[4] Benjamini Y,Liu W.A step-down multiple hypotheses testing procedure that controls the false discovery rate under independence[J] . Journal of Statistical Planning and Inference,1999,82(1 -2):163 -170.
[5] Troendle JF.Stepwise normal theory multiple test procedures controlling the false discovery rate[J] .Journal of Statistical Planning and Inference,2000,84(1 -2):139 -158.
[6] Tamhane A C,Liu W,et al.A generalized step-up-down multiple test procedure[J] .Canadian Journal of Statistics,1998,26(2):353 -363.
[7] Sarkar SK.Some results on false discovery rate in stepwise multiple testing procedures[J] .Annals of Statistics,2002,30(1):239-257.
[8] Simes R.An improved bonferroni procedure for multiple tests of significance[J] .Biometrika,1986,73(3):751 -754.
[9] Donoho D.De-noising by soft-thresholding[J] . IEEE transactions on information theory,1995,41(3):613 -627.
[10] 劉衛(wèi)東,劉尚合,胡小鋒,等.小波閾值去噪函數(shù)的改進(jìn)方法分析[J] .高電壓技術(shù),2007,33(10):59 -63.