李真真 吳效明
(華南理工大學(xué) 生物科學(xué)與工程學(xué)院,廣州510006)
羅音是一種重要的間斷性異常呼吸音,時域上的波形呈現(xiàn)“突變起始、振蕩短暫持續(xù)”的特點[1]。一般認(rèn)為羅音是由于氣管的突然打開或者突然閉合造成的,因此它出現(xiàn)的數(shù)目與位置(呼吸相)等指標(biāo)與阻塞性肺部疾病都密切關(guān)聯(lián)[2]。實現(xiàn)羅音檢測,有助于臨床呼吸系統(tǒng)疾病的診斷。
傳統(tǒng)的羅音由醫(yī)生在聽診中辨析,主觀性強,可靠性低,而計算機自動化檢測技術(shù)是羅音分析的研究方向。早期最為開拓性的工作是1978 年由Murphy 等人提出的時間擴展波形分析法。羅音首先由聲信號轉(zhuǎn)換為電壓幅度波形信號,將其波形在顯示器上展寬,建議分辨率為3 000 mm/s,再進行人工的判別[3]?;谟嬎銠C信號處理技術(shù)的自動化羅音判別檢測成為重要的研究課題:經(jīng)典的檢測方法有短時譜分析、AR,ARMA 參數(shù)估計法[4-5],近期的檢測方法包括基于小波變換、基于經(jīng)驗?zāi)B(tài)分解等方法[6-9]。其中,參數(shù)估計法與小波分析法都是基于羅音信號非平穩(wěn)性的本質(zhì)特征,采用先驗閾值法分離肺音信號中的平穩(wěn)與非平穩(wěn)分量。平穩(wěn)分量被認(rèn)作為正常肺音信號,而非平穩(wěn)分量被認(rèn)作為羅音。該類方法的優(yōu)點是取得了較為理想的羅音檢測效果,但仍存在一些本質(zhì)缺陷,如閾值設(shè)置的主觀性、非平穩(wěn)的非羅音信號的偽識別等。
本研究基于分?jǐn)?shù)階Hilbert 變換的二維紋理特征,提出一種羅音檢測的新方法。傳統(tǒng)Hilbert 變換的物理意義是對信號進行π/2 的相移,而定義在分?jǐn)?shù)階Fourier 變換基礎(chǔ)上的分?jǐn)?shù)階Hilbert 變換實現(xiàn)了對信號的逐步相移,即對信號進行(π/2)/N 的相移[10]。該變換對隨機信號與正弦信號的相移變換結(jié)果差異很大,隨機信號在不同階數(shù)下的分?jǐn)?shù)階Hilbert 變換作用后形態(tài)變換很大,而正弦信號在遞增(遞減)的不同階數(shù)下的分?jǐn)?shù)階Hilbert 變換的結(jié)果是形態(tài)不變的逐步相移[11]。另外,正常肺音可近似看作是平穩(wěn)隨機信號,而羅音屬于類正弦信號,因此可嘗試用分?jǐn)?shù)階Hilbert 變換實現(xiàn)對肺音中羅音信號的檢測。筆者在單純性分?jǐn)?shù)階Hilbert 變換的基礎(chǔ)上[11],取不同分?jǐn)?shù)階下的分?jǐn)?shù)階Hilbert 變換,依據(jù)肺音信號生成相對應(yīng)的二維紋理圖像,明暗相間條紋狀的紋理特征與羅音相對應(yīng),可據(jù)此進行判別來檢測羅音。分別采用仿真羅音與實際羅音進行實驗驗證,結(jié)果表明本方法是有效的、可行的。
分?jǐn)?shù)階Hilbert 變換來源于傳統(tǒng)的Hilbert 變換,并結(jié)合了分?jǐn)?shù)階 Fourier 變換的思想。分?jǐn)?shù)階Hilbert 變換有若干種定 義方式[10,12],最早、最通用的定義由A. W. Lohman 于1996 年提出,其定義式[10]為

式中,F(xiàn)Q表示Q 階分?jǐn)?shù)階的傅里葉變換,F(xiàn)-Q表示其逆變換,HP(ω)為連續(xù)分?jǐn)?shù)階Hilbert 變換定義中P 階的傳輸函數(shù)[10,13],而P 表示分?jǐn)?shù)階Hilbert 變換的階數(shù)。數(shù)字信號處理中采用離散化分?jǐn)?shù)階Hilbert 變換,其實現(xiàn)方式較為簡便[13-14]。設(shè)信號x(n),1 ≤n ≤N,離散化分?jǐn)?shù)階Hilbert 變換記為,有

式中,上劃線“-”表示算子的離散形式,如F-Q表示Q 階離散化分?jǐn)?shù)階Fourier 變換。當(dāng)N 為偶數(shù)時,定義Ae為大小為(N/2 - 1)× 1 的向量,Ae= [1,1,…,1],有

當(dāng)N 為奇數(shù)時,定義Ao為大小為(N - 1)/2 × 1 的向量,Ao= [1,1,…,1],有

式中,φ = Pπ/2 。
1.2.1 紋理圖像生成
已知給定階數(shù)Q = Q0,分?jǐn)?shù)階Hilbert 變換對參數(shù)P 的周期為4,即

任取實軸上某個起始點To,取長度為4 的區(qū)間,對取不同階數(shù)的P 值,記為pm∈[To,To+ 4],其中m = 1,2,…,M。在該分?jǐn)?shù)階下做分?jǐn)?shù)階Hilbert 變換,可得向量ΠN×1,即

取遍M 個值,可構(gòu)造矩陣ΠN×M,即

由此生成關(guān)于信號x(n)(n = 1,2,…,N )對應(yīng)的分?jǐn)?shù)階Hilbert 變換的紋理圖像。其中,m 對應(yīng)pm階分?jǐn)?shù)階Hilbert 變換的m,而n 對應(yīng)于信號x(n)的第n 個值。
在時域上,羅音信號呈現(xiàn)特定形態(tài),可建模[8]如下:

式中,a1= 0.5,a2= 1.49,a3= 0.78,fo= 2.0。
以g(t)為例,可生成相應(yīng)的紋理圖像,即

仿真的羅音信號及其對應(yīng)的紋理圖像如圖1 所示。其中,圖1(a)為仿真羅音信號g(t)在時域的波形,其表達(dá)式如式(8)所示,圖1(b)為對信號g(t)做分?jǐn)?shù)階希爾伯特變換生成的紋理圖像ΠN×M。

圖1 仿真的羅音信號及其對應(yīng)的紋理圖像。(a)仿真羅音波形;(b)相應(yīng)的紋理圖像Fig.1 A simulated crackle and its relevant texture image. (a)Waveform of simulated crackles;(b)Relevant texture image
1.2.2 紋理特征分析
由波形上辨析羅音,最為經(jīng)典的準(zhǔn)則是由Murphy 等人提出的[1]:
1)最大振蕩的時寬及其相鄰過零點展寬寬度處于一定的統(tǒng)計范圍內(nèi);
2)振蕩必須過零點,即在基線上(下)無兩次及以上次數(shù)的方向改變;
3)振蕩的整體過程包括了3 ~16 個過零點。
該準(zhǔn)則并非羅音形態(tài)上的定義,但可有效地將羅音波形與背景肺音波形區(qū)分開。然而,該準(zhǔn)則不適用于羅音的自動識別,需要人為判定。因此,本研究將該準(zhǔn)則轉(zhuǎn)化為與羅音相對應(yīng)的紋理圖像的紋理特征,以實現(xiàn)羅音的自動識別,即
1)紋理是明暗相間的條紋;
2)明暗條紋的寬度具有一定的統(tǒng)計范圍;
3)具有若干組滿足上述條件的條紋組合。
據(jù)此紋理特征準(zhǔn)則,在計算機Matlab 平臺上實現(xiàn)了自動化羅音檢測。
采用實際的肺音信號,采樣頻率為11 025 Hz,采樣精度為16 位。分?jǐn)?shù)階Hilbert 變換實現(xiàn)方法如文獻(xiàn)[13 -14]所述,由于分?jǐn)?shù)階Hilbert 的變換效率與做變換的信號長度相關(guān),將肺音信號截取為信號段,每段長度為500,重疊率為50%。
分?jǐn)?shù)階Hilbert 變換的階數(shù)從- 2 ~2,等增量為0.05,由此生成的紋理圖像大小為500 像素×81像素。進一步對生成的紋理圖像做三值量化,轉(zhuǎn)化為黑、灰、白三色紋理圖像,由計算機依據(jù)紋理特征準(zhǔn)則進行判定。當(dāng)以上3 條準(zhǔn)則都滿足時,提示羅音存在,并標(biāo)記其時間軸位置。
具體的實驗分兩組進行。一組為仿真羅音檢測,即在實際肺音中插入羅音來進行檢測實驗。仿真羅音采用式(8)中g(shù)(t)的形態(tài),并分為1,0.8,0.6 三個尺度大小,插入實際正常肺音信號中,這組共測試250 條肺音信號段。另一組采用包含實際羅音的肺音信號來做檢測,這些羅音取自美國胸科學(xué)會教學(xué)數(shù)據(jù)庫,共測試了4 組樣本共200 條信號段。
檢測正確率分別采用通用的敏感性指標(biāo)SEN與陽性預(yù)測指標(biāo)PPV 來考查。正確檢測出的羅音數(shù)目記為TP,漏檢的羅音數(shù)目為FN,誤檢的羅音數(shù)目為FP,敏感性指標(biāo)SEN 的計算方法為SEN =TP/(TP +FN),陽性預(yù)測指標(biāo)PPV 的計算方法為PPV=TP/(TP +FP)。
仿真羅音組檢測結(jié)果如表1 所示,可見200 個插入羅音全部正確檢出,且無假性誤檢,敏感性指標(biāo)與陽性預(yù)測值都達(dá)到100%。圖2 給出了兩個仿真羅音檢測的實例。其中,(a)為肺音信號中插入尺度因子為0.6 的羅音的信號段,(b)為(a)所對應(yīng)的量化后的紋理圖像,(c)為檢測結(jié)果,用豎線在時間軸上標(biāo)記其出現(xiàn)的位置??梢?,當(dāng)插入羅音尺寸因子為0.6 時,該羅音振幅與背景肺音信號振幅相當(dāng),但仍可將羅音信號檢出。
實際羅音組的檢測結(jié)果如表2 所示,可見檢測識別率的敏感性指標(biāo)為97.72%,而陽性預(yù)測值為94.85%,圖3 給出了一個實際羅音檢測的實例。其中,(a)為實際肺音信號,包含了一個粗羅音一個細(xì)羅音兩個羅音;(b)為(a)所對應(yīng)的量化后的紋理圖像;在(c)中分別檢測到兩個羅音,用豎線在時間軸上標(biāo)記其出現(xiàn)的位置。

表1 仿真羅音檢測結(jié)果Tab.1 Detection result of simulated crackles

圖2 尺度因子為0.6 的仿真羅音檢測結(jié)果。(a)插入尺度因子為0.6 的仿真羅音的肺音信號;(b)相關(guān)紋理圖像;(c)檢測結(jié)果Fig.2 An example of detection results for simulated crackles with factor 0.6.(a)Lung sound signal inserted by a simulated crackle of factor 0.6;(b)Relevant texture images;(c)detection results

表2 實際羅音檢測結(jié)果Tab. 2 Detection result of real crackles
可見,所提出的檢測方法具有較高的檢測效率,但仍存在一些誤判漏判的情形(見圖4),其出錯的根源也在于實際信號變異性大。本算法以羅音的形態(tài)特征為出發(fā)點,當(dāng)非羅音信號在形態(tài)上類似羅音時將被誤判為羅音。若真實羅音信號形態(tài)扭曲或持續(xù)時間過短,其形態(tài)不滿足判定標(biāo)準(zhǔn),即造成漏判。與現(xiàn)有其他算法的檢測效果進行對比,如表3 所示??梢?,本算法在檢測效果上優(yōu)于現(xiàn)有算法。

圖3 實際羅音檢測結(jié)果。(a)含兩個羅音的肺音信號;(b)相關(guān)紋理;(c)檢測結(jié)果Fig. 3 An example of detection results for real crackles. (a)Lung sound signal with two crackles;(b)Relevant texture images;(c)Detection results

圖4 實際羅音誤判漏判。(a)未含羅音的肺音信號;(b)由(a)生成的紋理圖像;(c)標(biāo)記處誤檢出一個羅音;(d)含羅音的肺音信號;(e)由(d)生成的紋理圖像;(f)標(biāo)記處漏檢一個羅音Fig.4 False positive and true negative judgment examples for real crackles. (a)Lung sound without any crackle;(b)relevant texture image generated from (a);(c)A false crackle detection where labeled;(d)Lung sound with a crackle;(e)relevant texture image generated from (d);(f)A missed crackle detection where labeled

表3 不同方法羅音檢測算法對比Tab. 3 Comparison of methods of crackle detection
本研究實現(xiàn)羅音檢測的思路不同于現(xiàn)有平穩(wěn)-非平穩(wěn)信號分離的方式,從羅音信號類正弦的時域特征出發(fā),將難以提取的一維信號特征通過多階分?jǐn)?shù)階Hilbert 變換,轉(zhuǎn)換為易于提取的二維紋理圖像特征,并得到了較好的檢測效果,如表3 所示。前4個方 法(譜 分 析[4]、參 數(shù) 估 計 法[5]、小 波[7]及EMD[9])是摘錄自各文獻(xiàn)所述的測試結(jié)果,與本算法的數(shù)據(jù)源不同;第5 個方法(文獻(xiàn)[11])與本研究所采用的是同一批數(shù)據(jù),都使用了美國胸科學(xué)會教學(xué)數(shù)據(jù)庫。由于羅音檢測的相關(guān)研究尚不完善成熟,還未建立起統(tǒng)一、共用的數(shù)據(jù)庫,因此在不同測試數(shù)據(jù)庫的基礎(chǔ)上進行結(jié)果對比雖不理想,但仍有一定的參考意義。
前3 種算法多采用平穩(wěn)-非平穩(wěn)信號分離的研究思路,但由于實際信號非平穩(wěn)分量的成分復(fù)雜,導(dǎo)致了非羅音非平穩(wěn)分量的誤判率較高,若為降低非平穩(wěn)分量的誤判,提高非平穩(wěn)分量的閾值又將導(dǎo)致漏判增多。而從羅音信號形態(tài)特征角度出發(fā),類似羅音形態(tài)的肺音信號出現(xiàn)概率較小,因此本算法在檢測效果上優(yōu)于前3 種算法。EMD 算法仍需要人眼觀察及主觀判決來實現(xiàn)信號檢測。
本算法與文獻(xiàn)[11]都采用了分?jǐn)?shù)階Hilbert 變換。本算法與文獻(xiàn)[11]對比,雖然在檢測率上沒有顯著提高,但優(yōu)勢有兩點:一是不需要借助仿真羅音模型做模式匹配,避免了單一匹配閾值設(shè)置的主觀性,使算法對不同呼吸系統(tǒng)疾病所對應(yīng)的不同形態(tài)的羅音具有更高的魯棒性;二是克服了文獻(xiàn)[11]中對連續(xù)重疊羅音難以判別的缺點,由于重疊羅音蘊含特定的診斷信息,對此類情形的漏判一定程度影響了診斷信息提取。
本研究提出了一種羅音檢測的新方法,先通過分?jǐn)?shù)階Hilbert 變換作用于肺音,信號,生成與該肺音信號對應(yīng)的紋理圖像,再依據(jù)紋理特征實現(xiàn)羅音自動化檢測。實驗結(jié)果證明,該方法是有效可行的,而且所提出的利用分?jǐn)?shù)階Hilbert 變換生成紋理圖像對信號進行特征提取分析的思想在其他領(lǐng)域也有一定的應(yīng)用潛質(zhì)。
[1] Gavriely N,Breath sounds methodogy[M]. // Breath sounds in the time domain:crackles. Florida:CRC Press,1995:18 -29.
[2] Reichert S,Gass R,Brandt C,et al. Analysis of respiratory sounds:state of the art [J]. Clinical Medicine:Circulatory,Respiratory and Pulmonary Medicine,2008,2(5):45 -58.
[3] Murphy RLH,Holford SK,Knowler WC. Visual lung-sound characterization by time-expanded wave-form analysis [J].New Eng J Med,1977,296(17):968 -971.
[4] Kaisla T,Sovijarvi A,Piirila P,et al. Validated method for automatic detection of lung sound crackles [J]. Medical Biological Engineering & Computing,1991,29(5):517 -521.
[5] Dorantes G,Charleston S,Gonzalez R,et al. Crackles detection using a time-variant autoregressive model [C]. // Dumont G,Galiana H,eds. 2008 30th Annual International Conference of the IEEE Engineering in Medicine and Biology Society.Vancouver:IEEE,2008:1894 -1897.
[6] Yeginer M,Kahya YP. Feature extraction for pulmonary crackle representation via wavelet networks[J]. Computers in Biology and Medicine,2009,39(8):713 -721.
[7] Lu Xiaoguang,Bahoura M. An integrated automated system for crackles extraction and classification [J]. Biomedical Signal Processing and Control,2008,3(3):244 -254.
[8] Du Minghui,Chan FHY,Lam FK,et al. Crackle detection and classification based on matched wavelet analysis[C]. // Jaeger R,eds. 1997 19th Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Chicago:IEEE,1997:1638 -1641.
[9] Sonia C,Ramon G,Tomas A. Crackle sounds analysis by empirical mode decomposition [J]. IEEE Engineering in Medicine and Biology Magazine,2007,26(1):40 -47.
[10] Lohmann AW ,Soffer EH. Fractional Hilbert Transform [J].Opt Lett,1996,21:281 -283.
[11] 李真真,杜明輝,吳效明. 基于分?jǐn)?shù)階希爾伯特變換的羅音特征提取[J]. 華南理工大學(xué)學(xué)報(自然科學(xué)版),2011,39(12):38 -42.
[12] Ran Tao,Li Xuemei,Wang Yue. Generalization of the fractional Hilbert transform [J]. IEEE Signal Processing Letters,2008,15:365 -368.
[13] Pei Soochang, Yeh Minhung. Discrete Fractional Hilbert Transform [J]. IEEE Transaction on Circuits and Systems,Analog and Digital Signal Processing,2000,47 (11):1307 -1311.
[14] Pei Soochang,Hsue Wenliang,Ding Jianjiun. Discrete fractional fourier transform based on new nearly tridiagonal commuting matrices[J]. IEEE Transaction on Signal Processing,2006,54(10):3815 -3828.