許春冬,林 海
(江西理工大學(xué)信息工程學(xué)院,贛州341000)
人們生活水平不斷提高的同時(shí),不健康的飲食習(xí)慣和不良生活作息也引發(fā)了各類疾病。其中,我國(guó)心腦血管的病亡率更是居高不下。人體最重要的生理信號(hào)之一是心音信號(hào),它能反映心臟及其周邊血管的生理狀態(tài),有效的心音信息可及時(shí)準(zhǔn)確地反映心臟瓣膜的活動(dòng)情況以及血液流動(dòng)情況等生理指標(biāo)。此外,年齡和性別差異對(duì)心音的健康情況也有影響[1]??傊治鲂囊舻挠行卣髂鼙M早發(fā)現(xiàn)和預(yù)防心臟的相關(guān)疾?。?-3],對(duì)臨床醫(yī)生的診斷也會(huì)起到一定的輔助作用[4]。心音信號(hào)每隔相同時(shí)間重復(fù)出現(xiàn),該時(shí)間間隔稱為一個(gè)心動(dòng)周期。每個(gè)心動(dòng)周期內(nèi)含有第一心音(S1)、收縮期、第二心音(S2)、舒張期4個(gè)心音成分,心臟瓣膜周期性開(kāi)啟與閉合,心房、心室壁的收縮與舒張,血管擴(kuò)張或狹窄等引發(fā)的壓力均是心音產(chǎn)生的原因,心音的精確分割是心音自動(dòng)分析的基礎(chǔ),因此心音分割有著重要的研究意義[5]。
在過(guò)去的幾十年中,在心音分割領(lǐng)域出現(xiàn)了許多有效的分割方法。有參考心電信號(hào)或頸動(dòng)脈信號(hào)與時(shí)頻特性結(jié)合的算法實(shí)現(xiàn)心音的分割,有基于信號(hào)能量特征的分割算法,還有基于心音周期狀態(tài)時(shí)序特征的方法。不論采取什么算法,特征提取都是分割的重要基礎(chǔ)之一。廣大學(xué)者在心音特征包絡(luò)提取領(lǐng)域進(jìn)行了大量研究[6],形成諸多成熟的特征提取方法。其中有基于歸一化香農(nóng)能量的包絡(luò)提取方法,基于希爾伯特黃變換的包絡(luò)提取方法和數(shù)學(xué)形態(tài)的包絡(luò)提取方法等[7]。Gupta等[8]通過(guò)提取心音包絡(luò)的方法,檢測(cè)包絡(luò)特征,去除冗余的峰值,計(jì)算出峰值的起點(diǎn)與終點(diǎn)、峰值寬度以及收縮期和舒張期的長(zhǎng)度。該研究將兩個(gè)不同的時(shí)間段當(dāng)成兩個(gè)不同的類別,通過(guò)聚類算法進(jìn)行歸類,任意兩個(gè)連續(xù)的類別即可構(gòu)成一個(gè)心動(dòng)周期,該算法對(duì)純凈的心音能取得較佳的效果,但在檢測(cè)包絡(luò)峰值時(shí)候,規(guī)定了許多硬閾值,不利于方法的推廣,普適性較弱,無(wú)法進(jìn)行實(shí)時(shí)計(jì)算。Tseng等[9]用希爾伯特黃變換提取心音包絡(luò),該算法突出S1、S2的幅度,但提取的包絡(luò)具有毛刺,會(huì)影響后期心音的處理。Varghees等[10]借助香農(nóng)能量提取信號(hào)特征包絡(luò),突出中等強(qiáng)度的信號(hào),對(duì)心雜音有一定的抑制作用,但算法過(guò)于單一,算法效率不高。郭興明等[7]提出基于小波變換的心音信號(hào)多尺度特征包絡(luò)提取,并結(jié)合相關(guān)算法實(shí)現(xiàn)信號(hào)的分割。但當(dāng)無(wú)統(tǒng)計(jì)特點(diǎn)的病理特征出現(xiàn)時(shí),算法效果欠佳。
基于上述研究現(xiàn)狀,Chen等[6]引用了一種新的分割算法:改進(jìn)連續(xù)時(shí)段隱半馬爾可夫模型(Dependent hidden Markov model,DHMM)算法,提出基于邏輯回歸的隱半馬爾可夫算法(Logistic regression based hidden semi-Markov model,LR-HSMM),是目前該領(lǐng)域最優(yōu)秀的分割算法之一。該算法采取邏輯回歸模型計(jì)算樣本輸出概率,通過(guò)拓展的Viterbi譯碼算法改進(jìn)DHMM,不論心音的起始點(diǎn)與狀態(tài)的起始點(diǎn)是否一致,均不會(huì)受影響,更具有自適應(yīng)性,時(shí)段約束使測(cè)試心音分割出的各狀態(tài)時(shí)長(zhǎng)符合正常的生理規(guī)律。但是,該研究中使用希爾伯特變換提取包絡(luò)特征,所提取的包絡(luò)欠光滑,存在較多毛刺,影響了分割的精度。
針對(duì)以上問(wèn)題,尤其是希爾伯特變換提取包絡(luò)存在毛刺較多的問(wèn)題,提出一種結(jié)合支持向量機(jī)(Support vector machine,SVM)和香農(nóng)能量的HSMM心音分割算法。該算法較好地解決了毛刺問(wèn)題,使提取的包絡(luò)更加平滑,有效提高了分割精度。
本文工作主要圍繞心音分割展開(kāi),開(kāi)展分割研究時(shí)主要基于以下3個(gè)問(wèn)題:(1)心音噪聲的去除。文獻(xiàn)[11]提出通過(guò)結(jié)合EMD與小波分解的方法實(shí)現(xiàn)降噪,但運(yùn)行用時(shí)偏長(zhǎng),不利于實(shí)時(shí)分析。文獻(xiàn)[12]提出先對(duì)心音降采樣操作,再用離散小波閾值降噪,但該方法只可濾除部分高頻噪聲,低頻噪聲也無(wú)法完整濾除。(2)提取包絡(luò)方法的選擇。文獻(xiàn)[13-14]提出基于希爾伯特黃變換的包絡(luò)提取方法,該方法雖適用于隨機(jī)非平穩(wěn)信號(hào)分析,不過(guò)所得包絡(luò)存在過(guò)多毛刺,實(shí)驗(yàn)結(jié)果不盡如人意。文獻(xiàn)[7]對(duì)提取S1的特征具有良好的效果,不過(guò)對(duì)于S2以及心雜音效果不佳。(3)模型的選取方面。文獻(xiàn)[15]提出的HMM方法對(duì)大量訓(xùn)練數(shù)據(jù)進(jìn)行非監(jiān)督學(xué)習(xí),容易造成提取的細(xì)節(jié)特征不全面,分割精度不高。
為了解決原始心音噪聲問(wèn)題,前期采用離散小波閾值對(duì)信號(hào)降噪,既保留了有效心音成分,又能將冗余噪聲濾除。其次針對(duì)包絡(luò)提取方法的選擇問(wèn)題,本文提出采用香農(nóng)能量提取心音包絡(luò),所得的包絡(luò)更加清晰、光滑,抑制了較多的毛刺出現(xiàn),有利于基礎(chǔ)心音的生理特征提取。最后針對(duì)訓(xùn)練模型選取的問(wèn)題,本文提出LR-HSMM模型,完成對(duì)持續(xù)時(shí)間段內(nèi)心音的分割,提取到的特征與原始信號(hào)匹配度更高。
本文提出的一種結(jié)合SVM和香農(nóng)能量的LR-HSMM心音分割算法,先用離散小波變換對(duì)心音降噪,接著提取心音的香農(nóng)能量包絡(luò),并以ECG為參考標(biāo)準(zhǔn)計(jì)算出R波和T峰,利用R波和T峰標(biāo)注心音PCG的S1和S2信號(hào)。然后訓(xùn)練LR-HSMM的相關(guān)參數(shù)并借助擴(kuò)展的Viterbi算法推測(cè)出心音的最優(yōu)狀態(tài)序列,最后由SVM模型實(shí)現(xiàn)對(duì)心音中S1、S2的識(shí)別。
原始采集到的心音信號(hào)容易受到噪聲的干擾,如環(huán)境噪聲、聽(tīng)診器與患者衣物摩擦產(chǎn)生的噪聲、患者的肺音、基線漂移、肌電以及工頻噪聲等。以上噪聲多是隨機(jī)非平穩(wěn)的信號(hào),往往混雜在心音中或直接將心音的主頻率成分湮沒(méi)。因此,心音信號(hào)研究首先需要對(duì)獲取的原始心音信號(hào)進(jìn)行降噪,得到盡可能純凈的信號(hào)包絡(luò)。國(guó)內(nèi)外專家、學(xué)者在降噪領(lǐng)域開(kāi)展了大量研究并取得一定的進(jìn)展[16-17]。其中,小波降噪是最為理想的降噪方法之一。運(yùn)用離散小波變換(Discrete wavelet transform,DWT)抑制噪聲系數(shù)分量,突出信號(hào)系數(shù)分量,達(dá)到降噪的效果。在DWT處理過(guò)程中,3個(gè)因素至關(guān)重要:分解層次的確定、閾值函數(shù)的選擇以及閾值的確定。該算法選用coif5作為小波基函數(shù),對(duì)需要處理的心音進(jìn)行5層分解,閾值函數(shù)選擇雙閾值函數(shù)。為了提高算法的抗噪性能,實(shí)驗(yàn)選取基于統(tǒng)計(jì)特性的自適應(yīng)閾值系數(shù)處理方法。信號(hào)依照升序規(guī)則進(jìn)行排列,系數(shù)絕對(duì)值75%附近的位置最能反映噪聲的情況,因此cora取75%,表示為cora75。為了反映噪聲情況與cora75間的關(guān)系,引入系數(shù)均值M=Mean(|dj|)與噪聲系數(shù)方差anoise=Var(|dj,noise|)。其中,dj表示第j層細(xì)節(jié)系數(shù),dj,noise表示第j層噪聲細(xì)節(jié)系數(shù)。
式(1)為閾值估計(jì),對(duì)于系數(shù)閾值函數(shù)采用雙閾值函數(shù),閾值可以分為以下兩個(gè)。
式(2)中T1 式中:m為縮放系數(shù),di(k)為第i層細(xì)節(jié)系數(shù)。研究結(jié)果表明,α、β分別取1、2可取得最佳效果,離散小波閾值去噪前后的心音對(duì)比如圖1所示。由圖1可見(jiàn),本文算法能較好地去除心音信號(hào)的噪聲成分,得到純凈的心音信號(hào)估計(jì)值,有助于后續(xù)準(zhǔn)確分割,提高分割精確度。 圖1 降噪前后的信號(hào)對(duì)比Fig.1 Signal comparison before and after denoising 2.2.1 HSMM HSMM是HMM[15]的一種擴(kuò)展形式,HMM是用于描述序列數(shù)據(jù)的統(tǒng)計(jì)模型,通過(guò)對(duì)離散的“隱藏狀態(tài)”的可能性進(jìn)行推斷,通過(guò)觀察轉(zhuǎn)移概率來(lái)得到每個(gè)觀察結(jié)果。隱馬爾可夫模型為一階模型,隱藏序列由心臟的S1、收縮期、S2、舒張期組成,觀察序列是通過(guò)計(jì)算心音信號(hào)中的特征得到,HMM的參數(shù)集為 式中:A為轉(zhuǎn)移概率,B為輸出概率,π為初始狀態(tài)分布。隱藏狀態(tài)定義為S1、S2,N為狀態(tài)總數(shù)。其中N取4,ξ1、ξ2、ξ3、ξ4分別代表S1、收縮期、S2、舒張期。定義整個(gè)序列為Q,持續(xù)周期為T(mén),t時(shí)刻的狀態(tài)為qt。狀態(tài)的觀察序列為O={O1,…,OT},A={aij}為t時(shí)刻i態(tài)到j(luò)態(tài)的轉(zhuǎn)移概率。心音4個(gè)狀態(tài)只能從一個(gè)特定的狀態(tài)轉(zhuǎn)移到另一個(gè)特定狀態(tài)。B={bj(Ot)},1≤j≤N,定義了狀態(tài)j在時(shí)刻t生成觀測(cè)向量Ot的概率。HMM是用于心音分割中給定模型和觀察序列情況下,計(jì)算最優(yōu)狀態(tài)的序列。采用Viterbi算法的動(dòng)態(tài)編程方法來(lái)求解最有可能的狀態(tài)序列[18-19],該狀態(tài)序列代表了最初的觀測(cè)值分布情況。將最可能發(fā)生的狀態(tài)可能性定義為δt(j),δt(j)可以通過(guò)式(5)計(jì)算得到,使δt(j)取最大值的參數(shù)式如式(6)中ψt(j)所示。 式(5)表示(t-1)時(shí)刻最可能的狀態(tài)i,t時(shí)刻最可能的狀態(tài)j。以上狀態(tài)能在到達(dá)序列的末尾回溯到最有可能的狀態(tài)序列,具體表達(dá)式分別如式(7)和(8)所示。 HMM的一個(gè)主要限制是不能直接客觀地展現(xiàn)出關(guān)于每個(gè)狀態(tài)的預(yù)期持續(xù)時(shí)間段內(nèi)的任何信息,若不考慮這個(gè)因素,狀態(tài)持續(xù)時(shí)間只由自轉(zhuǎn)移概率決定。實(shí)際上該因素導(dǎo)致每個(gè)狀態(tài)的預(yù)期持續(xù)時(shí)間呈幾何分布并且該分布是單調(diào)遞減的,這不適用于臨床上心音分析。為達(dá)到持續(xù)時(shí)間的建模,模型中需要一個(gè)額外的參數(shù)p。該算法定義新的模型如下:λ=(A,B,π,p),p={pi(d)}表示i狀態(tài)下持續(xù)為d的概率,修改Viterbi算法,使其包含持續(xù)時(shí)間的密度,具體表達(dá)式如式(9)所示。是計(jì)算j狀態(tài)下從(t-d)時(shí)刻到t時(shí)刻所有觀測(cè)值的概率,式(9)的δt(j)最 觀測(cè)密度大值由兩個(gè)參數(shù)i和d確定,在持續(xù)一段時(shí)間內(nèi)不同的狀態(tài)之間轉(zhuǎn)換,這便是HSMM[20],添加了狀態(tài)駐留因素,即時(shí)間組成成分,使所預(yù)測(cè)的狀態(tài)由某個(gè)時(shí)刻擴(kuò)展到一段時(shí)間。心臟周期各組成部分的持續(xù)時(shí)間有明確的上下限,即心臟某個(gè)狀態(tài)只能在某個(gè)時(shí)刻維持短暫的時(shí)間,使用HSMM后期望這些新添加的信息有助于提升分割性能。 2.2.2 LR模型 LR是一個(gè)二進(jìn)制分類模型,它使用邏輯函數(shù)將預(yù)測(cè)的變量或特征轉(zhuǎn)化為二進(jìn)制響應(yīng)變量。邏輯函數(shù)σ(a)定義為 使用上述邏輯函數(shù)通過(guò)相關(guān)計(jì)算,得到輸入特征或觀察結(jié)果的特定狀態(tài)概率為 式中:ω為模型的權(quán)重,應(yīng)用于每個(gè)輸入狀態(tài)。通過(guò)貝葉斯定律找到給定HSMM所要求的狀態(tài)觀察概率bj(Ot|ξj),貝葉斯公式定義為 根據(jù)最小二乘法加權(quán)迭代進(jìn)行訓(xùn)練,使用一對(duì)多的方法訓(xùn)練LR模型以獲取模型中每個(gè)狀態(tài)的觀測(cè)值。接著由整個(gè)訓(xùn)練集的特征值計(jì)算出多元高斯分布并從中得到P(Ot),P(ξt)由初始狀態(tài)概率分布π計(jì)算得到。將LR模型與HSMM模型結(jié)合,有助于對(duì)基礎(chǔ)心音的識(shí)別。LR模型推導(dǎo)的輸出概率用來(lái)代替高斯或伽馬分布[20]。 香農(nóng)能量包絡(luò)在目前心電信號(hào)的包絡(luò)提取中得到廣泛應(yīng)用,原始心音信號(hào)先采用切比雪夫型濾波器得到,然后將信號(hào)歸一化成信號(hào)的最大值,其依據(jù)的公式為 式中:x2000(k)為通過(guò)采樣后得到的信號(hào),此處x為歸一化信號(hào),其值從-1到1。平均香農(nóng)能量計(jì)算為 式中:xnorm為采樣和歸一化后的信號(hào),N為信號(hào)長(zhǎng)度。對(duì)平均香農(nóng)能量求均值和方差,可得到香農(nóng)能量包絡(luò),其表達(dá)式為 式中:M(Es(t))為均值,S(Es(t))為方差。原始心音和通過(guò)香農(nóng)能量提取后的包絡(luò)如圖2所示。 圖2 原始信號(hào)與香農(nóng)能量包絡(luò)Fig.2 Original signal and Shannon energy envelope SVM[21-23]主要用于解決數(shù)據(jù)分類問(wèn)題,主要原理為通過(guò)選好的核函數(shù)把輸入特征映射到高維空間,找到一個(gè)超平面把所有數(shù)據(jù)樣本劃分開(kāi),達(dá)到分類的目的。研究中常見(jiàn)的核函數(shù)有徑向基函數(shù)和Sigmoid函數(shù)等。該算法選用的是Sigmoid核函數(shù),核函數(shù)的選取為 只有式(16)的v與a取恰當(dāng)?shù)闹担艜?huì)滿足Mercer條件。一般v取2,a取1,得到分類判別式為 對(duì)于超平面,則有 找到超平面后,計(jì)算樣本點(diǎn)到該超平面的距離。設(shè)定訓(xùn)練樣本函數(shù)為 接著把問(wèn)題轉(zhuǎn)化為式(20)中的優(yōu)化問(wèn)題。 懲罰因子和最優(yōu)核參數(shù)通過(guò)實(shí)驗(yàn)確定。心音有S1、S2、收縮期、舒張期4個(gè)成分,通過(guò)一對(duì)一的分類器,兩兩組合,得到6個(gè)SVM子分類器。SVM子分類器需要判別f類信號(hào)和g類信號(hào),若判別信號(hào)為f類,f計(jì)數(shù)加一,以此類推,最終數(shù)值最大者為判別結(jié)果。 經(jīng)過(guò)Viterbi推測(cè)得到的k個(gè)最佳可能結(jié)果,最佳可能結(jié)果是心音幀在各個(gè)時(shí)刻的駐留信息和概率得分 式(21)表示第k個(gè)最佳可能結(jié)果中第m個(gè)LR-HSMM的第n個(gè)狀態(tài)駐留的心音幀得分信息。每個(gè)最優(yōu)狀態(tài)的概率得分表達(dá)式為 式中:S表示狀態(tài),δt(i)表示心音t時(shí)刻的第i個(gè)狀態(tài)概率。把k個(gè)最佳可能結(jié)果整理并構(gòu)成以下特征向量 對(duì)特征向量F歸一化處理后輸入到SVM進(jìn)行識(shí)別。 該算法主要是用LR-HSMM對(duì)心音信號(hào)進(jìn)行訓(xùn)練,算法具體流程如圖3所示,整個(gè)分割步驟可分為以下5個(gè)步驟: 圖3 提取的心音分割算法流程圖Fig.3 Algorithm flowchart of processed heart sound segmentation (1)用coif5小波對(duì)心音信號(hào)降噪。 (2)以ECG(心電信號(hào))為參考信號(hào),計(jì)算出R波和T峰,借助R波和T峰對(duì)原始心音進(jìn)行標(biāo)記,并提取香農(nóng)能量等特征。 (3)構(gòu)建LR-HSMM模型,用訓(xùn)練數(shù)據(jù)參數(shù)矩陣(B表示觀測(cè)矩陣;p表示每個(gè)心音狀態(tài)的時(shí)間概率密度函數(shù);A表示除了連續(xù)狀態(tài)之間可能的轉(zhuǎn)換概率置1外,其他轉(zhuǎn)換概率置0;π置為0.25),形成分割用的LR-HSMM參數(shù)訓(xùn)練集。 (4)估計(jì)整體心率,提取測(cè)試集相關(guān)特征,用訓(xùn)練好的LR-HSMM模型測(cè)試數(shù)據(jù),使用Viterbi譯碼算法推測(cè)出最優(yōu)的狀態(tài)序列。 (5)將最優(yōu)序列轉(zhuǎn)換成SVM特征向量,歸一化后輸入到SVM完成S1、S2的分割識(shí)別。 實(shí)驗(yàn)數(shù)據(jù)來(lái)源于PhysioNet Computing in Cardiology Challenge 2016[20],其中包含來(lái)自麻省總醫(yī)院123例身份不明的成年患者的30~40 s的PCG記錄。123例患者中,38例為正常對(duì)照組,37例是與二尖瓣脫垂相關(guān)的雜音,36例為良性雜音,5例為主動(dòng)脈疾病,7例為其他雜音(三尖瓣反流、心內(nèi)膜炎、不對(duì)稱隔膜肥大)。錄音使用Meditron電子聽(tīng)診器進(jìn)行記錄,并在44.1 kHz未壓縮的波形格式下以16位分辨率保存。實(shí)驗(yàn)內(nèi)容均基于Windows10系統(tǒng)MATLAB R2018a平臺(tái)對(duì)心音樣本進(jìn)行測(cè)試。實(shí)驗(yàn)中所用脈沖噪聲采樣率為1 kHz,babble語(yǔ)音噪聲及白噪聲采樣率為1.6 kHz,對(duì)3類噪聲作變采樣(上采樣、降采樣)處理到2 kHz,幀長(zhǎng)為20 ms,幀移為10 ms,選用漢明窗作窗函數(shù)。 LR-HSMM模型的參數(shù)是通過(guò)訓(xùn)練R峰、T波標(biāo)記的PCG序列得到的,將數(shù)據(jù)集隨機(jī)分成訓(xùn)練集和測(cè)試集。借助似然函數(shù)計(jì)算輸出概率,并對(duì)每種狀態(tài)進(jìn)行隨機(jī)子采樣以確保LR模型的每個(gè)類別中都有均等的樣本數(shù)量。對(duì)訓(xùn)練數(shù)據(jù)集的所有轉(zhuǎn)移矩陣概率aij和輸出概率B都進(jìn)行優(yōu)化。通過(guò)訓(xùn)練數(shù)據(jù),修改Viterbi算法來(lái)不斷優(yōu)化B和p。為了將該算法與LR-HSMM等方法進(jìn)行比較,在數(shù)據(jù)集中進(jìn)行了測(cè)試,以便直接比較結(jié)果。測(cè)試的4種算法如下: (1)基于LR-HSMM算法,使用Hilbert,功率譜密度函數(shù)(Power spectral density,PSD),小波,同態(tài)特征; (2)基于LR-HSMM算法,使用Hilbert,PSD,小波,同態(tài)特征,SVM; (3)基于LR-HSMM算法,使用PSD,小波,同態(tài)特征,香農(nóng)能量和SVM; (4)基于LR-HSMM算法,使用PSD,小波,同態(tài)特征,香農(nóng)能量。 為評(píng)估4種分割算法在測(cè)試集中準(zhǔn)確分割S1和S2的能力,將數(shù)據(jù)分為訓(xùn)練集和測(cè)試集。通過(guò)LRHSMM訓(xùn)練,將測(cè)試集的評(píng)估過(guò)程重復(fù)20次,對(duì)結(jié)果取平均值,計(jì)算公式為 式中:TP為基礎(chǔ)心音檢出正確率,F(xiàn)P為基礎(chǔ)心音錯(cuò)誤檢入率,WP為基礎(chǔ)心音未檢出率;TN為準(zhǔn)確檢出基礎(chǔ)心音的幀數(shù),F(xiàn)N為錯(cuò)誤檢入的幀數(shù),WN為基礎(chǔ)心音沒(méi)被檢出的幀數(shù)。計(jì)算時(shí)以手工標(biāo)注的數(shù)據(jù)作為參考標(biāo)準(zhǔn)。 心音的能量包絡(luò)與分割后對(duì)應(yīng)的心音狀態(tài)如圖4所示。算法通過(guò)對(duì)基礎(chǔ)心音進(jìn)行標(biāo)記,然后用LR-HSMM對(duì)未知心音進(jìn)行訓(xùn)練,接著對(duì)測(cè)試集心音進(jìn)行分割。圖4(a,c)為分類后的心音包絡(luò),其中有靜止期和基礎(chǔ)心音區(qū)間。由于臨床上舒張期通常大于收縮期,則把靜止期中較長(zhǎng)時(shí)段的心音稱作舒張期,反之則稱作收縮期。AB/A′B′為基礎(chǔ)心音中的第一心音包絡(luò),CD/C′D′則為第二心音包絡(luò)。圖4(b,d)分別為正常和異常心音中各自的一個(gè)心動(dòng)周期分割后所得結(jié)果:S1、S2、收縮期、舒張期。從分割的實(shí)驗(yàn)結(jié)果可以看出,本文算法對(duì)正常和異常心音分割均取得良好的性能。 圖4 心音分割結(jié)果Fig.4 Heart sound segmentation result 脈沖噪聲下的各算法性能指標(biāo)對(duì)比如表1所示。從表1的檢出正確率可知,Hilbert變換提取的包絡(luò)平均檢出正確率為91.772%,是4種對(duì)比算法中最低的。因?yàn)閱渭僅ilbert變換提取得到的包絡(luò)不光滑,具有大量粗糙的毛刺,故檢出正確率最低。未檢出率達(dá)到4.539%,是幾個(gè)算法中未檢出率最高的。ShanSvm在信噪比10 dB以內(nèi),隨著信噪比提升,檢出率也逐漸提升,平均檢出正確率為92.688%,是檢出正確率中最高的。因?yàn)樵撍惴ú捎肧hannon提取所得到的包絡(luò)更加光滑,SVM具有較強(qiáng)的二分類能力,因此能輔助模型正確檢測(cè)出最多數(shù)量的心音,未檢出率僅為3.690%,達(dá)到一個(gè)最低值。ShanSvm算法在心音的檢出正確率與準(zhǔn)確率上是最高的,由此可見(jiàn)本文所提出的算法較參考算法在分割精度上得到大幅度提升。 表1 脈沖噪聲下評(píng)價(jià)指標(biāo)對(duì)比Table 1 Comparison of evaluation indexes under impulsive noise 圖5 為各種噪聲環(huán)境下各種算法的心音檢出率,實(shí)驗(yàn)中為測(cè)試算法對(duì)噪聲的容忍度,采用了babble噪聲、脈沖噪聲以及白噪聲模擬臨床噪聲。由圖5可知,在10 dB以內(nèi)的信噪比中,采用各種算法時(shí),心音檢出率隨著信噪比的增大均呈上升趨勢(shì),因?yàn)樵谝欢ǚ秶鷥?nèi),信噪比越大,信號(hào)越純凈,有助于算法更好地識(shí)別心音。實(shí)驗(yàn)結(jié)果表明,若是單獨(dú)地使用Hil、Svm、Shan之中的某種特征,都無(wú)法獲得最佳的分割效果。ShanSvm的檢出正確率在各信噪比下不僅最高而且相對(duì)最穩(wěn)定,這是由于該算法提取的特征包絡(luò)光滑,加入SVM提高了心音的識(shí)別能力,增強(qiáng)了抗噪效果,在幾種對(duì)比算法中取得最佳分割效果。 圖5 3種噪聲在不同信噪比時(shí)的檢出正確率Fig.5 Detection accuracy of three kinds of noise at different signal-to-noise ratios 結(jié)合SVM和香農(nóng)能量的HSMM心音分割算法借助香農(nóng)能量提取的特征包絡(luò)平滑的優(yōu)點(diǎn),提高了分割精確度。算法用LR-HSMM對(duì)心音進(jìn)行訓(xùn)練,用Viterbi算法推測(cè)出最優(yōu)狀態(tài),最后通過(guò)SVM實(shí)現(xiàn)了S1、S2的最終識(shí)別。通過(guò)對(duì)心音信號(hào)的檢測(cè)與進(jìn)一步分析,有望獲取病人的心血管健康信息,更好地輔助醫(yī)生對(duì)病人進(jìn)行早期干預(yù)。算法通過(guò)較為精準(zhǔn)地識(shí)別S1和S2來(lái)獲取個(gè)人獨(dú)特的生物學(xué)特征,也可進(jìn)一步應(yīng)用于個(gè)人身份的識(shí)別。下一步的研究將致力于提高算法的普適性,并綜合考慮心率變異性等因素,爭(zhēng)取獲得更高的心音檢出正確率。2.2 LR?HSMM
2.3 歸一化香農(nóng)能量
2.4 支持向量機(jī)
2.5 分割算法流程
3 心音分割實(shí)驗(yàn)
3.1 數(shù)據(jù)集與實(shí)驗(yàn)設(shè)置
3.2 評(píng)價(jià)指標(biāo)
3.3 實(shí)驗(yàn)結(jié)果與分析
4 結(jié)束語(yǔ)