陳敏,王嬈芬
上海工程技術(shù)大學(xué)電子電氣工程學(xué)院,上海201620
在社會老齡化和城市化進(jìn)程加快、居民不健康生活方式盛行的背景下,中國心血管病患病率和死亡率一直處于不斷上升階段,并呈現(xiàn)出低齡化趨勢且在低收入群體中快速增長及個(gè)體聚集現(xiàn)象[1]。心電圖是人體心電信號的反映,心臟專家通過對心電圖的觀察,可以識別心電信號的異常,從而判斷人體心臟的健康狀況。除醫(yī)院內(nèi)廣泛使用的Holter 心電監(jiān)護(hù)儀外,家用可穿戴心電設(shè)備也逐漸普及[2-3]。這就需要對心電信號進(jìn)行自動(dòng)分類,并且有很好的實(shí)時(shí)性,從而實(shí)現(xiàn)對心臟健康狀況的實(shí)時(shí)監(jiān)測,及時(shí)發(fā)現(xiàn)心律異常并采取相應(yīng)措施[4]。
整個(gè)心電信號自動(dòng)分類過程中,特征提取是至關(guān)重要的部分,眾多學(xué)者對此進(jìn)行了研究。Li等[5]使用小波包和近似熵對心電信號進(jìn)行特征提取,小波分析方法具有多分辨率分析的特點(diǎn),在時(shí)頻域能有效表征信號的局部特征,但存在小波基函數(shù)的選擇等問題;Rajesh 等[6]使用經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)方法對心電信號進(jìn)行分解,對得到的IMF 分量進(jìn)行熵等特征的計(jì)算得到特征向量。EMD 是一種自適應(yīng)的信號處理方法,自適應(yīng)分解得到的若干個(gè)IMF分量在時(shí)頻上都有其物理意義。然而EMD分解中會出現(xiàn)端點(diǎn)效應(yīng)、模態(tài)混疊、過包絡(luò)和欠包絡(luò)等問題[7],針對這些缺點(diǎn)出現(xiàn)過很多改進(jìn)的方法,比如總體經(jīng)驗(yàn)?zāi)B(tài)分解[8]、總體完備經(jīng)驗(yàn)?zāi)B(tài)分解[9-10]等,但是這些改進(jìn)方法依然不能夠有效解決EMD存在的問題。胡健等[11]提出使用新的特征提取方法—— 局部均值分解(Local Mean Decomposition,LMD)方法對心電信號進(jìn)行自適應(yīng)分解,該方法能夠解決EMD方法的端點(diǎn)效應(yīng)、過包絡(luò)、欠包絡(luò)問題,但仍然存在模態(tài)混疊問題。因此本文對LMD 方法進(jìn)行改進(jìn),提出一種總體局部均值分解(Ensemble Local Mean Decomposition,ELMD)方法,并應(yīng)用ELMD 方法對心電信號進(jìn)行分析。ELMD 方法通過對預(yù)處理后的心電信號多次加入不同的高斯白噪聲后再進(jìn)行局部均值分解,對每次得到的若干個(gè)乘積函數(shù)分量(Product Function,PF)求均值,得到最后的PF 分量。該方法分解得到的PF 分量能夠克服由信號間歇性引起的信號時(shí)頻分布的混疊,即在一個(gè)PF分量中只出現(xiàn)信號相同時(shí)間尺度的特征。
對優(yōu)化后的PF 分量進(jìn)行特征計(jì)算,得到一組能有效代表心電信號特性的特征向量。最后送入支持向量機(jī)進(jìn)行分類,實(shí)現(xiàn)對正常心電信號和4種常見心律失常心電信號的自動(dòng)分類。
LMD 是一種新的自適應(yīng)時(shí)頻分析方法,它能夠?qū)⒎蔷€性、非平穩(wěn)的復(fù)雜信號自適應(yīng)地分解為若干個(gè)具有物理意義的PF 分量和一個(gè)殘余分量,在機(jī)械故障診斷和腦電信號分析中得到廣泛應(yīng)用[12-14]。具體算法如下:找出原始信號x(t)所有的局部極大值點(diǎn)和極小值點(diǎn)nj,求取相鄰兩個(gè)極值點(diǎn)的均值,用滑動(dòng)平均法進(jìn)行平滑處理,得到局部均值函數(shù)m11(t),并通過局部均值點(diǎn)計(jì)算包絡(luò)估計(jì)值aj:
將aj用直線連接起來,采用滑動(dòng)平均法對折線進(jìn)行平滑處理,得到包絡(luò)估計(jì)函數(shù)a11(t);從x(t)中分離出局部均值函數(shù),得到h11(t);將分離得到的h11(t)除以a11(t)進(jìn)行解調(diào),得到調(diào)頻信號:
重復(fù)上述步驟n次,直到s1n(t)為純調(diào)頻函數(shù),此時(shí):
則x(t)分解出的第一個(gè)PF分量為包絡(luò)信號a1(t)和純調(diào)頻信號s1n(t)的乘積,即:
從x(t)中分離出PF1(t),將得到的新信號u1(t)作為源信號迭代上述步驟k次,直到uk(t)為單調(diào)函數(shù)。最后,xi(t)被分解為k個(gè)PF 分量和一個(gè)殘余分量uk(t),表示為:
ELMD方法是對LMD方法的一種改進(jìn)。ELMD的本質(zhì)是對信號加入不同的高斯白噪聲后進(jìn)行局部均值分解,對每次得到的若干個(gè)PF 分量求均值作為最后的結(jié)果。其具體的計(jì)算流程如下:
(1)對去噪之后的心電信號x(t) 加入不同的高斯白噪聲:
其中,ωi(t)(i=1,2,…,M)是不同的均值為0、方差為ε的高斯白噪聲。
(2)對xi(t)進(jìn)行LMD 分解,得到k個(gè)PF 分量和一個(gè)殘余分量uk(t),表示為:
(3)計(jì)算M次分解得到的PF 分量p和余量r的均值:
其中,、即為ELMD分解的結(jié)果。
心電信號經(jīng)過ELMD 的分解,原信號的特征信息會被分布到不同的時(shí)間特征尺度上,從而放大了原信號隱含的特征信息。
本文數(shù)據(jù)采用美國麻省理工學(xué)院心律失常數(shù)據(jù)庫MIT-BIH。MIT-BIH 數(shù)據(jù)庫廣泛應(yīng)用于學(xué)術(shù)研究和工程實(shí)施[15-16],它由48 段長度為半小時(shí)的記錄組成,來自47 個(gè)個(gè)體。每個(gè)心拍都至少由兩名心臟學(xué)專家進(jìn)行心律失常類型的標(biāo)注,包括束支傳導(dǎo)阻滯、房性早搏、室性早搏、房顫、起搏心跳、ST段改變等15種心律異常。本文對4種常見心律失常疾病:左束支傳導(dǎo)阻滯(Left Bundle Branch Block,LBBB)、右束支傳導(dǎo)阻滯(Right Bundle Branch Block, RBBB)、房性早搏(Artial Premature Contraction,APC)、室性早搏(Premature Ventricular Contraction, PVC)和 正 常(Normal,N)心電信號進(jìn)行分類,選擇的數(shù)據(jù)編號及心拍樣本數(shù)量如表1所示。
表1 心電數(shù)據(jù)編號及樣本數(shù)量Tab.1 Electrocardiogram(ECG)data number and sample size
心電信號在采集過程中,必然會受到各種類型噪聲的干擾,如工頻干擾、基線漂移和高頻干擾等[17]。本文使用Sing等[18]提出的方法,選擇db6小波基函數(shù)將心電信號分解為9層。由于第9層近似系數(shù)的頻率范圍為0~0.351 Hz,主要是基線漂移,因此不用于重構(gòu)。此外,90~180和45~90的頻帶范圍包含工頻干擾和高頻干擾,也不用于重構(gòu)。通過對第3層到第9層的細(xì)節(jié)系數(shù)重構(gòu),實(shí)現(xiàn)對心電信號的去噪。
去噪后使用WFDB工具箱的ecgpuwave函數(shù),實(shí)現(xiàn)對QRS波群的檢測。如圖1所示,實(shí)現(xiàn)了對記錄編號100的心電信號QRS波群的檢測。在QRS波群位置前取120個(gè)點(diǎn),在QRS波群位置后取180個(gè)點(diǎn)進(jìn)行心拍分割。分割后的單個(gè)心拍如圖2所示。
對預(yù)處理后的單個(gè)心拍使用ELMD方法進(jìn)行自適應(yīng)分解。其中,設(shè)定高斯白噪聲的方差ε值為0.2,加入白噪聲的次數(shù)M值為100。利用白噪聲信號具有頻率分布均勻的統(tǒng)計(jì)特性,且白噪聲的均值為0,不同的白噪聲加入心電信號中形成混合信號后,進(jìn)行多次分解得到的多個(gè)PF分量平均值能夠自動(dòng)剔除白噪聲成分。在對白噪聲進(jìn)行分解時(shí),ELMD頻域上表現(xiàn)為一個(gè)高通濾波器和一系列連續(xù)的帶通濾波器組的組合?;旌闲盘柦?jīng)ELMD分解后,心電信號中的所有尺度會自動(dòng)地分解到白噪聲所確定的濾波器組中與之相關(guān)的通頻帶中,因此能夠顯著減少模態(tài)混疊現(xiàn)象。
圖1 QRS波群檢測Fig.1 QRS complex detection
圖2 預(yù)處理后的單個(gè)心拍Fig.2 Single heartbeat after preprocessing
對5種不同類型的心拍進(jìn)行ELMD分解,均能得到4 個(gè)PF 分量和一個(gè)殘余分量。圖3是5 種不同類型心電信號的ELMD 分解結(jié)果,分別選取記錄編號為100、109、118、200和232的心電數(shù)據(jù)??梢杂^察到每種心律失常類型所對應(yīng)的PF 分量波形各不相同,由于殘余分量所包含的信息較少,所以選擇前4個(gè)PF分量進(jìn)行特征提取。
ELMD分解后,計(jì)算每個(gè)PF分量的樣本熵(SE)、平均功率(MP)、奇異值(SV)和標(biāo)準(zhǔn)差(SD),得到16維特征。其中,SE 反映信號的復(fù)雜程度[19];MP 反映每個(gè)PF 分量的頻帶信息;SV 反映信號的穩(wěn)定性[20];SD 反映信號的變化特性。組成的特征矩陣如表2所示。
每類心電信號類型選擇800個(gè)樣本進(jìn)行分析,采用卡方檢驗(yàn)方法分析每一個(gè)特征與所屬類別的相關(guān)性并進(jìn)行評分,對分?jǐn)?shù)求log后,得到圖4的相關(guān)系數(shù)圖??梢钥闯雒恳粋€(gè)特征對心電信號的分類都起到一定的作用。圖5為隨機(jī)選擇的3 個(gè)特征的箱型圖表示,可以觀察到每類心電信號的特征值都有明顯的差異分布,即每類心電信號的特征值都具有較好的分類辨識度。
圖3 N,LBBB,RBBB,APC,PVC的ELMD分解圖Fig.3 Ensemble local mean decomposition(ELMD)diagrams of N,LBBB,RBBB,APC and PVC
表2 心電特征矩陣名稱Tab.2 Names of ECG feature matrixes
首先對數(shù)據(jù)集進(jìn)行劃分,在每類心電信號中隨機(jī)選取70%的數(shù)據(jù)作為訓(xùn)練集,剩余的30%作為測試集,得到2 800組訓(xùn)練樣本和1 200組測試樣本,分類模型選擇支持向量機(jī)(SVM)。SVM通過引入高斯核函數(shù),將輸入向量映射到一個(gè)高維的特征向量空間中,并在該特征空間中構(gòu)造最優(yōu)分類超平面,實(shí)現(xiàn)對正常信號和4 種心律失常類型心電信號的分類。其中,使用遺傳算法(GA)和十折交叉驗(yàn)證對SVM中涉及到的懲罰因子C和核函數(shù)參數(shù)η進(jìn)行尋優(yōu)操作。最后得到最優(yōu)懲罰因子的值為22.633 4,最優(yōu)核函數(shù)參數(shù)的值為3.049 4。使用參數(shù)優(yōu)化后的SVM 對心電信號進(jìn)行分類。
本文采用總準(zhǔn)確率(Total Accuracy,TA)、靈敏度(Sensitivity,Se)和特異性(Specificity,Sp)3 種方法對心律失常分類效果進(jìn)行分析和評估。公式如下:
圖4 心電特征與心律失常的相關(guān)性Fig.4 Correlation between ECG features and arrhythmia
其中,TP 表示當(dāng)前心拍類型正確分類的心拍個(gè)數(shù);FP表示不屬于當(dāng)前心拍類型被錯(cuò)分為當(dāng)前心拍類型的心拍個(gè)數(shù);TN 表示屬于當(dāng)前心拍類型被錯(cuò)分為其他類型的心拍個(gè)數(shù);FN 表示不屬于當(dāng)前心拍類型且被錯(cuò)分為其他類型的心拍個(gè)數(shù)。
圖5 心電特征值分布Fig.5 ECG feature value distribution
將得到的特征矩陣輸入?yún)?shù)優(yōu)化后的SVM進(jìn)行分類,得到的混淆矩陣如表3所示。通過表3可以觀察到,使用ELMD方法進(jìn)行特征提取的分類結(jié)果中,5種心電信號類型都達(dá)到了近乎完全正確的分類,有4 個(gè)RBBB 錯(cuò)分為APC,相對來說,這兩種心拍類型容易混淆。通過對混淆矩陣的計(jì)算,得到表4的評價(jià)指標(biāo)結(jié)果??梢钥吹匠齊BBB的靈敏度外,其他評價(jià)指標(biāo)均達(dá)到99%以上,達(dá)到了很好的分類效果。
表3 分類結(jié)果的混淆矩陣表示(ELMD方法)Tab.3 Confusion matrix of classification results(ELMD method)
表4 心律失常分類的實(shí)驗(yàn)結(jié)果(ELMD方法)Tab.4 Results of classification of arrhythmia(ELMD method)
本文還對相同的心電信號樣本使用LMD方法進(jìn)行自適應(yīng)分解,對得到的3個(gè)PF分量進(jìn)行相同的特征提取并使用相同的分類器進(jìn)行分類。得到的混淆矩陣和評價(jià)指標(biāo)結(jié)果如表5和表6所示。通過表3和表5對比可以看出,LMD方法RBBB和APC的區(qū)分表現(xiàn)得更糟糕,RBBB有12個(gè)樣本被錯(cuò)分為APC,有9個(gè)APC被分類為RBBB,且其他類型分類錯(cuò)誤的樣本數(shù)量均高于表3中的數(shù)量。在表6中,LMD方法LBBB、RBBB和APC的靈敏度均低于97%,尤其是RBBB 的靈敏度僅為91.67%。靈敏度越低表示漏診率越高,說明很多RBBB的心拍錯(cuò)分為其他類型。驗(yàn)證了ELMD方法相比于LMD方法具有明顯的優(yōu)越性。
除與LMD 方法進(jìn)行對比外,本文將使用ELMD方法得到的結(jié)果與其他特征提取方法的分類結(jié)果進(jìn)行比較,分類器均為SVM 且分類種類相同。如表7所示,使用EMD[6]和小波變換(WT)、近似熵(ApEn)[5]作為特征提取方法的分類精確度均比本文方法低。因此證明本文的實(shí)驗(yàn)方法是一種效果很好的心電信號自動(dòng)識別方法。
有效的心電特征提取對心律失常的正確分類有著重要意義。本文使用了一種新的心電信號特征提取技術(shù)—ELMD方法對預(yù)處理后的心電信號進(jìn)行特征提取,并使用遺傳算法優(yōu)化后的SVM進(jìn)行分類。通過MITBIH數(shù)據(jù)庫的4 000個(gè)樣本進(jìn)行分析后,評價(jià)指標(biāo)結(jié)果表明使用ELMD方法提取的特征比使用LMD方法提取的特征更具代表性,且準(zhǔn)確率達(dá)到了99.61%,結(jié)果優(yōu)于其他文獻(xiàn),驗(yàn)證了本文方法的可靠性。本次研究主要是在特征提取方法上進(jìn)行了創(chuàng)新,沒有考慮病人的差異性。因此,下一步的研究目標(biāo)計(jì)劃是讓訓(xùn)練集和測試集的樣本來自不同的病人,找到有效的特征提取方法實(shí)現(xiàn)心電信號的精確分類,從而得到更好的適用性。
表5 分類結(jié)果的混淆矩陣表示(LMD方法)Tab.5 Confusion matrix of classification results(LMD method)
表7 與其他文獻(xiàn)的結(jié)果比較Tab.7 Comparison with the results from other literatures
表6 心律失常分類的實(shí)驗(yàn)結(jié)果(LMD方法)Tab.6 Results of classification of arrhythmia(LMD method)