摘要: 針對(duì)心律失常診斷算法中存在的不平衡數(shù)據(jù)集診斷準(zhǔn)確率及陽(yáng)性預(yù)測(cè)值較低的問題,提出一種基于優(yōu)化自適應(yīng)模型的心律失常輔助診斷方法;提取心電信號(hào)的77維特征并將其融合,使用融合特征訓(xùn)練診斷模型,同時(shí)利用改進(jìn)的粒子群算法優(yōu)化自適應(yīng)模型參數(shù);采用優(yōu)化模型對(duì)MIT-BIH心律失常數(shù)據(jù)庫(kù)進(jìn)行診斷實(shí)驗(yàn)并與現(xiàn)有方法進(jìn)行對(duì)比。結(jié)果表明,本文所提方法在測(cè)試數(shù)據(jù)集的診斷準(zhǔn)確率達(dá)到98.2%,正?;蚴鲗?dǎo)阻滯節(jié)拍、 室上性異常節(jié)拍、 心室異常節(jié)拍、 融合節(jié)拍的陽(yáng)性預(yù)測(cè)值分別達(dá)到98.5%、 96.1%、 95.5%、 92.0%,診斷準(zhǔn)確率和陽(yáng)性預(yù)測(cè)值明顯大于現(xiàn)有方法的。
關(guān)鍵詞: 心律失常診斷; 特征融合; 心電信號(hào); 自適應(yīng)提升模型; 粒子群優(yōu)化算法
中圖分類號(hào): TP39; R541.7
文獻(xiàn)標(biāo)志碼: A
An Auxiliary Diagnosis Method for
Arrhythmias Based on Optimized Adaptive Model
Abstract: Aiming at the problem of low diagnostic accuracy and positive predictive value of imbalanced datasets in arrhythmia diagnosis algorithms, an auxiliary method for arrhythmia diagnosis based on optimized adaptive models was proposed. This method extracted the 77 dimensional features of the electrocardiogram signal and fuses them, trained the diagnostic model using the fused features, and optimized the adaptive model parameters using an improved particle swarm optimization algorithm. The optimized model was used to test in MIT-BIH arrhythmia database and compared with the existing methods. The results show that the total diagnostic accuracy of the proposed method on the test dataset reaches 98.2%, and the positive predictive values of normal or bundle branch block rhythm, supraventricular abnormal rhythm, ventricular abnormal rhythm, and fusion rhythm reach 98.5%, 96.1%, 95.5%, and 92.0%, respectively. The diagnostic accuracy and positive predictive value are significantly higher than those of the existing methods.
Keywords: arrhythmia diagnosis; feature fusion; electrocardiogram signal; adaptive boosting model; particle swarm optimization algorithm
隨著我國(guó)老年人口規(guī)模和比重的增加,心血管疾病的患病率與死亡率處于持續(xù)上升階段。心律失常作為臨床最為常見的心血管疾病,具有隱蔽性、 突發(fā)性和偶然性等特點(diǎn)。 流行病學(xué)調(diào)查顯示,我國(guó)每年因心源性猝死的人數(shù)達(dá)到54.4萬(wàn),其中有超過80%死亡病例是由惡性心律失常引起的。心電圖(electrocardiogram,ECG)是心律失常最重要的診斷依據(jù)。 據(jù)統(tǒng)計(jì), 我國(guó)每年約有2.5億人進(jìn)行ECG檢查, 但現(xiàn)有的ECG診斷專家無法滿足各級(jí)醫(yī)院的診斷需求。 隨著人工智能與醫(yī)療大數(shù)據(jù)的發(fā)展, 使用機(jī)器學(xué)習(xí)搭建診斷模型來實(shí)現(xiàn)計(jì)算機(jī)輔助心律失常診斷成為重要的研究方向, 其中ECG的心拍分類對(duì)計(jì)算機(jī)輔助心律失常診斷具有重要研究?jī)r(jià)值。
目前, 國(guó)內(nèi)外多位學(xué)者對(duì)計(jì)算機(jī)輔助心律失常診斷進(jìn)行了相關(guān)研究。 特征提取和模型診斷是心律失常診斷中最重要的2個(gè)階段, 其中特征提取是心律失常診斷的關(guān)鍵。 ECG形態(tài)對(duì)心律失常診斷具有重要意義, 原因在于: 一方面, QRS波群的形態(tài)特征可以反映心臟室上性激動(dòng)傳導(dǎo)狀況, 若波形異常,可能由心室傳導(dǎo)阻滯或束支傳導(dǎo)阻滯引起; 另一方面,P波的形態(tài)特征可以反映心房除極電位變化,若P波被高頻F波替代, 可能由心房顫動(dòng)引起?;贓CG波形的形態(tài)學(xué)特征提取方法[1-3]在心律失常診斷方面具有一定適用性,文獻(xiàn)[1]中提取ECG相鄰R峰時(shí)間間隔(簡(jiǎn)稱RR間期)特征、 ECG形態(tài)特征, 完成了正常心拍、 室上性異常心拍和室性異常心拍3類心律失常的診斷。 形態(tài)學(xué)特征提取方法使心律失常診斷更加直觀; 但同時(shí)也存在依賴心電波形和泛化能力較差問題, 因此學(xué)者們開始提取ECG時(shí)頻域特征[4-5]以彌補(bǔ)形態(tài)學(xué)特征的缺陷。文獻(xiàn)[5]中通過小波變換實(shí)現(xiàn)信號(hào)去噪及提取ECG時(shí)頻域特征, 實(shí)現(xiàn)了房顫和其他心律失常的區(qū)分。 時(shí)頻域特征提取方法更為有效地實(shí)現(xiàn)心律失常診斷, 但仍存在些許不足,如計(jì)算復(fù)雜度較高,容易丟失原始信號(hào)的細(xì)節(jié)特征。 針對(duì)時(shí)頻域特征提取方法的不足, 學(xué)者們[6-7]提出了多類型特征融合的心律失常診斷方法。文獻(xiàn)[7]中融合了ECG的形態(tài)學(xué)特征與R波、 T波的幅值等統(tǒng)計(jì)學(xué)特征, 使用融合特征完成了4類心律失常診斷。同樣, 診斷模型的選取也對(duì)心律失常診斷結(jié)果具有重要影響。目前最常用的心律失常診斷模型為支持向量機(jī)[8-9]、 K近鄰算法[10-11]、 卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)[12-13]、 長(zhǎng)短期記憶(long short-term memory,LSTM)[14-15]網(wǎng)絡(luò)等, 但此類模型具有單一性,在處理高維度數(shù)據(jù)時(shí)易出現(xiàn)過擬合現(xiàn)象。為了克服單一模型的局限性,學(xué)者們提出了模型組合方式[16-17]診斷心律失常, 如文獻(xiàn)[17]中使用CNN和LSTM模型組合方式, 實(shí)現(xiàn)MIT-BIH心律失常數(shù)據(jù)庫(kù)中5類心律失常的診斷。 模型組合診斷方式極大地改善了過擬合現(xiàn)象, 但仍存在些許不足,如對(duì)具有缺失值和異常值的心律失常數(shù)據(jù)集診斷的表現(xiàn)較差。 為了增強(qiáng)模型的泛化能力, 有學(xué)者基于模型組合診斷方式提出了使用集成模型診斷心律失常方法[18-20], 如文獻(xiàn)[18]中將RR間期、 R波振幅等作為ECG的特征空間, 使用隨機(jī)森林模型(random forest, RF)實(shí)現(xiàn)室性早搏的識(shí)別。
盡管目前的心律失常診斷算法具有出色的性能, 但仍存在改進(jìn)空間, 主要表現(xiàn)在: 1)針對(duì)特征提取, 盡管目前部分文獻(xiàn)中提出了特征融合方法, 但融合的特征還局限于ECG的形態(tài)學(xué)特征與統(tǒng)計(jì)特征, 忽略了ECG的細(xì)節(jié)特征及其節(jié)律特性; 2)目前用于心律失常診斷的集成模型主要是RF, 該模型對(duì)心律失常診斷的整體準(zhǔn)確率較高, 但對(duì)于不平衡數(shù)據(jù)集中少量樣本類別的診斷無法達(dá)到理想的效果。 為了提高心律失常診斷模型對(duì)不平衡數(shù)據(jù)集診斷的整體準(zhǔn)確率, 針對(duì)ECG特征提取不充分及診斷算法選擇與優(yōu)化問題, 本文中提出基于優(yōu)化自適應(yīng)模型的心律失常輔助診斷方法(簡(jiǎn)稱本文方法), 融合ECG的形態(tài)學(xué)特征、 細(xì)節(jié)特征及節(jié)律特征, 將融合特征作為模型的輸入進(jìn)行訓(xùn)練, 使用粒子群優(yōu)化算法(particle swarm optimization, PSO)優(yōu)化模型參數(shù), 得到最優(yōu)自適應(yīng)提升(adaptive boosting,Adaboost)模型, 進(jìn)而使用最優(yōu)模型診斷心律失常病癥。
1 MIT-BIH心律失常數(shù)據(jù)庫(kù)
MIT-BIH心律失常數(shù)據(jù)庫(kù)是美國(guó)麻省理工學(xué)院提供的研究心律失常的標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)之一, 數(shù)據(jù)庫(kù)中包含47位不同患者共48條ECG記錄(其中有2條記錄來自同一患者), 每條記錄的采樣時(shí)間為30 min,采樣頻率為360 Hz。ECG診斷類別參照美國(guó)醫(yī)療儀器促進(jìn)協(xié)會(huì)(The Association for the Advancement of Medical Instrumentation, AAMI)制定的標(biāo)準(zhǔn), 將ECG節(jié)拍分為5類[21], 包括N(正?;蛘呤鲗?dǎo)阻滯節(jié)拍)、 S(室上性異常節(jié)拍)、 V(心室異常節(jié)拍)、 F(融合節(jié)拍)和Q(未能分類的節(jié)拍)根據(jù)發(fā)生異常的部位不同導(dǎo)致的心拍中各個(gè)波形的綜合表現(xiàn), 將ECG節(jié)拍分為以上5類, 其中Q類在實(shí)際中不存在, 因此本文中只對(duì)數(shù)據(jù)庫(kù)中N、 S、 V、 F類心拍進(jìn)行分類實(shí)驗(yàn)。 MIT-BIH心律失常數(shù)據(jù)庫(kù)中標(biāo)注的心律失常類型與AAMI分類標(biāo)準(zhǔn)對(duì)應(yīng)關(guān)系如表1所示。
2 本文方法
本文方法包括預(yù)處理、 特征提取、 特征融合和診斷分類4個(gè)模塊,系統(tǒng)框架如圖1所示。
2.1 數(shù)據(jù)預(yù)處理
2.1.1 ECG濾波
原始ECG因采集過程中受到外界干擾存在大量噪聲,其中主要包括基線漂移和肌電干擾。這些噪聲會(huì)嚴(yán)重影響ECG質(zhì)量,導(dǎo)致模型對(duì)ECG波形識(shí)別和關(guān)鍵特征的提取存在誤差,進(jìn)而影響心律失常診斷的準(zhǔn)確率。本文中選用中值濾波器對(duì)ECG進(jìn)行濾波處理,為了防止出現(xiàn)邊緣干擾,濾波前需要擴(kuò)展ECG的邊緣數(shù)據(jù),擴(kuò)展公式[22]為
式中: d(n)為ECG擴(kuò)展后第n(n=1, 2, 3, …, L+k-1)個(gè)樣本點(diǎn), L為每條ECG記錄長(zhǎng)度,本文中取L=650 000, k為中值濾波窗口,一般取采樣頻率的30%,本文中取k=108。
中值處理公式[22]為
s(o)=fmed{fsort[d(o):d(o+k-1)]} ,(2)
式中: s(o)為第o(o=1, 2, …, L)個(gè)點(diǎn)位濾波后數(shù)據(jù); fmed為取中位數(shù)函數(shù); fsort為排序函數(shù)。
圖2所示為原始ECG與濾波后ECG的對(duì)比。從圖中可以看出,中值濾波器對(duì)ECG中存在的基線漂移和肌電干擾等噪聲具有良好的濾波效果。
2.1.2 數(shù)據(jù)歸一化
ECG采集設(shè)備及患者狀態(tài)的差異導(dǎo)致不同記錄之間的信號(hào)幅值存在偏差,為了將信號(hào)幅度限制在相同范圍內(nèi),減小噪聲影響,對(duì)所有信號(hào)進(jìn)行歸一化處理,歸一化公式[22]為
式中: s*(o)為歸一化幅值; smin為當(dāng)前記錄中樣本幅值最小值; smax為當(dāng)前記錄中樣本幅值最大值。
2.1.3 心拍分割
完整ECG記錄由若干個(gè)心拍組成,單個(gè)完整心拍主要包括P波、 QRS波群和T波,其中QRS波群中R波波形最為顯著。心拍分割一般以R波為中心,劃分左、 右閾值截取ECG信號(hào)。計(jì)算公式為
Uu(δ)=s*(Ru-90+δ),(4)
式中: Uu(δ)為第u(u=1, 2, 3, …, Nbeat)個(gè)心拍中第δ(δ=1, 2, …, H)個(gè)采樣點(diǎn)數(shù)據(jù), Nbeat為當(dāng)前ECG記錄的R峰標(biāo)記數(shù)量,H為單個(gè)心拍的樣本個(gè)數(shù),本文中取H=180; Ru為第u個(gè)心拍的位置。
2.2 特征提取
ECG信號(hào)特征的質(zhì)量對(duì)心律失常診斷的準(zhǔn)確率至關(guān)重要。為了提高診斷的準(zhǔn)確率,必須保留信號(hào)中的關(guān)鍵特征,模型才能從中更加準(zhǔn)確地學(xué)習(xí)數(shù)據(jù)規(guī)律,從而提高診斷的精度。心率變異性(heart rate variability,HRV)描述一段時(shí)間內(nèi)RR間期變化規(guī)律, 是ECG最為重要的節(jié)律性特征。高階統(tǒng)計(jì)量(higher-order statistics,HOS)廣泛應(yīng)用于信號(hào)處理和模式識(shí)別的特征提取,主要用于提取ECG的形態(tài)學(xué)特征。局部二進(jìn)制(local binary patterns,LBP) 是一種高效的局部紋理特征描述方法,具有較高的特征識(shí)別能力和較低的計(jì)算復(fù)雜度,主要用于提取心拍的細(xì)節(jié)特征。
2.2.1 HRV特征
HRV反映心臟自主神經(jīng)系統(tǒng)的功能狀態(tài)及心臟的節(jié)律性和穩(wěn)定性,用于評(píng)估心血管疾病的患病風(fēng)險(xiǎn)。HRV特征計(jì)算以當(dāng)前R峰為中心點(diǎn),取鄰域5 min內(nèi)所有 RR間期計(jì)算以下4項(xiàng)指標(biāo)[23]:
1)RR間期平均值Rmean,
式中: Nrr為當(dāng)前鄰域內(nèi)RR間期數(shù)量; Rj為鄰域內(nèi)第j(j=1,2,…,Nrr)個(gè)RR間期。
2)RR間期標(biāo)準(zhǔn)差Rsdnn,
3)RR間期差分值標(biāo)準(zhǔn)差Rsdsd,
式中Zj為第j個(gè)RR間期差分值。
4)RR間期差分值的均方根Rrmssd,
將以上4項(xiàng)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化,進(jìn)而得到HRV標(biāo)準(zhǔn)化特征。使用8維數(shù)據(jù)描述每個(gè)心拍的HRV特征和HRV標(biāo)準(zhǔn)化特征。
2.2.2 HOS特征
偏度和峰度是HOS中常用的2個(gè)基本統(tǒng)計(jì)量。偏度反映ECG分布的不對(duì)稱程度,即ECG的左右偏移的情況; 峰度反映信號(hào)的尖銳程度,即ECG與正態(tài)分布相比尖銳或平緩的程度。每段的峰度K和偏度S的計(jì)算公式[24]分別為
式中: Nhos為該段采樣數(shù); Uu(t)為第u個(gè)心拍的第t(t=1,2,…,Nhos)個(gè)采樣點(diǎn)的值; Uu,mean為第u個(gè)心拍中該數(shù)據(jù)段的平均值。
本文方法將單個(gè)心拍信號(hào)分為5段,計(jì)算每段的峰度和偏度值。使用10維數(shù)據(jù)描述每個(gè)心拍的 HOS特征。
2.2.3 LBP特征
由于不同類別的心拍信號(hào)的紋理信息差異明顯,因此,計(jì)算心拍信號(hào)的LBP特征能更加完整地捕捉不同心拍信號(hào)的細(xì)節(jié)信息。心拍信號(hào)的LBP特征Lp計(jì)算公式[25]為
式中: Nlbp為L(zhǎng)BP的鄰域; sign為符號(hào)函數(shù); Uu(z)為第z(z=1,2,…,Nlbp)個(gè)采樣點(diǎn)的值; Uu(a)為第u個(gè)心拍中第a(a=1,2,…,180)個(gè)采樣點(diǎn)的值。
鄰域?yàn)?的LBP會(huì)產(chǎn)生256種二進(jìn)制模式。為了降低維度及簡(jiǎn)化計(jì)算,選用等價(jià)局部二進(jìn)制(ULBP)作為心拍信號(hào)的特征提取方法,將二進(jìn)制模式由256維降至59維,使用59維數(shù)據(jù)描述每個(gè)心拍的ULBP特征。
2.3 特征融合
特征提取模塊完成3類77維特征的融合,每類特征的描述及維度如表2所示。對(duì)不同類型的特征融合采用特征拼接的方式,拼接公式為
Ffuse=(Fhrv, Fhos, Fulbp) ,(12)
式中: Ffuse為融合特征,融合特征維度為77; Fhrv為8維HRV特征; Fhos為10維HOS特征; Fulbp為59維LBP特征。
2.4 建模與優(yōu)化
2.4.1 模型搭建
Adaboost是一種集成分類算法,廣泛應(yīng)用于人臉識(shí)別、 非平衡數(shù)據(jù)流分類、 故障診斷等領(lǐng)域。Adaboost將若干弱分類器集成為強(qiáng)分類器,集成過程中動(dòng)態(tài)地調(diào)整每個(gè)分類器的權(quán)重,實(shí)現(xiàn)更高精度的分類。訓(xùn)練模型時(shí),將融合的心拍信號(hào)特征及心拍標(biāo)簽作為模型的數(shù)據(jù)輸入,通過不斷訓(xùn)練弱分類器的參數(shù)與權(quán)重得到最優(yōu)集成模型。
2)循環(huán)B輪訓(xùn)練弱分類器。每輪循環(huán)的編號(hào)為b,b=(1,2,…,B)。弱分類器總數(shù)定義為C,每個(gè)弱分類器的編號(hào)為c(c=1,2,…,C),循環(huán)內(nèi)容如下:
①在第b輪樣本權(quán)重wb(xi)基礎(chǔ)上訓(xùn)練弱分類器hc(xi)。
計(jì)算每個(gè)弱分類器hc(xi)對(duì)于心拍數(shù)據(jù)的分類誤差,計(jì)算公式[26]為
②選用心拍數(shù)據(jù)分類誤差最小的弱分類器作為第b輪訓(xùn)練的基分類器Hb,其分類誤差為eb。
③計(jì)算第b輪基分類器的權(quán)重αb,公式[26]為
式中: eb為第b輪基分類器的誤差; A表示心律失常類別,本文中取A=4。
④計(jì)算基于基分類器的權(quán)重更新心拍樣本權(quán)重,公式[26]為
3)將B輪循環(huán)的基分類器集成為強(qiáng)分類器f(xi),計(jì)算公式[26]為
式中Hb(xi)為第b輪的基分類器。
強(qiáng)分類器f(xi)的輸出結(jié)果即為模型對(duì)心拍數(shù)據(jù)診斷的最終結(jié)果。
2.4.2 使用PSO優(yōu)化Adaboost模型
使用PSO算法優(yōu)化Adaboost診斷模型參數(shù), 將多個(gè)待優(yōu)化的模型參數(shù)坐標(biāo)作為粒子群算法的輸入集合, 求解Adaboost模型在心拍數(shù)據(jù)集上最小的診斷錯(cuò)誤率。 PSO優(yōu)化Adaboost模型[27]具體步驟如下:
1)定義適應(yīng)度函數(shù)。適應(yīng)度函數(shù)定義為模型診斷心拍訓(xùn)練集的錯(cuò)誤率。
2)定義參數(shù)空間。 選定弱分類器, 分析PSO優(yōu)化的弱分類器和全局分類器的參數(shù)名稱與參數(shù)范圍, PSO優(yōu)化的參數(shù)名稱及取值范圍如表3所示。
3)初始化粒子。隨機(jī)生成一定數(shù)量的粒子,初始化每個(gè)粒子的參數(shù),計(jì)算每個(gè)粒子的適應(yīng)度函數(shù)值,生成個(gè)體最優(yōu)和全局最優(yōu)。
4)更新粒子的位置和速度。為了提高PSO的收斂速度,引入改進(jìn)PSO,使用自適應(yīng)判定條件動(dòng)態(tài)的調(diào)整粒子速度和位置。自適應(yīng)判定條件E計(jì)算公式[28]為
式中: ffit為粒子適應(yīng)度函數(shù); Q為粒子群中粒子數(shù); lq為第q(q=1,2,…,Q)個(gè)粒子位置。
定義動(dòng)態(tài)條件的閾值,若判定條件大于閾值,則說明當(dāng)前粒子的適應(yīng)度函數(shù)大于整體適應(yīng)度函數(shù),應(yīng)增強(qiáng)其全局開發(fā)能力,速度和位置計(jì)算公式[29]為
當(dāng)判定條件小于閾值時(shí)增強(qiáng)算法局部探索能力,速度和位置計(jì)算公式[29]為
5)評(píng)估新位置適應(yīng)度函數(shù)。計(jì)算每個(gè)粒子新位置的適應(yīng)度函數(shù),根據(jù)新的適應(yīng)度值更新局部最優(yōu)解和全局最優(yōu)解。
6)判斷終止條件。當(dāng)達(dá)到最大迭代次數(shù)或適應(yīng)度函數(shù)達(dá)到某閾值時(shí)終止算法,若未達(dá)到結(jié)束條件重復(fù)執(zhí)行4)、 5)、 6)。算法終止時(shí)輸出全局最優(yōu)粒子參數(shù),更新Adaboost模型參數(shù)。PSO優(yōu)化Adaboost流程如圖3所示。
7)根據(jù)PSO優(yōu)化Adaboost參數(shù)的結(jié)果,使用最優(yōu)參數(shù)訓(xùn)練Adaboost模型,模型的最優(yōu)參數(shù)如表4所示。
3 實(shí)驗(yàn)結(jié)果及分析
本文中使用準(zhǔn)確率、 靈敏度和陽(yáng)性預(yù)測(cè)值3個(gè)標(biāo)準(zhǔn)評(píng)估模型分類性能,計(jì)算公式[30]分別為
式中: Aacc為準(zhǔn)確率; NTP為模型將正類預(yù)測(cè)為正類的樣本數(shù); NTN為模型將負(fù)類預(yù)測(cè)為負(fù)類的樣本數(shù); NFP為模型將負(fù)類預(yù)測(cè)為正類的樣本數(shù); NFN為模型將正類預(yù)測(cè)為負(fù)類的樣本數(shù); Ssen為靈敏度; Pppv為陽(yáng)性預(yù)測(cè)值。
本文方法與現(xiàn)有方法在MIT-BIH心律失常數(shù)據(jù)庫(kù)中的測(cè)試準(zhǔn)確率對(duì)比如表5所示。從表中可以看出,本文方法的準(zhǔn)確率為98.2%,與現(xiàn)有方法相比,本文方法的整體準(zhǔn)確率顯著提高。圖4為優(yōu)化后的模型診斷心拍數(shù)據(jù)的混淆矩陣。本文中選用的對(duì)比文獻(xiàn)中均使用MIT-BIH心律失常數(shù)據(jù)庫(kù)作為模型的訓(xùn)練數(shù)據(jù)集,并且實(shí)驗(yàn)遵循AAMI分類標(biāo)準(zhǔn),實(shí)驗(yàn)標(biāo)準(zhǔn)統(tǒng)一,因此實(shí)驗(yàn)結(jié)果具有說服力。
表6列出了不同方法對(duì)各類心律失常的診斷靈敏度和陽(yáng)性預(yù)測(cè)值。 文獻(xiàn)[27]中使用單一模型實(shí)現(xiàn)心律失常診斷, 在對(duì)樣本量較多的N、 V類診斷時(shí)具有較高的診斷準(zhǔn)確率與陽(yáng)性預(yù)測(cè)值, 但在S、 F類樣本量較少的心律失常診斷的準(zhǔn)確度較差。 文獻(xiàn)[31]中使用極限梯度提升模型診斷心律失常,雖然整體準(zhǔn)確率不是最優(yōu), 但將S類的靈敏度提高到91.7%, F類的靈敏度提高到61.6%。 本文方法對(duì)N、 S、 V、 F類的診斷靈敏度分別為99.7%、 72.9%、 95.6%、 50.3%, 陽(yáng)性預(yù)測(cè)值分別為98.5%、 96.1%、 95.5%、 92.0%, 對(duì)各類心律失常的診斷靈敏度和陽(yáng)性預(yù)測(cè)值都有不同程度的提高, 尤其是對(duì)S、 F類的陽(yáng)性預(yù)測(cè)值提高效果更為明顯。對(duì)比結(jié)果表明, 本文方法不僅提高了心律失常診斷的準(zhǔn)確率, 還顯著提高了少量樣本類別的診斷靈敏度和陽(yáng)性預(yù)測(cè)值, 改善了不平衡心拍數(shù)據(jù)集診斷結(jié)果較差的現(xiàn)狀。
4 結(jié)論
本文中針對(duì)現(xiàn)有方法對(duì)不平衡心拍數(shù)據(jù)集診斷準(zhǔn)確率較差的現(xiàn)狀,提出了基于優(yōu)化自適應(yīng)模型的心律失常輔助診斷方法,通過與現(xiàn)有方法的對(duì)比分析,研究特征融合及診斷模型選擇與優(yōu)化對(duì)心律失常診斷準(zhǔn)確率的影響,得到以下主要結(jié)論:
1)分析特征提取重要性發(fā)現(xiàn),特征融合可以在減少數(shù)據(jù)維度的基礎(chǔ)上最大程度地保留完整的ECG特征。
2)探索不同模型對(duì)心律失常的診斷準(zhǔn)確率發(fā)現(xiàn),單一模型的泛化能力較差,主要表現(xiàn)在單一模型對(duì)少量樣本數(shù)據(jù)類別的診斷準(zhǔn)確率不高,而Adaboost等集成模型可以提高模型對(duì)不平衡數(shù)據(jù)集診斷準(zhǔn)確率,本文中使用集成模型Adaboost將每個(gè)類別的陽(yáng)性預(yù)測(cè)值均提升到90%以上,心拍診斷的整體準(zhǔn)確率提升到98.2%。
3)采用PSO優(yōu)化Adaboost模型可以簡(jiǎn)化參數(shù)空間,避免手動(dòng)調(diào)節(jié)參數(shù)的盲目性和費(fèi)時(shí)性,使用最小的代價(jià)獲取最優(yōu)的模型參數(shù)。
參考文獻(xiàn):
[1] LIN C C, YANG C M. Heartbeat classification using normalized RR intervals and morphological features[J]. Mathematical Problems in Engineering, 2014, 2014: 712474.
[2] CHEN S S, HUA W, LI Z, et al. Heartbeat classification using projected and dynamic features of ECG signal[J]. Biomedical Signal Processing and Control, 2017, 31:165.
[3] FILOS D, CHOUVARDA I, TACHMATZIS D, et al. Beat-to-beat P-wave morphology as a predictor of paroxysmal atrial fibrillation[J]. Computer Method and Programs in Biomedicine, 2017, 151: 111.
[4] QIN Q, LI J Q, ZHANG L, et al. Combining low-dimensional wavelet features and support vector machine for arrhythmia beat classification[J]. Scientific Reports, 2017, 7(1): 6067.
[5] KALIDAS V, TAMIL L S. Detection of atrial fibrillation using discrete-state Markon models and random forests[J]. Computers in Biology and Medicine, 2019, 113: 103386.
[6] ADNANE M, BELOUCHRANI A. Heartbeats classification using QRS and T waves autoregressive features and RR interval features[J]. Expert Systems, 2017, 34 (6): e12219.
[7] JI S S, LI R C, SHEN S Y, et al. Heartbeat classification based on multifeature combination and stacking-DWKNN algorithm[J]. Journal of Healthcare Engineering, 2021, 2021: 8811837.
[8] ZHU W L, CHEN X H, WANG Y, et al. Arrhythmia recognition and classification using ECG morphology `and segment feature analysis[J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2019, 16(1): 131.
[9] LI H Q, FENG X L, CAO L, et al. A new ECG signal classification based on WPD and ApEn feature extraction[J]. Circuits, Systems, and Signal Processing, 2016, 35(1): 339.
[10] SHARMA M, TAN R S, ACHARYA U R. Automated heartbeat classification and detection of arrhythmia using optimal orthogonal wavelet filters[J]. Informatics in Medicine Unlocked, 2019, 16: 100221.
[11] MOHEBBANAAZ, RAJANI KUMARI L V, PADMA SAI Y. Classification of arrhythmia beats using optimized k-nearest neighbor classifier[M]//UDGATA S K, SETHI S, SRIRAMA S N. Intelligent Systems: Lecture Notes in Networks and Systems, Vol 185. Singapore: Springer, 2021: 349.
[12] KIRANYAZ S, INCE T, GABBOUJ M. Real-time patient-specific ECG classification by 1-D convolutional neural networks[J]. IEEE Transactions on Biomedical Engineering, 2016, 63(3): 664.
[13] ACHARYA U R, OH S L, HAGIWARA Y, et al. A deep convolutional neural network model to classify heartbeats[J]. Computers in Biology and Medicine, 2017, 89: 389.
[14] YILDIRIM . A novel wavelet sequence based on deep bidirectional LSTM network model for ECG signal classification[J]. Computers in Biology and Medicine, 2018, 96: 189.
[15] MARTIN H, IZQUIERDO W, CABRERIZO M, et al. Near real-time single-beat myocardial infarction detection from single-lead electrocardiogram using long short-term memory neural network[J]. Biomedical Signal Processing and Control, 2021, 68: 102683.
[16] MONDJAR-GUERRA V, NOVO J, ROUCO J, et al. Heartbeat classification fusing temporal and morphological information of ECGs via ensemble of classifiers[J]. Biomedical Signal Processing and Control, 2019, 47: 41.
[17] 陶亮, 劉寶寧, 梁瑋. 基于CNN-LSTM 混合模型的心律失常自動(dòng)檢測(cè)[J]. 山東大學(xué)學(xué)報(bào)(工學(xué)版), 2021, 51(3): 30.
[18] XIE T T, LI R C, SHEN S Y, et al. Intelligent analysis of premature ventricular contraction based on features and random forest[J]. Journal of Healthcare Engineering, 2019, 2019: 5787582.
[19] GAJOWNICZEK K, GRZEGORCZYK I, ZABKOWSKI T, et al. Weighted random forests to improve arrhythmia classification[J]. Electronics, 2020, 9(1): 99.
[20] YANG P, WANG D, ZHAO W B, et al. Ensemble of kernel extreme learning machine based random forest classifiers for automatic heartbeat classification[J]. Biomedical Signal Processing and Control, 2021, 63: 102138.
[21] DE CHAZAL P, O’DWYER M, REILLY R B. Automatic classification of heartbeats using ECG morphology and heartbeat interval features[J]. IEEE Transactions on Biomedical Engineering, 2004, 51(7): 1196-1198.
[22] 馬金偉. 基于深度學(xué)習(xí)的心電信號(hào)識(shí)別分類算法研究[D]. 重慶: 重慶理工大學(xué), 2019: 23-25.
[23] 孫宏健. 基于特征融合的心電信號(hào)房顫自動(dòng)檢測(cè)算法研究[D]. 濟(jì)南: 山東大學(xué), 2021: 16-17.
[24] 閆紅梅, 何明一. 基于聚類和聯(lián)合偏度與峰度指數(shù)的高光譜數(shù)據(jù)波段選擇算法[J]. 信號(hào)處理, 2023, 39(1): 4.
[25] KAYA Y, UYAR M, TEKIN R, et al. 1D-local binary pattern based feature extraction for classification of epileptic EEG signals[J]. Applied Mathematics amp; Computation, 2014, 243: 212.
[26] HASTIE T, ROSSET S, ZHU J, et al. Multi-class adaboost[J]. Statistics and Its Interface, 2009, 2(3): 351-353.
[27] 張均. 基于粒子群尋優(yōu)的AdaBoost算法研究[D]. 寧波: 寧波大學(xué), 2020.
[28] LIU H, ZHANG X W, TU L P. A modified particle swarm optimization using adaptive strategy[J]. Expert Systems with Applications. 2020, 152: 113359.
[29] 李二超, 高振磊. 改進(jìn)粒子速度和位置更新公式的粒子群優(yōu)化算法[J]. 南京師大學(xué)報(bào)(自然科學(xué)版), 2022, 45(1): 120-123.
[30] WANG L, YU Y, LIU W, et al. Three-heartbeat multilead ECG recognition method for arrhythmia classification[J]. IEEE Access, 2022, 10: 44057-44058.
[31] SHI H T, WANG H R, HUANG Y X, et al. A hierarchical"" method based on weighted extreme gradient boosting in ECG heartbeat classification [J]. Computer Methods and Programs in Biomedicine, 2019, 171: 6-9.