曾啟明
一種基于深度學(xué)習(xí)的心電信號分類方法*
曾啟明
(深圳職業(yè)技術(shù)學(xué)院電子與通信工程學(xué)院,廣東 深圳 518055)
提出了一種基于深度學(xué)習(xí)人工神經(jīng)網(wǎng)絡(luò)的心電信號分類方法.方法直接從原始數(shù)據(jù)抽象網(wǎng)絡(luò)各層次上的基底特征,取代了基本波形定位和特征的人為選定.隱含層節(jié)點(diǎn)數(shù)逐級下降和深度學(xué)習(xí)的多隱含層深架構(gòu)的采用,有效避免了已有方法中的定域性問題和網(wǎng)絡(luò)規(guī)模.基于MIT-BIH數(shù)據(jù)庫的實(shí)驗(yàn)表明,與傳統(tǒng)BP網(wǎng)絡(luò)和蟻群算法的分類方法相比,該方法總分類精度達(dá)93.3%.
心電信號;深度學(xué)習(xí);人工神經(jīng)網(wǎng)絡(luò);分類
心電信號(Electrocardiography,ECG)是人類心臟進(jìn)行生理活動時(shí),通過體表電極采集所得的時(shí)變電位信號,包含了豐富的生物學(xué)信息,在醫(yī)學(xué)診斷和研究中具有重要意義.現(xiàn)有的ECG信號分類方法主要分為兩類:基于特征提取的分類方法[1]和基于人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)的分類方法[2].基于特征提取的ECG信號分類方法,包含特征提取和分類預(yù)測2個(gè)主要部分.特征提取是指檢測定位ECG信號的P波、QRS波群、T波及U波4種基本波形,以此獲取預(yù)定義的特征信息.常用的波形檢測算法包括峰值檢測、小波分析等.而所提取特征一般包括:4種基本波形的時(shí)長與形態(tài)、ST段時(shí)長、PR間期時(shí)長、QT間期時(shí)長、以及RR間期時(shí)長等.分類預(yù)測是指使用機(jī)器學(xué)習(xí)方法對所提取的特征信息進(jìn)行分類,以判定是否患有特定疾病.常用算法包括支持向量機(jī)(Support Vector Machine,SVM)[3]和神經(jīng)網(wǎng)絡(luò)[4]等.基于ANN的ECG信號分類方法,一般使用原始心電信號或其特征數(shù)據(jù)作為輸入,并將特定疾病作為分類輸出.與機(jī)器學(xué)習(xí)算法相比,基于ANN的檢測方法對基本波形定位精度要求較低,泛化性能良好,且可同時(shí)判定多種目標(biāo)疾病狀態(tài).傳統(tǒng)ANN通常使用反向傳播算法(Back-Propagation,BP)[5]進(jìn)行訓(xùn)練.
現(xiàn)有基于特征提取與機(jī)器學(xué)習(xí)的ECG信號分類方法,其缺點(diǎn)包括兩方面:首先、特征提取依賴于4種基本波形的檢測與定位.若波形定位不準(zhǔn)確,則所提取的特征信息也將有所偏差,導(dǎo)致分類性能顯著下降.而心電信號由人體實(shí)際生理過程產(chǎn)生,其在每個(gè)心動周期中的數(shù)據(jù)都包含一定的差異,且由于目標(biāo)個(gè)體、采集方法等原因可能導(dǎo)致多種失真,造成預(yù)設(shè)的波形定位算法失效.從而影響檢測結(jié)果;其次,醫(yī)用ECG信號的采集頻率應(yīng)達(dá)400Hz以上,且需連續(xù)獲取30 s的數(shù)據(jù),從而產(chǎn)生至少12000個(gè)數(shù)據(jù)點(diǎn).ECG信號的分析屬于非線性高維機(jī)器學(xué)習(xí)問題.若分類算法缺少稀疏化限制,則極易產(chǎn)生定域性問題,導(dǎo)致泛化性能嚴(yán)重下降,所需訓(xùn)練樣本數(shù)顯著上升.而稀疏化是很多現(xiàn)有機(jī)器學(xué)習(xí)算法所不具備的.
現(xiàn)有基于ANN的ECG信號分類方法,其主要缺點(diǎn)在于:首先,傳統(tǒng)ANN一般僅具有一個(gè)隱含層,屬于淺架構(gòu).對于心電信號一類的非線性特征空間問題,需大量隱層節(jié)點(diǎn)才能進(jìn)行有效建模,且其數(shù)量隨輸入節(jié)點(diǎn)的增加呈指數(shù)增長.當(dāng)心電信號維數(shù)較高時(shí),ANN的輸入節(jié)點(diǎn)數(shù)也高,其所需的架構(gòu)規(guī)模往往遠(yuǎn)超合理范圍,且用于訓(xùn)練的樣本數(shù)量也將極為龐大.導(dǎo)致檢測方法難以實(shí)際應(yīng)用.其次,傳統(tǒng)ANN通常使用反向傳播算法進(jìn)行訓(xùn)練,可在淺架構(gòu)中獲得良好的參數(shù)優(yōu)化效果.但對于包含多個(gè)隱含層的深度學(xué)習(xí)ANN網(wǎng)絡(luò),則難以獲得令人滿意的結(jié)果.從而影響了疾病檢測準(zhǔn)確率.
為避免上述問題,近年來學(xué)術(shù)界對ANN進(jìn)行了有效擴(kuò)展,提出了多隱含層深度學(xué)習(xí)(Deep Learning)的概念.本文基于深度學(xué)習(xí)算法,提出了一種用于ECG信號的高效分類方法.
為避免人為預(yù)設(shè)特征帶來的問題,應(yīng)將采集獲得的原始心電信號,直接作為深度學(xué)習(xí)ANN網(wǎng)絡(luò)的輸入數(shù)據(jù),并通過多隱含層結(jié)構(gòu)自動提取其中的重要信息,以獲得更佳的檢測效果.可從原始數(shù)據(jù)中自動抽象各層次上的基底特征,是深度學(xué)習(xí)ANN的主要優(yōu)勢之一.而這一方法也避免了因基本波形定位失準(zhǔn),造成預(yù)設(shè)特征提取發(fā)生偏差的狀況.
在將深度學(xué)習(xí)ANN用于實(shí)際疾病檢測前,需先使用帶標(biāo)注的心電信號樣本集對其進(jìn)行訓(xùn)練.設(shè)若有原始心電信號集Θ= {(1,1), (2,2),(3,3), …,(,)},其中為第∈個(gè)心電信號樣本,其維度為;為對應(yīng)的標(biāo)簽矢量,包含了需檢測的多種疾病具體狀態(tài)(如是否患有心室肥大,是否患有高、低鈣血癥等).在本方法中,首先使用特征標(biāo)準(zhǔn)化對各原始信號進(jìn)行預(yù)處理,使其具有0均值及單位方差:
其中,f為樣本在第維上的信號值;函數(shù)E(·)表示矢量均值;var(·)表示矢量方差;= {f|∈}為Θ中所有信號樣本在第維上數(shù)值所構(gòu)成的矢量.處理后,信號取值范圍變?yōu)閇-1, 1].
使用PCA對其進(jìn)行降維與白化.因具有0均值,故計(jì)算協(xié)方差矩陣Σ為:
設(shè)定降維后信號樣本維數(shù)為,則可計(jì)算Σ的前個(gè)特征矢量為1,2, …,,其對應(yīng)特征值為1,2, …,λ.通過構(gòu)造酉矩陣U = [1,2, …,]×N,可對各心電信號進(jìn)行PCA白化降維有:
其中為正則化常數(shù),一般取值為= 1E-5.
最后,將預(yù)處理后的信號樣本與標(biāo)簽矢量,構(gòu)成輸入心電信號集Θ={(1,1), (2,2), (3,3), … , (',)},用于深度學(xué)習(xí)ANN網(wǎng)絡(luò)的訓(xùn)練.
使用棧式自編碼器構(gòu)造深度學(xué)習(xí)ANN網(wǎng)絡(luò),并采用BP算法訓(xùn)練各隱含層節(jié)點(diǎn)參數(shù)及進(jìn)行網(wǎng)絡(luò)整體微調(diào).如圖1所示,設(shè)若最終完整的ANN網(wǎng)絡(luò)具有1個(gè)輸入層,1個(gè)輸出層,以及個(gè)隱含層.則需首先使用自編碼算法,依次單獨(dú)設(shè)計(jì)各隱含層中節(jié)點(diǎn)的參數(shù).
對于第∈個(gè)隱含層,設(shè)其節(jié)點(diǎn)數(shù)為P,構(gòu)造3層自編碼訓(xùn)練網(wǎng)絡(luò)如圖2所示.其輸入為第-1隱含層的P-1個(gè)節(jié)點(diǎn)輸出-1=[h-1,1,h-1,2, …,h-1,Pl-1],有P-1>P.由于預(yù)處理后的心電信號取值范圍為[-1, 1],故選取雙曲正切函數(shù)(tanh)作為自編碼訓(xùn)練網(wǎng)絡(luò)隱含層與輸出層的激活函數(shù).則隱含層節(jié)點(diǎn)輸出為:
其中,1為隱含層權(quán)值矩陣;1為隱含層偏置矢量.
類似有輸出層節(jié)點(diǎn)為:
其中,2為輸出層權(quán)值矩陣,2為輸出層偏置矢量.輸出矢量= [O,1,O,2, …,O,Pl-1]同樣包含P-1個(gè)節(jié)點(diǎn).
在自編碼訓(xùn)練算法中,需使與-1盡可能接近.設(shè)定差異代價(jià)函數(shù)有:
圖1 使用棧式自編碼器訓(xùn)練深度學(xué)習(xí)ANN
圖2 自編碼訓(xùn)練網(wǎng)絡(luò)
其中,‖·‖2表示矢量的2范數(shù).此外,為使隱含層節(jié)點(diǎn)的表達(dá)盡可能稀疏,需加入1正則化約束.實(shí)驗(yàn)結(jié)果表明,1正則化可在心電信號數(shù)據(jù)上,獲得比其它稀疏化約束更佳的效果.故設(shè)定稀疏代價(jià)函數(shù)為隱含層節(jié)點(diǎn)輸出矢量的1范數(shù):
從而完整代價(jià)函數(shù)為:
其中,= {1,2},= {1,2}為自編碼訓(xùn)練網(wǎng)絡(luò)模型.參數(shù)為拉格朗日乘數(shù),用于控制隱含層輸出的稀疏程度.通過使用BP算法訓(xùn)練與,可使此代價(jià)函數(shù)最小化,亦即獲得最佳的自編碼訓(xùn)練結(jié)果.
通過使訓(xùn)練網(wǎng)絡(luò)輸出與輸入-1最大近似,并設(shè)定隱含層節(jié)點(diǎn)數(shù)P嚴(yán)格小于輸入節(jié)點(diǎn)數(shù)P-1,所獲得的隱含層輸出可視作輸入-1更為抽象的表達(dá).而1正則化的引入,則保證了這一表達(dá)具有充分的稀疏性.在當(dāng)前訓(xùn)練完成后,隱含層輸出矢量輸出將被用于下一隱含層 (+1層) 的訓(xùn)練.而隱含層節(jié)點(diǎn)及其參數(shù)1、1則保存用于構(gòu)造完整的深度學(xué)習(xí)ANN網(wǎng)絡(luò).
如圖3所示,在訓(xùn)練并構(gòu)造疾病檢測深度學(xué)習(xí)ANN時(shí),首先將預(yù)處理后的心電信號集Θ中每個(gè)樣本對 (',),作為首隱含層 (= 1) 的輸入.即有0=,∈Θ,0=.而后,構(gòu)造訓(xùn)練網(wǎng)絡(luò),并使用自編碼算法設(shè)計(jì)隱含層節(jié)點(diǎn)的參數(shù),得到權(quán)值矩陣11及偏置矢量11.其方法如上一小節(jié)所述.則對于每個(gè)輸入的心電信號樣本',都有對應(yīng)隱含層節(jié)點(diǎn)輸出矢量為1.從而構(gòu)造= 1層的自學(xué)習(xí)信號集Φ1= {(11,1), (12,1), …, (1,)},用于下一隱含層的訓(xùn)練.
對于第∈ [2,]個(gè)隱含層,使用近似方法進(jìn)行訓(xùn)練.設(shè)若上一層所得的自學(xué)習(xí)信號集為Φ-1= {(-11,1), (-12,2), …, (1,)},則將其中每個(gè)輸出矢量-1,作為當(dāng)前自編碼訓(xùn)練網(wǎng)絡(luò)的輸入,用于設(shè)計(jì)隱含層節(jié)點(diǎn)參數(shù).其方法亦如上一小節(jié)所述,并可類似獲得權(quán)值矩陣1、偏置矢量1、以及自學(xué)習(xí)信號集Φ.重復(fù)這一過程直至=.
對于輸出層,設(shè)其輸入為最后隱含層 (=) 的自學(xué)習(xí)信號集Φ,包含了維疾病標(biāo)簽矢量= [t1,t2, …,t].則相應(yīng)構(gòu)造個(gè)輸出節(jié)點(diǎn),并根據(jù)各標(biāo)簽t∈選擇不同的節(jié)點(diǎn)類型:若t對應(yīng)疾病狀態(tài)集僅含= 2個(gè)獨(dú)立狀態(tài),如t= {1:正常,2:室上性早搏},則使用邏輯回歸輸出節(jié)點(diǎn);若t對應(yīng)疾病狀態(tài)集含有> 2個(gè)獨(dú)立狀態(tài),如t= {1:逸搏,2:正常,3:其他},則應(yīng)使用Softmax回歸輸出節(jié)點(diǎn).
圖3 構(gòu)造心電信號疾病檢測ANN網(wǎng)絡(luò)
由于邏輯回歸可視作Softmax回歸在僅有兩種疾病狀態(tài)時(shí)的特殊情況,故當(dāng)進(jìn)行任意第∈個(gè)輸出節(jié)點(diǎn)的參數(shù)訓(xùn)練時(shí),可使用相同的代價(jià)函數(shù)如下:
其中,J為差異代價(jià)函數(shù)有:
式中,為輸出節(jié)點(diǎn)的模型參數(shù)矩陣;為其在第∈行的行矢量,≥ 2為疾病狀態(tài)總個(gè)數(shù);b為偏置值.
函數(shù)1(O)為示性函數(shù),其中O為節(jié)點(diǎn)在輸入樣本時(shí)的輸出值,其值計(jì)算如下:
稀疏代價(jià)函數(shù)ρ定義為參數(shù)矩陣的1范數(shù):
通過將Φ中的每個(gè)樣本對 (,)作為訓(xùn)練輸入,可使用梯度下降法設(shè)計(jì)各輸出節(jié)點(diǎn)的最佳權(quán)值矩陣與偏置矢量,從而獲得良好分類檢測效果.
在對各層分別進(jìn)行訓(xùn)練后,將所得的個(gè)隱含層節(jié)點(diǎn)及其權(quán)值矩陣1與偏置矢量1,以及各輸出層節(jié)點(diǎn)及其參數(shù)矩陣θ與偏置值b,依次棧式疊加,構(gòu)成完整的心電信號疾病檢測ANN網(wǎng)絡(luò).最后,使用BP算法其整體參數(shù)進(jìn)行微調(diào),以進(jìn)一步提升分類準(zhǔn)確性.其過程與傳統(tǒng)ANN網(wǎng)絡(luò)相同.
在訓(xùn)練完成后,則此深度學(xué)習(xí)ANN網(wǎng)絡(luò)可用于多種疾病的有效檢測.對于新輸入的心電信號樣本,首先同樣使用矩陣U對其進(jìn)行白化降維預(yù)處理,而后送入ANN網(wǎng)絡(luò)進(jìn)行分析與并行分類,獲得對應(yīng)的疾病狀態(tài)矢量輸出為.則其數(shù)值有效描述了樣本所包含的多種疾病狀態(tài),可極大方便后續(xù)科研與臨床應(yīng)用.
本實(shí)驗(yàn)中,深度學(xué)習(xí)ANN網(wǎng)絡(luò)的訓(xùn)練樣本采用美國麻省理工學(xué)院的MIT-BIH心律失常數(shù)據(jù)庫[6],數(shù)據(jù)庫包含48組帶注釋的心電記錄,約65萬個(gè)采樣點(diǎn).實(shí)驗(yàn)平臺為Core i5-4570,8GB內(nèi)存的64位Windows7操作系統(tǒng),代碼基于Python語言編寫.
在分類目標(biāo)的設(shè)定上,以美國醫(yī)療儀器促進(jìn)協(xié)會推薦的5類ECG信號節(jié)拍為主要類別,結(jié)合MIT-BIH心律失常數(shù)據(jù)庫的信號特征,每個(gè)主要類別下細(xì)分為若干項(xiàng)次類別,具體設(shè)置見表1.在樣本數(shù)量上,訓(xùn)練過程截取數(shù)據(jù)庫中5類ECG信號的心搏個(gè)數(shù)各100個(gè),共500個(gè)樣本.測試集截取各類心搏個(gè)數(shù)各200個(gè),共1000個(gè)樣本.
為了評價(jià)基于深度學(xué)習(xí)的ECG分類方法性能,實(shí)驗(yàn)過程中采用了傳統(tǒng)的BP算法和蟻群算法[7]進(jìn)行測試.實(shí)驗(yàn)結(jié)果見表2,表中精度是指不同類別下正確分類的心搏數(shù)/心搏總數(shù),總的分類精度是指所有正確分類的心搏數(shù)/總心搏數(shù).
表1 ECG信號分類目標(biāo)設(shè)置
表2 ECG分類方法的性能比較 (%)
注:各類別精度下方括號內(nèi)的數(shù)字為正確分類的心搏個(gè)數(shù).
根據(jù)實(shí)驗(yàn)結(jié)果,基于深度學(xué)習(xí)ANN網(wǎng)絡(luò)的ECG分類方法的總分類精度達(dá)93.21%,在性能上要明顯優(yōu)于現(xiàn)有基于BP網(wǎng)絡(luò)和蟻群算法的相關(guān)分類方法.在未分類心跳(類別E)的分類精度(84%)明顯低于其他類別,這是由于樣本特征設(shè)定的不確定性造成的.隨著樣本數(shù)量的增大,樣本特征的增加,本方法的識別率存在進(jìn)一步提高的可能.雖然深度學(xué)習(xí)ANN網(wǎng)絡(luò)的訓(xùn)練過程計(jì)算復(fù)雜度較高,但僅需離線進(jìn)行一次即可.而后續(xù)多次用于實(shí)際疾病檢測時(shí),其計(jì)算量遠(yuǎn)低于現(xiàn)有方法,可在更短的時(shí)間內(nèi)獲得更佳的分類結(jié)果.
本文提出的基于深度學(xué)習(xí)的ECG信號的分類方法具有3個(gè)特點(diǎn):1)實(shí)現(xiàn)了輸入數(shù)據(jù)中的重要特征的自動抽象,不依賴于人為選定,提高樣本準(zhǔn)確性;2)深度學(xué)習(xí)ANN網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)的逐級下降,有效保證了網(wǎng)絡(luò)在剩余維度上的處理性能,避免了現(xiàn)有方法中的定域性問題;3)深度學(xué)習(xí)的多隱含層深架構(gòu)可以有效控制網(wǎng)絡(luò)規(guī)模,其所需節(jié)點(diǎn)總數(shù)遠(yuǎn)低于傳統(tǒng)單隱含層ANN網(wǎng)絡(luò).
[1] Chazal P D, Reilly R B. A Patient-Adapting Heartbeat Classifier Using ECG Morphology and Heartbeat Interval Features[J].
, 2006,53(12):2535-2543.
[2] Kiranyaz S, Ince T, Gabbouj M.Real-time patient- specific ECG classification by 1-D convolutional neural networks[J].,2015,63(3):664-675.
[3] Shahbudin S, Shamsudin S N,Mohamad H. Discrimina- ting ECG signals using support vector machines [C]/IEEE Symposium on Computer Applications & Industrial Electronics (ISCAIE), IEEE, 2015.
[4] Chen TH,Zheng Y,Han LQ, et al.Research on noninvasive diagnosis for coronary heart disease based on neural network[J].,2008,21(6):513-517.
[5] Hari MR, Anurag T. ECG signal classification using wavelet transform and Back Propagation Neural Network [C]/2012 5th International Conference on Computers and Devices for Communication (CODEC), IEEE, 2013.
[6] Moody G B, Mark R G. The impact of the MIT-BIH arrhythmia database[J]., 2001,20(3):45-50.
[7] Berat D, Mehmet K. ECG beat classification using Ant Colony Optimization for Continuous Domains [C]/ National Conference on Electrical, Electronics and Computer Engineering, IEEE, 2011.
An ECG Signal Classification Method Based on Deep Learning
ZENG Qiming
()
An ECG signal classification method based on deep learning artificial neural network is proposed in this paper. Instead of manual selection of basic wave form positioning and features, this method directly abstracts the base features at each level of the network from the original data. A step-by-step reduction of the hidden layer nodes and multi-hidden layer architecture of the deep learning makes the new method effectively avoid the localization and large network scale in the existing methods. Experiments based on the MIT-BIH database show that, compared with the traditional BP network and ant colony algorithm classification methods, the proposed method can obtain better performance.
ECG; deep learning; ANN; classification
10.13899/j.cnki.szptxb.2019.05.003
2019-03-17
國家自然科學(xué)基金資助項(xiàng)目(61471245,U1201256),國家教學(xué)資源庫子項(xiàng)目(2017-B03),深職院校級科研資助項(xiàng)目(7017-22J190529991,9003-04180333,9003-04170301)
曾啟明(1984-),男,廣東清遠(yuǎn)人,博士,主要研究方向:人體體征信號處理.
TN391
A
1672-0318(2019)05-0014-05
深圳職業(yè)技術(shù)學(xué)院學(xué)報(bào)2019年5期