楊淑瑩 桂彬彬 陳勝勇
(天津理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 天津 300384)
(計(jì)算機(jī)視覺與系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室 天津 300384)
影響人類生命健康的各種疾病中,心血管病是最主要的疾病之一,據(jù)國(guó)家心血管病中心報(bào)告,心血管病死亡率在各種疾病中居首位,占居民疾病死亡構(gòu)成的40%以上[1]。在心血管疾病的早期發(fā)作中,心律失常的癥狀已在臨床實(shí)踐和病理學(xué)研究中廣泛報(bào)道。心律失常的臨床診斷主要依靠心電圖(Electro Cardio Graph,ECG)。許多心臟結(jié)構(gòu)或電生理異常在ECG上都有對(duì)應(yīng),對(duì)其進(jìn)行識(shí)別可以幫助診斷心臟疾病。在獲得患者的ECG后,往往需要專業(yè)的心臟病醫(yī)生結(jié)合大量的專業(yè)知識(shí)和臨床經(jīng)驗(yàn)才能做出合理的診斷,這需要投入相當(dāng)大的人力和精力。隨著計(jì)算機(jī)科學(xué)的不斷發(fā)展,心律失常自動(dòng)檢測(cè)任務(wù)已成為研究熱點(diǎn),它為醫(yī)生提供了越來越有效和可靠的診斷依據(jù),緩解了醫(yī)生的人力投入。
傳統(tǒng)上,ECG信號(hào)的自動(dòng)檢測(cè)任務(wù)通常需要3個(gè)步驟,即信號(hào)預(yù)處理、特征提取和模式分類[2]。ECG信號(hào)通常是經(jīng)過專用的心電記錄儀獲取的,因此原始信號(hào)中混雜了各種無效信號(hào)和噪聲信號(hào)。ECG信號(hào)中主要的噪聲包括心肌噪聲、基線漂移、工頻干擾、信道噪聲和運(yùn)動(dòng)偽影[3,4]。針對(duì) ECG信號(hào)比較典型的去噪方法包括低通濾波器、自適應(yīng)濾波器[5,6]。在最近的報(bào)道中,研究人員在去噪方法算法上做了新的研究,提出了如經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)、自適應(yīng)傅里葉分解和基于人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)的去噪方法[7–9]。
信號(hào)預(yù)處理之后就是提取ECG 的特征。ECG信號(hào)是一個(gè)關(guān)于時(shí)間的序列信號(hào)。通常一個(gè)心跳周期包括P波、QRS波和T波,這些波描述了一個(gè)心電周期的不同階段。ECG信號(hào)的形態(tài)學(xué)特征是其常見特征之一,如斜率、峰值、幅度、間隔。文獻(xiàn)[10]使用ECG信號(hào)的形態(tài)特征預(yù)先確定阻塞性睡眠呼吸暫停(Obstructive Sleep Apnea,OSA)程度。ECG的形態(tài)學(xué)特征可以使用Hermite變換、小波變換或離散余弦變化等算法得到[11,12]。此外諸如主成分分析、線性判別分析和獨(dú)立成分分析之類的特征選擇算法可從降低數(shù)據(jù)維度方面生成更高效、更緊湊的特征向量[13]。在新的研究中,Alquran等人[14]使用高階譜分析,計(jì)算ECG信號(hào)的雙譜和3階累積量得到2維圖像形式的特征信息,以便應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)進(jìn)行分類。取得ECG的特征之后,便是根據(jù)具體的檢測(cè)識(shí)別任務(wù)設(shè)計(jì)分類器。在現(xiàn)有的研究中,學(xué)者主要采用機(jī)器學(xué)習(xí)領(lǐng)域中的分類算法,例如線性與2次判別、支持向量機(jī)(Support Vector Machines,SVM)、隨機(jī)森林、貝葉斯網(wǎng)絡(luò)和ANN[15]。具體來講,文獻(xiàn)[16]在ECG的 (RR)間隔和小波變換特征上采用線性判別分析算法對(duì)3類ECG信號(hào)進(jìn)行檢測(cè)分類,并最終取得了93%的平均正確率。Nasiri等人[17]使用SVM和遺傳算法對(duì)從ECG信號(hào)提取的22維特征進(jìn)行分類,并在4分類心律失常檢測(cè)中達(dá)到了93%的正確率。Casas等人[18]在心室早期收縮(Premature Ventricular Contraction,PVC)檢測(cè)任務(wù)中提出了一種使用貝葉斯分類算法的技術(shù),在MIT-BIH數(shù)據(jù)庫的108,653個(gè)ECG分類搏動(dòng)中進(jìn)行訓(xùn)練測(cè)試并取得了95%的F1得分。Kumar等人[19]提出采用隨機(jī)森林算法進(jìn)行心律失常檢測(cè),并在六分類任務(wù)上獲得了92.16%準(zhǔn)確率的成績(jī)。
以上用于心電信號(hào)分類檢測(cè)的方法其分類結(jié)果完全依賴從心電信號(hào)中提取手動(dòng)特征,特征的質(zhì)量對(duì)分類檢測(cè)的可靠性和性能有重大影響。而在機(jī)器學(xué)習(xí)算法中,通過ANN,可以做到無需信號(hào)預(yù)處理和專家知識(shí)對(duì)ECG進(jìn)行分析,從而避免了對(duì)生物標(biāo)志物先驗(yàn)信息的需求,并且可以幫助發(fā)現(xiàn)新知識(shí)。在基于ANN的心律失常檢測(cè)研究中,Rajpurkar等人[20]研究了一種基于34層卷積神經(jīng)網(wǎng)絡(luò)的心律失常檢測(cè)算法,算法的測(cè)試結(jié)果在召回率(Recall)和準(zhǔn)確性(Precision)方面均超過了心臟病專家的平均表現(xiàn)。Huang等人[2]提出一種基于快速壓縮殘差卷積神經(jīng)網(wǎng)絡(luò)(Fast Compression ResNet,FCResNet)的精確心律失常分類方法,該網(wǎng)絡(luò)結(jié)構(gòu)由快速下采樣殘差網(wǎng)絡(luò)、快速下采樣卷積網(wǎng)絡(luò)、殘差網(wǎng)絡(luò)和分類網(wǎng)絡(luò)組成,將特征提取和分類進(jìn)行整合。文獻(xiàn)[14]應(yīng)用AlexNet神經(jīng)網(wǎng)絡(luò),將信號(hào)的雙譜圖作為其輸入,實(shí)驗(yàn)中得到了91.3%的平均準(zhǔn)確率。Mostayed等人[21]提出了一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的算法,該網(wǎng)絡(luò)由兩個(gè)雙向的長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)層組成,以檢測(cè)12導(dǎo)聯(lián)ECG信號(hào)中的病理。Singh等人[22]則比較了循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)、門控循環(huán)單元(Gated Recurrent Unit,GRU)、LSTM3種循環(huán)神經(jīng)網(wǎng)絡(luò)在心律失常分類上的表現(xiàn),分別得到了85.4%,82.5%和88.1%的準(zhǔn)確率。
上述關(guān)于ANN對(duì)ECG信號(hào)進(jìn)行分類檢測(cè)的應(yīng)用中,各種神經(jīng)網(wǎng)絡(luò)模型利用其在知識(shí)發(fā)現(xiàn)上的特點(diǎn)將特征提取和分類整合,減少了在算法設(shè)計(jì)中對(duì)專家知識(shí)和傳統(tǒng)特征提取算法的依賴?;谏疃壬窠?jīng)網(wǎng)絡(luò)的心律失常自動(dòng)分類算法可以通過具有多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)ECG信號(hào)中的隱含特征。然而,現(xiàn)有的研究中基于深度神經(jīng)網(wǎng)絡(luò)的分類檢測(cè)算法仍然存在不足之處。
(1)為了滿足現(xiàn)有卷積神經(jīng)網(wǎng)絡(luò)模型的2維輸入數(shù)據(jù)要求,通常采用ECG的2維圖像特征,該處理方法會(huì)破壞原始數(shù)據(jù)的一些有用信息和增加數(shù)據(jù)冗余,這會(huì)對(duì)模型的識(shí)別能力產(chǎn)生不利影響。
(2)ECG數(shù)據(jù)是1維時(shí)間序列上的信號(hào),因此1維卷積神經(jīng)網(wǎng)絡(luò)模型中的局部感知域是在時(shí)間維度上劃分,缺乏頻域上的信息。
(3)基于2維卷積的網(wǎng)絡(luò)參數(shù)太多,訓(xùn)練模型的時(shí)間成本很大,在進(jìn)行推理時(shí)實(shí)時(shí)性能較差。
鑒于現(xiàn)有基于深度神經(jīng)網(wǎng)絡(luò)的心律失常自動(dòng)分類算法的不足,本文提出一種使用小波分解和1D-GoogLeNet模型結(jié)構(gòu)的ECG心律失常分類檢測(cè)方法。從ECG信號(hào)中選擇5種心律類型,信號(hào)在經(jīng)過小波分解后得到不同頻帶的子信號(hào),然后該結(jié)果用作1D-GoogLeNet的輸入,以便最終識(shí)別和檢測(cè)ECG心律失常類型。本文使用來自MIT-BIH心律失常數(shù)據(jù)庫的ECG記錄作為訓(xùn)練和測(cè)試數(shù)據(jù),分類結(jié)果表明,所提出的1D-GoogLeNet模型可以達(dá)到96.58%的平均準(zhǔn)確度。
機(jī)器學(xué)習(xí)能夠在ECG分類任務(wù)上有大量的研究應(yīng)用,一個(gè)重要的原因在于研究人員能夠較容易地獲得各種公開的ECG數(shù)據(jù)集用于驗(yàn)證他們提出的眾多方法。例如MIT-BIH心律失常數(shù)據(jù)集(MITBIH arrhythmia database)[23],該數(shù)據(jù)集包含48個(gè)30 min時(shí)長(zhǎng)的雙通道動(dòng)態(tài)心電信號(hào)記錄,最初用于評(píng)估心律失常檢測(cè)器。其他的被廣泛采用的數(shù)據(jù)集還有Physionet’s Physiobank,INCART和 the American Heart Association database[24]。
本文選擇MIT-BIH心律失常數(shù)據(jù)集(下文將以MIT-BIH代替)作為驗(yàn)證文中所提心律失常檢測(cè)算法的數(shù)據(jù)集。MI-BIH中的數(shù)據(jù)來自48個(gè)不同的被采集人員,每組都包含兩路不同導(dǎo)聯(lián)方式的ECG。本文選擇了樣本最多的MLⅡ型ECG信號(hào),共計(jì)46組MLⅡ型數(shù)據(jù)。MIT-BIH中的數(shù)據(jù)都有詳細(xì)的標(biāo)注,標(biāo)注信息主要包含了15種心跳類型。本文實(shí)驗(yàn)中檢測(cè)的心律類型包括左束支傳導(dǎo)阻滯(Left bundle branch block)、右束支傳導(dǎo)阻滯(Right bundle branch block)、心室早期收縮(Premature ventricular contraction)和心房過早收縮(Atrial premature contraction)4種心律失常類型及正常心跳(Normal beat),總共5種心跳類型。根據(jù)MIT-BIH中的標(biāo)注信息,本文分別采用L,R,V,A和N作為上述5種心跳類型的標(biāo)識(shí)。表1列出了46組30分鐘時(shí)長(zhǎng)的數(shù)據(jù)集中包L,R,V,A,N的統(tǒng)計(jì)結(jié)果。
表1 MI-BIH中L,R,V,A和N統(tǒng)計(jì)結(jié)果
ECG信號(hào)是一個(gè)1維時(shí)間序列,信息維度低,且原始數(shù)據(jù)中包含了不必要的高頻噪聲信息,為了增加數(shù)據(jù)維度和去噪,本文采用多分辨率小波變換對(duì)數(shù)據(jù)進(jìn)行分解,既能得到各頻帶的子信號(hào)又增加了信號(hào)的維度,使后文提出的模型達(dá)到更好的心律失常檢測(cè)效果。
在小波分解中通過尺度函數(shù)φ(t)和小波函數(shù)ψ(t)基將原始信號(hào)分解為不同頻帶的子信號(hào)。一個(gè)長(zhǎng)度為M的離散信號(hào)s(t)的小波近似系數(shù)a0(k)和小波細(xì)節(jié)系數(shù)dj(k)可以表示為
式(1)和式(2)中的j和k分別表示子信號(hào)在頻域上的伸縮和時(shí)域上的平移。然后根據(jù)近似系數(shù)和細(xì)節(jié)系數(shù)又可以重構(gòu)出原始信號(hào)
上述使用小波變換對(duì)信號(hào)進(jìn)行多分辨率分析的過程,就是本文中對(duì)ECG信號(hào)進(jìn)行分解,實(shí)現(xiàn)數(shù)據(jù)增維的基礎(chǔ)。使用小波分析對(duì)信號(hào)進(jìn)行處理時(shí),可供選擇的小波函數(shù)眾多且變換后得到的結(jié)果各不相同,因此需要根據(jù)分析的目的選擇合適的小波函數(shù)。本文選擇Daubechies小波函數(shù)族中的Db6作為實(shí)驗(yàn)的小波函數(shù)。Daubechies小波函數(shù)族的形狀與ECG信號(hào)中的QRS波相似,并且它們的能譜集中在低頻附近[25]。圖1是實(shí)驗(yàn)中MI-BIH的ECG信號(hào)經(jīng)過8級(jí)小波分解后的結(jié)果,包括原始信號(hào)s,第8級(jí)近似信號(hào)a8和1~8級(jí)細(xì)節(jié)信號(hào)d1~d8。
圖1 Db6 8級(jí)ECG信號(hào)的多分辨率分解
MI-BIH中的ECG信號(hào)時(shí)長(zhǎng)為30 min,采樣頻率是360 Hz,而標(biāo)注的方式則是將心跳類型標(biāo)注到心電周期中的R波處。在本文中,經(jīng)過多分辨率小波分解后需進(jìn)一步從每一個(gè)ECG序列中截取出L,R,V,A,N 5類標(biāo)注所在的心電周期,組成實(shí)驗(yàn)所需的數(shù)據(jù)集。在處理每一位被采集者的ECG信號(hào)時(shí),因?yàn)樾穆筛鞑幌嗤越厝〉囊粋€(gè)完整心電周期的數(shù)據(jù)長(zhǎng)度也各不相同,為了統(tǒng)一每一個(gè)數(shù)據(jù)樣本的長(zhǎng)度,在本文中,采用線性插值將所有截取出的原始樣本縮放到360個(gè)數(shù)據(jù)的長(zhǎng)度。同時(shí)為了減弱ECG信號(hào)中包含的人員信息對(duì)檢測(cè)結(jié)果的影響,對(duì)L,R,V,A,N 5種類型分別從總數(shù)據(jù)樣本中隨機(jī)抽取8000例、7000例、7000例、2500例和8000例,然后各類以4:1分為訓(xùn)練集和測(cè)試集后再隨機(jī)排序。最終文中將數(shù)據(jù)集用數(shù)學(xué)符號(hào)表示為
其中,xi表 示長(zhǎng)度為L(zhǎng)的 心電信號(hào),yi∈(1,2,...,C),為xi對(duì)應(yīng)的心跳類別標(biāo)簽編號(hào),C為分類總數(shù),N為數(shù)據(jù)集中樣本的總個(gè)數(shù)。
GoogLeNet最開始由Christian Szegedy等人在ILSVRC 2014年提出,并且在分類挑戰(zhàn)賽(Classification Challenge)和目標(biāo)檢測(cè)挑戰(zhàn)賽(Detection Challenge)中均取得頭籌[26]。近幾年人們對(duì)CNN的研究方向主要集中于改進(jìn)網(wǎng)絡(luò)的深度、寬度和基數(shù)3個(gè)方面,以提升網(wǎng)絡(luò)的性能[27]。GoogLeNet的主要特點(diǎn)就是改進(jìn)網(wǎng)絡(luò)的寬度使得網(wǎng)絡(luò)能提取更豐富的特征。在GoogLeNet的結(jié)構(gòu)中引入了名為Inception的模塊,通過該模塊增加卷積網(wǎng)絡(luò)在提取深層特征時(shí)的網(wǎng)絡(luò)寬度。該團(tuán)隊(duì)在后續(xù)的工作中又對(duì)GoogLeNet進(jìn)行了改進(jìn),依次提出了Inception V2,Inception V3,Inception V4與Inception-Res-Net-V2 4種改進(jìn)網(wǎng)絡(luò),從加速訓(xùn)練、減少參數(shù)規(guī)模、防止梯度彌散這幾個(gè)方面進(jìn)行了優(yōu)化[28–30]。
GoogLeNet最開始出現(xiàn)于計(jì)算機(jī)視覺領(lǐng)域,應(yīng)用于目標(biāo)分類和識(shí)別等方向,由于圖像是一個(gè)2維數(shù)據(jù),所以GoogLeNet的卷積模塊中各個(gè)卷積核都是2維卷積核。在本文中,待檢測(cè)的數(shù)據(jù)——ECG信號(hào),是典型的1維時(shí)間序列。在本文的研究中,為了將Inception強(qiáng)大的特征提取能力應(yīng)用到心律失常檢測(cè)中,遂提出了1維GoogLeNet(1D-GoogLeNet)。在1D-GoogLeNet的結(jié)構(gòu)中依然以Inception為核心實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)的拓寬,而卷積核則由原始的2維卷積核替換為1維卷積核。此外,在本文的研究中還對(duì)Inception的結(jié)構(gòu)做了優(yōu)化,使得網(wǎng)絡(luò)在心律失常檢測(cè)任務(wù)中有更優(yōu)的表現(xiàn)。詳細(xì)來講主要有以下幾點(diǎn):首先,由于本文中最終的檢測(cè)類別只有5類,遠(yuǎn)遠(yuǎn)小于GoogLeNet設(shè)定的1000類分類結(jié)果,為了減小過擬合現(xiàn)象,本文在不改變特征提取層輸出大小的情況下減少了1D-GoogLeNet中學(xué)習(xí)參數(shù)的規(guī)模,主要通過重新調(diào)整每個(gè)Inception中卷積層的卷積核數(shù)量和網(wǎng)絡(luò)的深度;其次,在分類器模塊中,新增加了一層全連接以提高分類器的非線性;最后,精簡(jiǎn)了只在多維卷積中才會(huì)出現(xiàn)的特異結(jié)構(gòu),如在InceptionV3中用兩個(gè)前后相繼的1維卷積代替2維卷積。圖2、圖3給出了1D-GoogLeNet的網(wǎng)絡(luò)結(jié)構(gòu)示意圖。其中 “S”標(biāo)志該神經(jīng)網(wǎng)絡(luò)模塊的stride=2,否則為1;括號(hào)內(nèi)的數(shù)字表示卷積核的大小,括號(hào)外的數(shù)字表示卷積核的數(shù)量。
圖2 1D-GoogLeNet中的Inception模塊
圖3(c)是1D-GoogLeNet的整體網(wǎng)絡(luò)結(jié)構(gòu)圖,左側(cè)為數(shù)據(jù)流向,右側(cè)為該節(jié)點(diǎn)數(shù)據(jù)輸出尺寸,數(shù)字c表示訓(xùn)練數(shù)據(jù)的輸入通道。網(wǎng)絡(luò)主要由特征提取器和分類器組成。特征提取器由各個(gè)Inception和Stem構(gòu)成;分類器由兩層全連接和dropout組成,括號(hào)內(nèi)給出了該層所用的激活函數(shù)。
圖3 1D-GoogLeNet中的InceptionE,Stem模塊和整體網(wǎng)絡(luò)結(jié)構(gòu)圖
在實(shí)驗(yàn)階段,用PyTorch1.5實(shí)現(xiàn)了本文所提1D-GoogLeNet,并在Nvidia GTX 1080 GPU上訓(xùn)練該模型。訓(xùn)練中將數(shù)據(jù)集D按照4:1劃分為訓(xùn)練集和測(cè)試集,采用交叉熵作為網(wǎng)絡(luò)的損失函數(shù),使用學(xué)習(xí)率為10–5的Adam優(yōu)化策略[31],小批量(minibatch)大小為32,共訓(xùn)練24輪。
在實(shí)驗(yàn)結(jié)果評(píng)估上,本文采用精確率(Precision)、召回率(Recall)和F1-score來衡量1DGoogLeNet模型在各個(gè)類上的檢測(cè)性能。每一類的精確率、召回率和F1-score可以通過式(5)和式(6)得到
式(5)、式(6)和式(7)中P,R和 F1分別為精確率、召回率和F1-score;TP表示將正類樣本預(yù)測(cè)為正類的頻次,TN表示將負(fù)類樣本預(yù)測(cè)為負(fù)類的頻次,F(xiàn)P表 示將負(fù)類樣本預(yù)測(cè)為正類的頻次,F(xiàn)N表示將正類樣本預(yù)測(cè)為負(fù)類的頻次。對(duì)于本文心律失常檢測(cè)而言,是一個(gè)多分類任務(wù),每一種心律型的TPi,FPi,FNi(i=1,2,...,5)具體表示的意義可以由圖4說明,圖為1D-GoogLeNet檢測(cè)心律失常得到的混淆矩陣。圖4中紅色邊框所圍的藍(lán)色區(qū)域表示左束支傳導(dǎo)阻滯(L)的 TP,紅色和橙色區(qū)域分別為其FN,FP,數(shù)值代表對(duì)應(yīng)的頻次,如(N,R)的值為1,意味著模型將測(cè)試集中的N類樣本預(yù)測(cè)為R類的頻次為1。
圖4 檢測(cè)結(jié)果的混淆矩陣
對(duì)于模型的整體性能,則采用訓(xùn)練時(shí)耗(time)、準(zhǔn)確率(Accuracy)以及每一種心律類型Pi,Ri,F 1i(i=1,2,...,5)的宏平均值(macro-average)PM,RM和F 1M作為度量標(biāo)準(zhǔn),式(8)和式(9)是其具體的數(shù)學(xué)表達(dá)式
其中,n表示心跳類別數(shù),在本文中n的具體數(shù)值為5。在實(shí)驗(yàn)中,本文探討了由不同小波分解信號(hào)組合成的輸入數(shù)據(jù)對(duì)實(shí)驗(yàn)結(jié)果的影響,此外還驗(yàn)證了本文所提1D-GoogLeNet和已有的分類模型的性能差異,以展示基于小波分解和1D-GoogLeNet在心律失常檢測(cè)任務(wù)上的有效性。
首先確定了小波分解所得分量的各種組合方式:含有所有分量的D1={a8,b1-b8}、除去高頻細(xì)節(jié)分量與近似分量的D2={b2-b8}與D3={b3-b8}和只含有部分細(xì)節(jié)分量的D4={b2-b7},以及原始數(shù)據(jù)D5={s},各種組合方式的分量形成具有不同通道數(shù)的輸入數(shù)據(jù)。通過訓(xùn)練測(cè)試,表2記錄了詳細(xì)的實(shí)驗(yàn)結(jié)果,用粗體標(biāo)注了各個(gè)度量標(biāo)準(zhǔn)的最大值。從表2數(shù)據(jù)可以明顯看出,分解得到的多通道數(shù)據(jù)在各類指標(biāo)上都優(yōu)于原始數(shù)據(jù)。具體講,原始數(shù)據(jù)在關(guān)鍵指標(biāo)Acc上取得了95.00%的成績(jī),對(duì)應(yīng)的多通道分解數(shù)據(jù)中D4取得了96.58%的最高成績(jī),比原始數(shù)據(jù)高出了1.58%,此外D4數(shù)據(jù)在召回率和F1-score指標(biāo)上也取得了最優(yōu)表現(xiàn)。雖然D3數(shù)據(jù)在精確率上的表現(xiàn)最優(yōu),但對(duì)于本文的心律失常檢測(cè)任務(wù),召回率比精確率更具有參考意義。實(shí)驗(yàn)還對(duì)比了其他數(shù)據(jù)預(yù)處理算法對(duì)實(shí)驗(yàn)結(jié)果的影響,表3展示了離散傅里葉變換(Discrete Fourier Transform,DFT)、經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)和小波分解(Wavelet Decomposition,WD)對(duì)分類檢測(cè)結(jié)果的影響。從表3可以看出,經(jīng)過 DFT和EMD方法預(yù)處理的數(shù)據(jù)都能取得較好的檢測(cè)結(jié)果,但相較于小波分解后的數(shù)據(jù),在檢測(cè)準(zhǔn)確率上都有大約2%的差異。
表2 基于小波分解和1D-GoogLeNet的分類檢測(cè)結(jié)果(%)
表3 各預(yù)處理方法在心律失常檢測(cè)任務(wù)中的比較
通過上述實(shí)驗(yàn)結(jié)果,驗(yàn)證了當(dāng)采用小波分解后的數(shù)據(jù)作為1D-GoogLeNet的輸入,模型取得了更優(yōu)異的表現(xiàn)。圖5給出了當(dāng)D4數(shù)據(jù)作為輸入時(shí),模型訓(xùn)練的表現(xiàn),圖6和表4記錄了其測(cè)試集的詳細(xì)結(jié)果,圖6中,主對(duì)角線的數(shù)值即為各類的召回率。在結(jié)果中A類型的心律檢測(cè)結(jié)果明顯劣于其他類型,導(dǎo)致該現(xiàn)象的主要原因來自數(shù)據(jù)不平衡——A類型的樣本明顯少于其他各類。
表4 D4數(shù)據(jù)作為1D-GoogLeNet的輸入,各類的測(cè)試結(jié)果(%)
圖5 D4數(shù)據(jù)作為輸入時(shí)1D-GoogLeNet的實(shí)驗(yàn)結(jié)果
圖6 D4 數(shù)據(jù)測(cè)試集的混淆矩陣
其次,本文在輸入數(shù)據(jù)確定的情況下,對(duì)文中所提1D-GoogLeNet和簡(jiǎn)單1維化的GoogLeNet兩者的性能做實(shí)驗(yàn)比較。簡(jiǎn)單1維化的GoogLeNet是指在保證GoogLeNet網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)不變的情況下,將原始的2維卷積核替換為1維卷積核所得的網(wǎng)絡(luò)模型。同時(shí)還比較了相同輸入情況下不同分類檢測(cè)模型的檢測(cè)性能。主要比較了同為卷積神經(jīng)網(wǎng)絡(luò)的LeNet和能處理順序數(shù)據(jù)(sequential data)的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)。實(shí)驗(yàn)結(jié)果如表5所示,表5列舉了各個(gè)模型以D4數(shù)據(jù)作為輸入時(shí),在準(zhǔn)確率、精確率、召回率、F1-score、訓(xùn)練時(shí)耗和學(xué)習(xí)參數(shù)規(guī)模(params)上的結(jié)果。從表5所示的對(duì)比結(jié)果中可以看出,本文所提1D-GoogLeNet在準(zhǔn)確率、精確率、召回率和F1-score度量標(biāo)準(zhǔn)上都優(yōu)于其他3種模型。其中在準(zhǔn)確率(AccM)上1D-GoogLeNet比其他三者分別高出4.4%,2.6%,3.8%;訓(xùn)練時(shí)長(zhǎng)方面1D-GoogLeNet相較于簡(jiǎn)單1維化GoogLeNet,得益于學(xué)習(xí)參數(shù)規(guī)模小,將時(shí)長(zhǎng)減少了1/2以上,使訓(xùn)練更快。
表5 1D-GoogLeNet與其他分類模型的實(shí)驗(yàn)比較
本文提出了一種使用Db6小波分解和1DGoogLeNet卷積神經(jīng)網(wǎng)絡(luò)的心電圖心律失常檢測(cè)方法。從MIT-BIH心律失常數(shù)據(jù)庫中選取了N,L,R,V,A 5種不同類型的ECG信號(hào),共計(jì) 32500條記錄。在該方法中,首先使用Db6對(duì)ECG的時(shí)域信號(hào)進(jìn)行8級(jí)分解,然后包含一個(gè)完整心電周期為準(zhǔn)則對(duì)信號(hào)切割后再使用線性插值統(tǒng)一縮放到360個(gè)數(shù)值長(zhǎng)度,組合成多通道的信號(hào)樣本,最后將5種心律失常類型的樣本用作1D-GoogLeNet的輸入,以確定ECG心律失常類型。經(jīng)過詳細(xì)實(shí)驗(yàn)驗(yàn)證,結(jié)果表明:分解后的多通道數(shù)據(jù)檢測(cè)效果優(yōu)于未分解的;不同小波分量組合方式之間,檢測(cè)結(jié)果有差異,當(dāng)輸入數(shù)據(jù)由{d2-d7}組合時(shí),所提出的1DGoogLeNet模型可以達(dá)到最高的96.58%平均準(zhǔn)確率;1D-GoogLeNet和簡(jiǎn)單1維化GoogLeNet相對(duì)比,結(jié)構(gòu)更簡(jiǎn)單、參數(shù)更少的1D-GoogLeNet的準(zhǔn)確率比后者提高了4.7%,訓(xùn)練效率提高了118%。以上結(jié)論最終驗(yàn)證了本文所提將多通道小波分量ECG信號(hào)樣本作為輸入的1D-GoogLeNet分類器可以在心律失常檢測(cè)任務(wù)上取得優(yōu)異表現(xiàn)。