李倩玉,王蓓,金晶,張濤,王行愚
(1.華東理工大學(xué) 信息科學(xué)與工程學(xué)院,上海 200237;2.清華大學(xué) 自動(dòng)化系,北京 100086)
睡眠是人的一生中不可缺少的一種復(fù)雜生理過(guò)程。充足的睡眠能使大腦和身體得到充分的休息和恢復(fù)。由于如今不健康的生活方式的影響,睡眠障礙已成為現(xiàn)代社會(huì)的嚴(yán)重問(wèn)題。長(zhǎng)時(shí)間的睡眠障礙會(huì)使人精神不振、免疫力下降,還會(huì)誘發(fā)心腦血管疾病等[1]。因此,及早診斷睡眠障礙有助于發(fā)現(xiàn)異常變化并防止疾病進(jìn)一步發(fā)展,對(duì)身心健康具有重要的意義。
睡眠分期是診斷睡眠障礙和檢測(cè)睡眠質(zhì)量的有效方式。在實(shí)際臨床上,首先利用多導(dǎo)睡眠監(jiān)測(cè)儀(polysomnography,PSG)獲取腦電、眼電、肌電、脈搏、血氧飽和度、呼吸等信號(hào),再由專業(yè)醫(yī)師對(duì)照國(guó)際通用的睡眠分期標(biāo)準(zhǔn)[2-4],對(duì)每個(gè)30 s時(shí)長(zhǎng)的睡眠數(shù)據(jù)進(jìn)行睡眠時(shí)期的人工劃分。研究表明,睡眠深淺的變化是由神經(jīng)中樞活動(dòng)的變化引起的,因此綜合上述信號(hào)在不同睡眠時(shí)期的特征,能夠很好地反映睡眠模式[5-6]。然而,整晚的睡眠數(shù)據(jù)量較大,對(duì)專業(yè)醫(yī)師的資質(zhì)要求高,人工判讀煩瑣且耗時(shí)。隨著大數(shù)據(jù)、人工智能等創(chuàng)新技術(shù)的發(fā)展,自動(dòng)睡眠分期方法逐漸成為快捷的輔助方式,受到了廣泛的研究與關(guān)注[7]。
近年來(lái),自動(dòng)睡眠分期方法主要涵蓋了基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法。基于機(jī)器學(xué)習(xí)的自動(dòng)睡眠分期方法通常包含了特征提取和睡眠階段分類兩個(gè)步驟。通過(guò)時(shí)域分析法[8-9]、頻域分析法[10-11]等來(lái)提取睡眠特征,捕獲睡眠過(guò)程中的主要變化,然后采用如隨機(jī)森林[12-13]、支持向量機(jī)[14-15]等分類器對(duì)睡眠階段進(jìn)行分類?;谏疃葘W(xué)習(xí)的自動(dòng)睡眠分期方法主要依靠深度神經(jīng)網(wǎng)絡(luò)端對(duì)端特性,自動(dòng)提取復(fù)雜、有用的特征,從一定程度上避免了手工提取特征的主觀性。然后,通過(guò)深化網(wǎng)絡(luò)結(jié)構(gòu)、堆疊不同功能網(wǎng)絡(luò)層的方式,提高網(wǎng)絡(luò)的特征表達(dá)能力。深度學(xué)習(xí)模型能夠利用損失函數(shù)衡量網(wǎng)絡(luò)輸出與實(shí)際標(biāo)簽的偏差,并借助反向傳播算法計(jì)算損失成本關(guān)于參數(shù)的梯度,以此來(lái)不斷更新各層參數(shù),從而得到最佳的分類輸出。
相比于機(jī)器學(xué)習(xí)的處理模式,深度學(xué)習(xí)模型在自動(dòng)特征提取和模型優(yōu)化上均具有一定的優(yōu)勢(shì)。常見(jiàn)的卷積神經(jīng)網(wǎng)絡(luò)最先在自動(dòng)睡眠分期上獲得廣泛的應(yīng)用。例如:Tsinalis 等[16]使用未經(jīng)預(yù)處理的原始腦電信號(hào)作為輸入,在兩個(gè)卷積層中分別利用大小不同的卷積核,提取信號(hào)不同尺度上的抽象特點(diǎn),豐富了信號(hào)的特征表示;Zhao 等[17]利用多層卷積及映射模塊提取并融合了腦電圖和心電圖中的多尺度特征,對(duì)不同睡眠階段相關(guān)信號(hào)的細(xì)微變化進(jìn)行捕捉;Sors 等[18]則利用當(dāng)前待分類的數(shù)據(jù)段及其前后兩個(gè)數(shù)據(jù)段作為輸入,構(gòu)建了一個(gè)14 層卷積神經(jīng)網(wǎng)絡(luò)。
此外,考慮到睡眠過(guò)程中所獲取的腦電數(shù)據(jù)具有時(shí)間序列的特點(diǎn),適用于時(shí)間序列分類的遞歸神經(jīng)網(wǎng)絡(luò)[19-20](recursive neural network,RNN)、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)[21-23](long short-term memory,LSTM)、雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)[24-25](bi-directional long short-term memory,BiLSTM)等相繼被應(yīng)用在了睡眠分期問(wèn)題上。例如:Hsu 等[19]利用Elman遞歸神經(jīng)網(wǎng)絡(luò)同時(shí)提供信號(hào)流前饋連接和反饋連接通道,便于捕捉睡眠前后關(guān)聯(lián)信息;楊鑫等[20]提出了一種基于雙向遞歸神經(jīng)網(wǎng)絡(luò)的單通道睡眠分期方法,融入了雙向遞歸神經(jīng)網(wǎng)絡(luò)對(duì)前后時(shí)序信號(hào)的記憶能力,提高了睡眠分期判別的準(zhǔn)確率;Dong 等[23]利用整流神經(jīng)網(wǎng)絡(luò)檢測(cè)分層特征,并利用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)進(jìn)行序列信息學(xué)習(xí),以優(yōu)化分類性能;羅森林等[24]將卷積神經(jīng)網(wǎng)絡(luò)與雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)結(jié)合,綜合利用這兩種網(wǎng)絡(luò)的優(yōu)點(diǎn),實(shí)現(xiàn)睡眠時(shí)期的自動(dòng)判別。
雖然目前基于深度學(xué)習(xí)的自動(dòng)睡眠分期方法已取得了不錯(cuò)的效果,但仍存在幾個(gè)比較突出的問(wèn)題:1)雖然深度學(xué)習(xí)可以通過(guò)不斷加深網(wǎng)絡(luò)結(jié)構(gòu)來(lái)獲得輸入信號(hào)的更有效的特征表達(dá),但一個(gè)層級(jí)過(guò)深的神經(jīng)網(wǎng)絡(luò)往往會(huì)存在梯度消失的問(wèn)題;2)在睡眠分期任務(wù)上效果較好的雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)尚不能在一個(gè)長(zhǎng)序列中突出重要的信息,進(jìn)而削弱了網(wǎng)絡(luò)對(duì)時(shí)序信息的學(xué)習(xí)能力;3)由于不同睡眠時(shí)期樣本之間存在明顯的不平衡問(wèn)題,不可避免地會(huì)影響到自動(dòng)睡眠分期模型在少樣本類別上的分類性能,從而降低了整體的分類效果。
綜合考慮上述問(wèn)題,在構(gòu)建睡眠分期的深度學(xué)習(xí)模型中,本文提出了一種基于雙向LSTM 卷積網(wǎng)絡(luò)與注意力機(jī)制(CNN-BiLSTM-Attention)的自動(dòng)睡眠分期模型。首先,利用卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)從原始腦電信號(hào)中提取時(shí)不變特征,并引入殘差網(wǎng)絡(luò),避免網(wǎng)絡(luò)結(jié)構(gòu)過(guò)深帶來(lái)的梯度消失問(wèn)題;其次,針對(duì)睡眠腦電數(shù)據(jù)的前后序列相關(guān)性,設(shè)計(jì)了帶注意力機(jī)制(Attention)的雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(BiLSTM),來(lái)加強(qiáng)對(duì)時(shí)序信息的學(xué)習(xí),以提升睡眠分期方法的分類性能;同時(shí),采用過(guò)采樣方法,對(duì)睡眠過(guò)渡階段(少樣本類別)進(jìn)行數(shù)據(jù)增強(qiáng)處理,以減輕樣本不平衡問(wèn)題對(duì)模型帶來(lái)的影響。
本文所設(shè)計(jì)并構(gòu)建的基于雙向LSTM 卷積網(wǎng)絡(luò)與注意力機(jī)制的自動(dòng)睡眠分期模型結(jié)構(gòu)如圖1所示。該CNN-BiLSTM-Attention 模型主要由4 個(gè)模塊組成:數(shù)據(jù)輸入模塊、特征表示模塊、序列信息學(xué)習(xí)模塊以及分類判別模塊。
圖1 基于CNN-BiLSTM-Attention 的自動(dòng)睡眠分期模型Fig.1 Automatic sleep staging model based on CNN-BiLSTM-Attention
自動(dòng)睡眠分期以臨床采集的受試者整夜睡眠產(chǎn)生的生物電信號(hào)作為輸入。在一個(gè)正常人的整晚睡眠中,不同睡眠時(shí)期的時(shí)長(zhǎng)占比存在較大差異,導(dǎo)致了少樣本睡眠階段分類性能表現(xiàn)較差的問(wèn)題。
為解決樣本不平衡問(wèn)題,在數(shù)據(jù)輸入模塊中,本文采用了邊界人工合成少數(shù)類過(guò)采樣算法(borderline synthetic minority oversampling technique,Borderline SMOTE)對(duì)原始腦電信號(hào)進(jìn)行數(shù)據(jù)增強(qiáng)處理。該算法是常用過(guò)采樣技術(shù)的改進(jìn)算法[26],它將少數(shù)類樣本分為安全、危險(xiǎn)和噪聲3 類,并僅使用代表在少數(shù)類樣本邊界上的危險(xiǎn)樣本來(lái)合成新的數(shù)據(jù),以達(dá)到樣本平衡效果。利用該算法生成樣本步驟:
1)對(duì)每個(gè)少數(shù)類樣本pi,利用K近鄰算法從整個(gè)數(shù)據(jù)集中計(jì)算其m個(gè)最近鄰;
2)將周圍m個(gè)最近鄰樣本有一半以上為少數(shù)類樣本的定義為安全樣本,周圍m個(gè)最近鄰樣本有一半以上為多數(shù)類樣本的定義為危險(xiǎn)樣本,周圍m個(gè)最近鄰樣本均為多數(shù)類樣本的定義為噪聲樣本;
3)對(duì)于每個(gè)危險(xiǎn)樣本di,從其k個(gè)最近鄰中隨機(jī)選擇s個(gè)最近鄰,在這s個(gè)最近鄰樣本和原危險(xiǎn)樣本之間隨機(jī)合成n個(gè)新樣本,計(jì)算公式為
在深度學(xué)習(xí)中,常常在網(wǎng)絡(luò)前端構(gòu)建多個(gè)具有不同大小卷積核的卷積層提取輸入信號(hào)的局部或全局特征,從而得到輸入數(shù)據(jù)的有效描述。一般來(lái)說(shuō),卷積層越多,網(wǎng)絡(luò)往往能獲得更大的感受野,并提取出更好的特征。但實(shí)踐證明,網(wǎng)絡(luò)結(jié)構(gòu)的加深會(huì)使梯度爆炸、梯度消失的風(fēng)險(xiǎn)增加。
為了提取更有效的特征避免梯度消失的風(fēng)險(xiǎn),本文在網(wǎng)絡(luò)架構(gòu)中加入了殘差網(wǎng)絡(luò)。如圖1特征表示模塊所示,在特征表示層構(gòu)建了一個(gè)16 層卷積神經(jīng)網(wǎng)絡(luò)。該卷積神經(jīng)網(wǎng)絡(luò)由淺層卷積模塊與殘差模塊兩部分組成。淺層卷積模塊將增強(qiáng)后的數(shù)據(jù)作為輸入,依次通過(guò)1×50 大卷積核層、1×8 最大池化層、3 個(gè)1×8 小卷積核層以及1×4 最大池化層,提取輸入數(shù)據(jù)的低級(jí)特征,然后將得到的低級(jí)特征輸入給殘差模塊。殘差模塊部分共包括5 個(gè)相同的殘差塊,本文設(shè)計(jì)的殘差塊結(jié)構(gòu)如圖2 所示。
圖2 殘差塊結(jié)構(gòu)Fig.2 Residual block structure
殘差塊與普通卷積神經(jīng)網(wǎng)絡(luò)的不同之處在于,它在一般卷積層外增加了跳躍結(jié)構(gòu)。假定網(wǎng)絡(luò)的輸入為x,輸入經(jīng)卷積后運(yùn)算結(jié)果為F(x),殘差塊輸出為H(x)。若x與F(x)維度匹配,則有
若x與F(x)維度不匹配,則在跳躍結(jié)構(gòu)添加平均池化層與全零填充層,利用全零填充增加輸入維度,使得跳躍結(jié)構(gòu)的輸出與F(x)維度適配。
對(duì)于睡眠分期任務(wù)來(lái)說(shuō),作為輸入的睡眠腦電信號(hào)是一段連續(xù)的具有強(qiáng)相關(guān)性的時(shí)間序列,需要網(wǎng)絡(luò)具有一定的“記憶功能”,綜合前后信息對(duì)當(dāng)前睡眠時(shí)期作出判斷。卷積神經(jīng)網(wǎng)絡(luò)的輸入是一個(gè)獨(dú)立的、沒(méi)有上下文聯(lián)系的單元,在處理輸入是具有明顯上下文關(guān)系的序列化信號(hào)時(shí)不占優(yōu)勢(shì)。
為了解決上述問(wèn)題,本文在特征表示模塊后,加入了BiLSTM 結(jié)構(gòu)和注意力機(jī)制,以幫助網(wǎng)絡(luò)進(jìn)行序列信息學(xué)習(xí)。如圖1 中的序列信息學(xué)習(xí)模塊所示,將BiLSTM 層與注意力層級(jí)聯(lián),BiLSTM 層的輸出是注意力層的輸入。
BiLSTM 層:BiLSTM 是將兩個(gè)方向不同的獨(dú)立的LSTM 結(jié)構(gòu)疊加在一起而組成的,一個(gè)為前向?qū)?,另一個(gè)為反向?qū)?。在每一個(gè)時(shí)刻t,輸入xt同時(shí)提供給這兩個(gè)層,在前向?qū)訌? 時(shí)刻到t時(shí)刻正向計(jì)算一遍,得到并保存每個(gè)時(shí)刻向前隱含層的輸出hfw。在反向?qū)友刂鴷r(shí)刻t到時(shí)刻1 反向計(jì)算一遍,得到并保存每個(gè)時(shí)刻向后隱含層的輸出hbw。最后,在每個(gè)時(shí)刻結(jié)合前向?qū)雍头聪驅(qū)虞敵鼋Y(jié)果得到最終的輸出ht。
注意力層:BiLSTM 不能在一個(gè)長(zhǎng)序列中突出重要的信息,削弱了網(wǎng)絡(luò)對(duì)時(shí)序信息的學(xué)習(xí)能力。而注意力機(jī)制恰恰能彌補(bǔ)這一缺點(diǎn)。注意力機(jī)制可以通過(guò)引入新的可訓(xùn)練變量,依次加強(qiáng)各段數(shù)據(jù)之間的聯(lián)系,突出注意力集中的數(shù)據(jù)段幫助網(wǎng)絡(luò)捕獲階段信息。
對(duì)于t時(shí)刻BiLSTM 層的輸出ht,初始化查詢向量q,利用點(diǎn)積模型計(jì)算注意力層輸入ht與查詢向量q之間的相似度,通過(guò)相似度對(duì)比得出各輸出數(shù)據(jù)段的重要程度,得到注意力得分fscore(ht,q)。然后利用歸一化指數(shù)(Softmax)函數(shù)將注意力得分轉(zhuǎn)換為[0,1] 之間的概率分布,得到權(quán)重系數(shù)αt,根據(jù)權(quán)重系數(shù)對(duì)輸入ht進(jìn)行加權(quán)求和,得到注意力層輸出v。具體計(jì)算如下:
最后,將利用注意力機(jī)制求得的特征表示v利用Softmax 函數(shù)分類,得到當(dāng)前輸入樣本的睡眠時(shí)期預(yù)測(cè)分布P。Softmax 函數(shù)是深度學(xué)習(xí)中常用且有效的分類器,計(jì)算公式為
式中W和b分別為Softmax 層的權(quán)重和偏置。
本文使用了來(lái)自PhysioNet 數(shù)據(jù)庫(kù)中的Sleep-EDF 數(shù)據(jù)集[27]。該數(shù)據(jù)集包含197 個(gè)整夜睡眠的生物電信號(hào)。數(shù)據(jù)集中的數(shù)據(jù)由睡眠專家按照R&K 規(guī)則劃分為:清醒期(W)、非快速眼動(dòng)睡眠I 期(S1)、II 期(S2)、III 期(S3)、IV 期(S4)、快速眼動(dòng)期(REM)、身體運(yùn)動(dòng)時(shí)間階段和無(wú)法判讀的階段。選取了年齡為25~33 歲的女性被試者身上采集的19 個(gè)整晚單通道(Pz-Oz)睡眠腦電數(shù)據(jù),采樣頻率為100 Hz。對(duì)上述數(shù)據(jù)做了如下調(diào)整:1)去除原數(shù)據(jù)集中身體運(yùn)動(dòng)時(shí)間階段和無(wú)法判讀的階段;2)考慮到S3、S4 時(shí)期都屬于深度睡眠時(shí)期,其數(shù)據(jù)特征也較相似,因此將S3 和S4 期合并為SS 期。調(diào)整后的數(shù)據(jù)用于模型的訓(xùn)練、驗(yàn)證與測(cè)試,得到5 個(gè)睡眠時(shí)期的判別結(jié)果(W、REM、S1、S2 和SS)。
將30 s 時(shí)長(zhǎng)的腦電數(shù)據(jù)作為一個(gè)樣本,從原始數(shù)據(jù)集中總計(jì)提取到18 816 個(gè)樣本。根據(jù)已知的睡眠分期人工標(biāo)簽,統(tǒng)計(jì)了不同睡眠時(shí)期的樣本數(shù)量占比,其中S2 占比44.80%,REM 時(shí)期占比18.25%,SS 時(shí)期占比15.77%,W 時(shí)期占比12.63%,S1 時(shí)期占比8.55%。相比于S2,屬于睡眠過(guò)渡階段的S1 的占比明顯偏少,其余睡眠時(shí)期略有差異。采用1.1 節(jié)中的Borderline SMOTE,對(duì)少數(shù)類樣本進(jìn)行了數(shù)據(jù)增強(qiáng)處理,使得各睡眠時(shí)期之間的樣本數(shù)量占比均衡。經(jīng)過(guò)類平衡處理后的樣本總量為42 145。
本文采用七折交叉驗(yàn)證來(lái)評(píng)估模型性能,使用RMSProp 優(yōu)化器來(lái)調(diào)整權(quán)重,學(xué)習(xí)速率和衰減系數(shù)分別設(shè)置為0.000 1 和0.9。為了探究模型對(duì)原始數(shù)據(jù)的分類性能,本文利用序號(hào)編碼,在開(kāi)始訓(xùn)練前即給數(shù)據(jù)添加編號(hào),然后打亂數(shù)據(jù)。將數(shù)據(jù)分為7 折,每次以其中6 折作為訓(xùn)練集,1 折作為測(cè)試集,共計(jì)進(jìn)行7 次實(shí)驗(yàn),得到模型對(duì)全部數(shù)據(jù)的預(yù)測(cè)結(jié)果。再將預(yù)測(cè)標(biāo)簽按原來(lái)編號(hào)順序重排,得到模型對(duì)真實(shí)睡眠腦電數(shù)據(jù)的睡眠分期預(yù)測(cè)結(jié)果。
為了評(píng)估所構(gòu)建的模型的分類效果,本文計(jì)算了各睡眠時(shí)期的精確率(p)、召回率(r)和F1值(F1)以及整體睡眠分期的平均準(zhǔn)確率和宏平均F1值(MF1)。
2.3.1 混淆矩陣
表1 和表2 分別給出了兩種模型的混淆矩陣?;煜仃嚭w了自動(dòng)睡眠分期結(jié)果與已知的人工標(biāo)簽相比較得到的統(tǒng)計(jì)結(jié)果。表1、2 中,行代表已知的人工標(biāo)簽,列是模型得到的預(yù)測(cè)結(jié)果,對(duì)角線上粗體的數(shù)字為兩者判斷相一致的樣本數(shù)量。表1 給出了采用原始睡眠腦電數(shù)據(jù),基于常用的CNN-LSTM 自動(dòng)睡眠模型得到的混淆矩陣;表2 給出了采用經(jīng)類平衡處理后的數(shù)據(jù),基于CNN-BiLSTM-Attention 自動(dòng)睡眠模型得到的混淆矩陣(該結(jié)果僅包含真實(shí)的睡眠腦電數(shù)據(jù),生成數(shù)據(jù)不包含在內(nèi))。
表1 原始數(shù)據(jù)集下CNN-LSTM 模型的混淆矩陣Table 1 Confusion matrix of CNN-LSTM model under the original data set
表2 類平衡后CNN-BiLSTM-Attention 模型的混淆矩陣Table 2 Confusion matrix of CNN-BiLSTM-Attention model after class balance
比較表1 和表2,可以觀察到,本文提出的自動(dòng)睡眠分期模型取得了令人滿意的總體分類性能,分類準(zhǔn)確率達(dá)到88.37%,相比CNN-LSTM 模型提升了近8%。在原始睡眠腦電數(shù)據(jù)集中,屬于睡眠過(guò)渡階段的S1 的樣本數(shù)量占比極小。在表1中,S1 的精確率為45.34%,召回率為25.42%,反映綜合性能的F1指數(shù)僅為32.58%。經(jīng)過(guò)類平衡處理后,S1 的分類性能得到了顯著提高。在表2中,S1 的精確率和召回率分別提高到至76.34%和83.03%,F(xiàn)1指數(shù)也達(dá)到了79.55%,體現(xiàn)了類平衡處理的必要性和有效性。同時(shí),其他睡眠分期的判別效果均有不同程度的提升,其中W 的3 項(xiàng)性能指標(biāo)都在95%以上,S2、SS 和REM 的各項(xiàng)性能指標(biāo)也都在80%以上。從上述分類結(jié)果中可以看出,CNN-BiLSTM-Attention 模型明顯優(yōu)于常用的CNN-LSTM 模型,體現(xiàn)了本文在模型結(jié)構(gòu)上所作的改進(jìn)能夠有效提高模型在不同睡眠分期上的分類效果。
2.3.2 睡眠時(shí)相序列圖
構(gòu)建自動(dòng)睡眠分期的目的是為臨床診斷提供高效的輔助判別工具。本文通過(guò)序列編碼的方式,既能夠保證模型訓(xùn)練時(shí)有類間較平衡的樣本數(shù)量,也能夠從自動(dòng)判別結(jié)果中快捷地獲取原始數(shù)據(jù)的睡眠分期判別結(jié)果,得到整晚睡眠的時(shí)相序列圖,展示睡眠狀態(tài)隨時(shí)間變化的結(jié)果,為臨床的診斷與治療提供重要依據(jù)。
圖3 和圖4 是同一名受試者整晚睡眠的時(shí)相序列圖,其中圖3 為睡眠分期的人工判別結(jié)果,圖4 為本文所提出的自動(dòng)睡眠分期模型的判別結(jié)果。從圖4 可以觀察到,該模型對(duì)于持續(xù)的清醒狀態(tài)有較好的判別效果,對(duì)睡眠過(guò)程中出現(xiàn)的短時(shí)覺(jué)醒現(xiàn)象也能做到較準(zhǔn)確的預(yù)測(cè)。整晚睡眠過(guò)程是一個(gè)連續(xù)過(guò)程,相鄰睡眠狀態(tài)之間的特征較相似,模型在部分相鄰狀態(tài)S2 和S3 以及S1 和S2、REM 存在一定的混淆。整體上,模型得到的睡眠狀態(tài)的變化趨勢(shì)與人工標(biāo)簽大體相一致,能夠?yàn)榕R床診斷提供有效的輔助判別。
圖3 臨床專家手動(dòng)判斷結(jié)果Fig.3 Mannual inspection results by clincial experts
圖4 基于CNN-BiLSTM-Attention 的自動(dòng)睡眠分期模型的判斷結(jié)果Fig.4 Interpretation results based on CNN-BiLSTM-Attention automatic sleep staging model
2.3.3 與其他方法的比較
為進(jìn)一步驗(yàn)證模型中引入的BiLSTM 模塊與注意力機(jī)制的有效性,首先進(jìn)行了消融實(shí)驗(yàn),將模型中的BiLSTM-Attention 結(jié)構(gòu)分別替換成了LSTM 塊和BiLSTM 塊,結(jié)果如表3 中第1、2 行所示。與本文所提出的CNN-BiLSTM-Attention模型進(jìn)行對(duì)比后,從中可以看到,在不使用BiLSTM模塊和注意力機(jī)制時(shí),模型的總體分類準(zhǔn)確率及各睡眠分期的F1都會(huì)有不同程度的下降。特別是S1 階段的分類性能下降的最為明顯。這樣的結(jié)果驗(yàn)證了本文所提出模型的有效性以及注意力機(jī)制在學(xué)習(xí)睡眠分期轉(zhuǎn)換規(guī)律上的重要性。
其次,與采用相同數(shù)據(jù)集和腦電信號(hào)通道的部分文獻(xiàn)中自動(dòng)睡眠分期判別結(jié)果進(jìn)行了比較。如表3 中第3、4、5 行所示,所比較的3 個(gè)模型均屬于基于深度學(xué)習(xí)的自動(dòng)睡眠分期模型。其中,文獻(xiàn)[28]提出了一個(gè)DeepSleepNet 的網(wǎng)絡(luò)架構(gòu),利用CNN 自動(dòng)提取特征,堆疊BiLSTM 架構(gòu)學(xué)習(xí)睡眠轉(zhuǎn)換規(guī)則;文獻(xiàn)[29]提出了一種序列深度模型;文獻(xiàn)[30]提出了一個(gè)結(jié)合狀態(tài)轉(zhuǎn)移規(guī)則的深度睡眠分期模型。從表3 中可以看出,相比上述文獻(xiàn)中的模型,本文所提出的CNN-BiLSTM-Attention 模型的分類準(zhǔn)確率有5.5%~8.5%的提高,且MF1提高了10%以上。
表3 基于CNN-BiLSTM-Attention 的自動(dòng)睡眠分期模型和其他分類方法的比較Table 3 Comparison of automatic sleep staging model based on CNN-BiLSTM-Attention and other classification methods
本文提出了一種基于CNN-BiLSTM-Attention 的自動(dòng)睡眠分期模型。該模型利用卷積神經(jīng)網(wǎng)絡(luò)作為特征提取器,從原始單通道腦電信號(hào)提取時(shí)不變特征,同時(shí)引入殘差網(wǎng)絡(luò)架構(gòu),在加深網(wǎng)絡(luò)層次的同時(shí)避免網(wǎng)絡(luò)出現(xiàn)梯度消失問(wèn)題,并利用帶注意力機(jī)制的BiLSTM 進(jìn)一步學(xué)習(xí)輸入信號(hào)的時(shí)序信息,挖掘睡眠過(guò)程的轉(zhuǎn)換機(jī)制。通過(guò)交叉驗(yàn)證、消融實(shí)驗(yàn),以及與相關(guān)文獻(xiàn)方法的對(duì)比,表明本文所提出的模型在睡眠分期判讀的精度上和綜合判別性能上,均具有優(yōu)勢(shì),能夠?yàn)樗哌^(guò)程監(jiān)測(cè)、診斷與治療提供有效可行的輔助判別工具。此外,本文的研究工作主要基于單通道的睡眠腦電信號(hào),在此基礎(chǔ)上可加入其他電生理信號(hào)(如眼電和肌電等),基于更加豐富的信號(hào)來(lái)源,利用該模型進(jìn)行自動(dòng)睡眠分期判別的研究。