許 力,吳云肖,肖 冰,許志飛,張 遠(yuǎn)?
1) 西南大學(xué)電子信息工程學(xué)院,重慶 400715 2) 國家兒童醫(yī)學(xué)中心,首都醫(yī)科大學(xué)附屬北京兒童醫(yī)院,兒童耳鼻咽喉頭頸外科疾病北京市重點(diǎn)實(shí)驗(yàn)室,北京 100045 3) 民航總醫(yī)院呼吸內(nèi)科,北京 100123 4) 國家兒童醫(yī)學(xué)中心,首都醫(yī)科大學(xué)附屬北京兒童醫(yī)院呼吸科,北京100045
對于兒童來說,高質(zhì)量睡眠有助于兒童的智力發(fā)育,與兒童的認(rèn)知功能、學(xué)習(xí)和注意力密切相關(guān)[1]. 兒童若不能夠獲得足夠而良好的睡眠,會(huì)影響智力發(fā)育,造成情緒、行為、注意力等方面的問題[2]. 兒童睡眠障礙一般發(fā)生在2~12歲的兒童身上,兒童睡眠障礙表現(xiàn)為在睡眠過程中出現(xiàn)的各種影響睡眠的異常表現(xiàn)[3]. 它可以由身體某系統(tǒng)的功能失調(diào)引起,也可由疾病引起,能直接影響兒童的睡眠結(jié)構(gòu)、睡眠質(zhì)量及睡眠后復(fù)原程度[4].
為標(biāo)準(zhǔn)化睡眠分期結(jié)果,1968年,Rechtschaffen[7]等提出了睡眠分期準(zhǔn)則(Rechtschaffen and Kales rule),又稱 R&K 準(zhǔn)則. R&K 準(zhǔn)則根據(jù)2路腦電、2路眼電和1路肌電信號將睡眠分為7個(gè)階段,分別為覺醒期(Wake)、睡眠I期(Stage 1,S1)、II期(Stage 2,S2)、III期(Stage 3, S3)、IV 期(Stage 4, S4)、快速眼動(dòng)期(REM)和體動(dòng)期(Movement time, MT)[8]. 2007年,美國睡眠醫(yī)學(xué)學(xué)會(huì)(American Academy of Sleep Medicine, AASM)在R&K準(zhǔn)則的基礎(chǔ)上對睡眠分期標(biāo)準(zhǔn)進(jìn)行了調(diào)整,提出了AASM準(zhǔn)則[9]. 目前AASM準(zhǔn)則已更新至2020版. AASM準(zhǔn)則將R&K準(zhǔn)則中的S3和S4期合并為慢波睡眠期(NREM III期),將睡眠階段重新定義為覺醒期(Wake, W期)、非快速眼動(dòng)期(NREM, N 期)和快速眼動(dòng)期(REM, R 期). 其中NREM被劃分為 NREM I期(N1)、NREM II期(N2)和 NREM III期(N3).
對于睡眠的研究離不開腦電信號(Electroencephalograph, EEG)分析. 腦電信號頻率分為四個(gè)主要頻帶[10]:δ(1~3 Hz)、θ(4~7 Hz)、α(8~13 Hz)、β(14~30 Hz). 除這四種主要頻帶以外,人們在覺醒并專注于某一事時(shí),會(huì)被檢測出一種較 β 波的頻率更高的 γ波(30~80 Hz). 同時(shí),人們在睡眠時(shí)還可能出現(xiàn)其他一些波形較為特殊的腦電波,如:σ波、λ波、K復(fù)合波、μ波等. 腦電信號在不同時(shí)刻會(huì)表現(xiàn)出不同的頻率分量,波形的變化會(huì)受測試者自身狀態(tài)影響,因此極度不穩(wěn)定并且隨機(jī).
美國睡眠研究會(huì)睡眠及其相關(guān)事件判讀手冊[11]中對兒童睡眠分期判讀規(guī)則為:如果全部NREM睡眠記錄幀沒有可識別的睡眠梭形波、K復(fù)合波或0.5~2.0 Hz的高振幅慢波活動(dòng),判讀所有記錄幀為N期(NREM);如果某些NREM睡眠記錄幀含有睡眠梭形波或K復(fù)合波,這些幀判讀為 N2期(NREM 2). 剩余的 NREM睡眠記錄幀,如果慢波活動(dòng)小于記錄幀的20%,判讀為N期;如果NREM睡眠記錄幀慢波活動(dòng)大于20%,判讀為 N3期(NREM 3). 剩余的記錄幀,如果不存在K復(fù)合波或睡眠梭形波,判讀為N期(NREM).成人PSG設(shè)備的EEG、EOG和頦EMG電極的放置適用于兒童,但由于兒童頭型較小,所以頦EMG電極間距離通常需要從2 cm減小到1 cm,EOG電極距眼睛的距離通常需從1 cm減小到0.5 cm.
由于PSG需要專門的睡眠監(jiān)測室及專業(yè)技術(shù)人員分析結(jié)果,且費(fèi)用比較昂貴,技術(shù)要求高,在臨床兒童患者中實(shí)施存在一定難度,對疑似的兒童患者無法大規(guī)模篩查,且患兒依從性不高、配合度差. 而使用單通道EEG可以降低睡眠監(jiān)測的難度,為便攜式可穿戴設(shè)備的開發(fā)提供基礎(chǔ).
目前已有的自動(dòng)睡眠分期方法大多是利用單通道或多通道腦電信號,針對成年人的自動(dòng)睡眠分期規(guī)則,而適用于兒童的自動(dòng)睡眠分期方法很少. 由于兒童與成人的EEG存在差異,如兒童的后部優(yōu)勢節(jié)律(Posterior dominant rhythm,PDR)在不同年齡稍有不同,兒童N1期會(huì)有睡前超同步(HH)和彌散或枕部優(yōu)勢高波幅節(jié)律性3~5 Hz活動(dòng),這個(gè)是成人沒有的,所以很多利用機(jī)器學(xué)習(xí)等方法用于成人的自動(dòng)睡眠分期方法不適用于兒童,因此需要對已有方法進(jìn)行改進(jìn)或提出更適用于兒童腦電特征的自動(dòng)睡眠分期方法.
本文針對睡眠分期這一問題,提出了一種基于單通道腦電信號的端到端一維CNN(1D-CNN)模型,從而克服了手工提取特征受到先驗(yàn)知識的限制;數(shù)據(jù)集包含14位3到10歲健康受試者,從而保證了模型對兒童睡眠分期的有效性.
12歲生日那天,楚艷拿著自己積攢已久的零花錢買了一本《中國世界時(shí)裝之苑》雜志,這是中國上世紀(jì)80年代第一本銅版紙彩色印刷的時(shí)裝雜志。剛一翻開,那些世界級時(shí)裝大師的作品就映入眼簾,獨(dú)特新穎的設(shè)計(jì),超強(qiáng)氣場的模特,精美充滿質(zhì)感的禮服,給年幼的楚艷帶來了極大的震撼。當(dāng)時(shí)楚艷就暗下決心,長大后一定要成為一名服裝設(shè)計(jì)師,親手做出美麗的服裝。后來,楚艷如愿考入北京服裝學(xué)院,能夠近距離地觸碰夢想的影子,在身邊人看來,這仿佛是天注定的。
目前,睡眠分期依然是由睡眠分析技師采用AASM準(zhǔn)則對多導(dǎo)睡眠圖進(jìn)行人工分期,但是由于多導(dǎo)睡眠圖的數(shù)據(jù)量非常大,同時(shí)由于技師本身的主觀因素限制,所以這是一項(xiàng)既耗費(fèi)時(shí)間又難以保持客觀性的睡眠分期行為. 隨著近幾年人工智能的發(fā)展,越來越多的自動(dòng)化技術(shù)被應(yīng)用到了醫(yī)學(xué)影像和醫(yī)學(xué)信號領(lǐng)域.
Dong等[12]提出了一種實(shí)用的方法來解決使用單通道腦電圖(EEG)進(jìn)行睡眠階段分類的局限性. 作者利用整流神經(jīng)網(wǎng)絡(luò)檢測分層特征,利用長短時(shí)記憶(LSTM)網(wǎng)絡(luò)進(jìn)行序列數(shù)據(jù)學(xué)習(xí),優(yōu)化單通道記錄的分類性能. 在探索了替代電極放置后,作者發(fā)現(xiàn)了一個(gè)舒適的放置于前額的單通道腦電電極位置,并表明它可以與其他電極集成,同時(shí)記錄眼電圖(EOG). 通過對62人(494 h睡眠)的數(shù)據(jù)進(jìn)行評估,證明該分析算法比現(xiàn)有的頂點(diǎn)或枕部電極放置方法的性能更好.
Supratak等[13]提出了DeepSleepNet模型,該模型利用卷積神經(jīng)網(wǎng)絡(luò)提取時(shí)間不變特征,并利用雙向長短期記憶自動(dòng)學(xué)習(xí)腦電圖分期間的睡眠轉(zhuǎn)換規(guī)律. 作者采用了兩步訓(xùn)練算法來訓(xùn)練模型,使用來自兩個(gè)公共睡眠數(shù)據(jù)集的不同單通道EEGs(F4-EOG(左)、Fpz-Cz和 Pz-Oz)評估該模型,結(jié)果表明,與最先進(jìn)的方法相比,該模型在兩個(gè)數(shù)據(jù)集上取得了相似的總體精度和f1 score. 這表明,在不改變模型架構(gòu)和訓(xùn)練算法的情況下,該模型可以自動(dòng)從不同數(shù)據(jù)集的原始單通道腦電圖中學(xué)習(xí)睡眠階段評分的特征,實(shí)現(xiàn)自動(dòng)睡眠分期. 與之類似,針對幀和序列進(jìn)行設(shè)計(jì)的模型還有SeqSleepNet[14]、SleepEEGNet[15]、CCRRSleepNet[16],它們共同關(guān)注了睡眠分期的獨(dú)立性與連續(xù)性.
Dehkordi等[17]分析了從脈搏血氧儀光體積描記圖(PPG)中提取的心率變異性的標(biāo)準(zhǔn)特征,以識別不同的睡眠階段. 作者使用多導(dǎo)睡眠圖和Phone OximeterTM記錄了146名兒童的整晚的PPG信號.根據(jù)多導(dǎo)睡眠圖,將記錄分為1 min,并標(biāo)記為Wake,non-REM和REM. 對于每個(gè)時(shí)段,估計(jì)了心率變異性的六個(gè)標(biāo)準(zhǔn)時(shí)域和頻域特征. 作者分別訓(xùn)練了兩個(gè)支持向量機(jī)分類器,以對從睡眠時(shí)期中W期和NREM期進(jìn)行分類. 覺醒和睡眠的分類精度為77%,REM和NREM的分類精度為80%.
基于家庭的兒童睡眠監(jiān)測是一個(gè)急需解決的問題. 由于EEG是了解睡眠的重要標(biāo)準(zhǔn),所以監(jiān)測單通道EEG信號是識別睡眠障礙最有前途的方法. 該方法不需要在用戶身上附加大量的傳感器,更適合兒童的睡眠監(jiān)測,使得數(shù)據(jù)更能反應(yīng)睡眠習(xí)慣. 目前的研究大多從腦電中提取各種特征作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,將深度學(xué)習(xí)模型作為進(jìn)一步特征融合和篩選的工具,沒有充分展現(xiàn)深度學(xué)習(xí)的優(yōu)勢. 因此,為了適應(yīng)當(dāng)前需求,本文提出了一種基于單通道腦電的兒童睡眠分期算法.
卷 積神 經(jīng) 網(wǎng) 絡(luò) (Convolutional neural networks,CNN)是一種深度神經(jīng)網(wǎng)絡(luò). 深度學(xué)習(xí)已在諸如視覺識別,語音識別和自然語言處理等各種問題上取得了很好的成績. 在不同類型的深度神經(jīng)網(wǎng)絡(luò)中,關(guān)于卷積神經(jīng)網(wǎng)絡(luò)的研究最為廣泛[18]. 圖1顯示了CNN的層次結(jié)構(gòu)及應(yīng)用.
圖1 CNN 的層次結(jié)構(gòu)及應(yīng)用Fig.1 CNN architecture and applications
對于兒童睡眠數(shù)據(jù)少的情況,可采用重疊的方法對數(shù)據(jù)集進(jìn)行擴(kuò)充,規(guī)則如下:如果受試者的兩個(gè)連續(xù)時(shí)期具有相同的睡眠階段,則使用滑動(dòng)窗口進(jìn)行重疊,將重疊時(shí)間設(shè)置為25 s,重疊后新幀(Epoch)的睡眠階段標(biāo)簽未更改,如圖2所示.相反,如果兩個(gè)連續(xù)的epoch是不同的睡眠階段,則不會(huì)進(jìn)行重疊.
圖2 數(shù)據(jù)集重疊Fig.2 Datasets overlapping
由于EEG是低頻信號,其頻率主要集中在0.5~40 Hz[19],因此使用了二階巴特沃斯濾波對原始EEG數(shù)據(jù)進(jìn)行了預(yù)處理,消除高頻噪聲和直流成分. 因?yàn)閮和ɑ顒?dòng)通常為高波幅(100~400 μV),所以不對腦電數(shù)據(jù)的振幅進(jìn)行限制.
需要注意的是,由于5個(gè)睡眠分期的epoch數(shù)量不相同且分布不相同,所以數(shù)據(jù)集會(huì)失去平衡性,進(jìn)而影響機(jī)器學(xué)習(xí)算法的性能. 因此,本研究采用了以下策略來調(diào)整每個(gè)睡眠分期的epoch數(shù)量:
(1)統(tǒng)計(jì)數(shù)據(jù)集中每個(gè)睡眠分期的epoch數(shù)量,以其中最小數(shù)量的類型的epoch數(shù)量作為閾值,每種類型的epoch只保留閾值數(shù),其余的epoch被丟棄.
(2)將平衡后的數(shù)據(jù)集按W、N1、N2、N3、R的順序重新排列.
本研究將Alexnet[20]進(jìn)行改進(jìn),利用單通道腦電信號(C4-M1通道),將1D卷積核替換了2D卷積核,并在1D-CNN中添加了批量歸一化層(Batch normalization layer),而卷積核的大小保持不變.1D-CNN模型的示意圖如圖3所示,該模型由5個(gè)卷積層,3個(gè)池化層和3個(gè)完全連接的層組成.
圖3 1D-CNN 模型Fig.3 1D-CNN model
由于1D-CNN的輸入是30 s為一個(gè)epoch的數(shù)據(jù),即1×3840一維時(shí)間序列,因此在模型中使用了1D卷積核. 一維卷積運(yùn)算過程定義為:
第一和第二卷積層分別使用大小為1×22和1×5的大卷積核,而第三到第五卷積層使用大小為1×3的小卷積核. 在第一,第二和第五卷積層之后,本研究利用大小為1×3的maxpooling層來減少特征圖的尺寸. 將最后一個(gè)最大池化層的生成的特征圖展平為一維向量. 該向量被送到全連接層以進(jìn)行二進(jìn)制分類,并獲得最終的識別結(jié)果. 本研究選擇ReLU(整流線性單位)作為激活函數(shù),其定義如下:
批處理歸一化層位于第一卷積層之后,該層可以歸一化特征激活,從而減少內(nèi)部協(xié)變量偏移.批處理規(guī)范化定義如下:
式中,B代表包含m個(gè)樣本的小批量,μB和分別代表B的均值和方差. λ是數(shù)值穩(wěn)定性的常數(shù),γ和β分別是訓(xùn)練過程中計(jì)算出的比例和移位參數(shù),有關(guān)詳細(xì)信息,請參見文獻(xiàn)[21].
針對現(xiàn)實(shí)需求,以PyQt為基礎(chǔ),設(shè)計(jì)開發(fā)了睡眠分期系統(tǒng),方便醫(yī)生的使用,如圖4所示,該圖展示了一段時(shí)長為60 s的多導(dǎo)睡眠圖,圖中展示了前8個(gè)通道的生物電信號,即2個(gè)眼電通道與6個(gè)腦電通道,并用顏色區(qū)分了不同的睡眠分期,可以看到,該60 s由一個(gè)N2期的后半部分、一個(gè)完整的W期和一個(gè)N1期的開始部分組成.
圖4 睡眠分析系統(tǒng)原型Fig.4 Prototype of the sleep analysis system
本研究中使用的數(shù)據(jù)集來自首都醫(yī)科大學(xué)附屬北京兒童醫(yī)院,數(shù)據(jù)集包括來自14位受試者的PSG記錄. 每位受試者至少記錄6條EEG通道,2條EOG通道. 原始數(shù)據(jù)集epoch數(shù)量為14383,重疊、平衡后的epoch數(shù)量為30195.
數(shù)據(jù)預(yù)處理和功能提取部分是在PyCharm 2020.1.2環(huán)境中在具有 64 GB RAM 的 AMD Ryzen7-3700x@3.60 GHz上實(shí)現(xiàn)的. 深度學(xué)習(xí)實(shí)驗(yàn)是在NVIDIA GeForce RTX 2080 Ti上利用 tensorflow 框架在Python環(huán)境中進(jìn)行的.
數(shù)據(jù)預(yù)處利用kaiming初始化器[22]初始化1DCNN中的權(quán)重參數(shù),這可以提高模型的收斂速度.使用Adam優(yōu)化器[23]以0.00001學(xué)習(xí)率進(jìn)行參數(shù)優(yōu)化. 批處理大小為256個(gè). 在此研究中使用了交叉熵?fù)p失函數(shù),其定義為:
式中,En是基本的交叉熵?fù)p失函數(shù),N是訓(xùn)練樣本的數(shù)量,yk和pk分別表示樣本的真實(shí)標(biāo)簽和預(yù)測標(biāo)簽.
為了防止過度擬合問題,本研究使用了dropout和L2正則化方法. Dropout可以在訓(xùn)練過程中以指定的概率隨機(jī)斷開層的各個(gè)單元[24]. L2正則化是在損失函數(shù)之后添加正則項(xiàng)以降低網(wǎng)絡(luò)復(fù)雜性. 具有L2正則化項(xiàng)的交叉熵?fù)p失函數(shù)定義為:
表1 超參數(shù)表Table 1 Model hyperparameters
在這項(xiàng)研究中,準(zhǔn)確率、精確度、召回率、F1得分和Kappa系數(shù)(K)用于評估性能.
本研究是在成人自動(dòng)睡眠分期的研究基礎(chǔ)上,通過改進(jìn)將1D-CNN結(jié)構(gòu)用于兒童自動(dòng)睡眠分期,訓(xùn)練集包括從14位健康受試者中分出的30195個(gè)epoch,使用了14折交叉驗(yàn)證實(shí)驗(yàn),在每一折中,利用1位受試者的數(shù)據(jù)作為測試集,剩下的13位受試者作為訓(xùn)練集,這個(gè)實(shí)驗(yàn)需要重復(fù)14次以保證所有的數(shù)據(jù)都被使用到. 本研究的準(zhǔn)確率為85.57%. 表2各項(xiàng)評價(jià)指標(biāo)的結(jié)果. 在訓(xùn)練和預(yù)測的速度上,本研究所用時(shí)間均遠(yuǎn)小于DeepSleepNet,約為其 1/5.
表2 實(shí)驗(yàn)結(jié)果Table 2 Experimental results
由于訓(xùn)練時(shí)用到了防止過擬合的L2正則化和dropout,而驗(yàn)證的時(shí)候沒有用到正則化和dropout,為了防止出現(xiàn)過擬合,將參數(shù)設(shè)置的較大,因此出現(xiàn)驗(yàn)證準(zhǔn)確率大于訓(xùn)練準(zhǔn)確率的情況.準(zhǔn)確率和損失如圖5和6所示. 圖7顯示了1DCNN模型通過本實(shí)驗(yàn)數(shù)據(jù)獲得的歸一化混淆矩陣,其中數(shù)字代表分類正確或錯(cuò)誤的樣本. 通過混淆矩陣可以看出,Wake、N2、N3和REM期睡眠的分類性能很好. 對于N1期睡眠,存在將N1期睡眠誤分類為Wake、N2和REM期睡眠的情況,因此以后的工作應(yīng)重點(diǎn)研究N1期睡眠的準(zhǔn)確性.
圖5 訓(xùn)練和驗(yàn)證準(zhǔn)確率Fig.5 Training and validation accuracy
圖6 訓(xùn)練和驗(yàn)證損失Fig.6 Training and validation loss
圖7 混淆矩陣Fig.7 Confusion matrix
本研究對Alexnet進(jìn)行改進(jìn),提出了一種基于有標(biāo)簽單通道腦電圖的睡眠分期1D-CNN模型.由于1D-CNN是一個(gè)端到端的學(xué)習(xí)模型,即將特征提取器和分類器集成到一個(gè)算法中. 端到端學(xué)習(xí)方法可以克服手動(dòng)特征提取的局限性,從而提高睡眠分期準(zhǔn)確率. 該模型用于兒童睡眠分期,對未來利用機(jī)器學(xué)習(xí)方法輔助臨床兒童睡眠分期,設(shè)計(jì)了研究方案,為進(jìn)一步研究兒童睡眠障礙奠定了基礎(chǔ). 總體而言,對于基于帶有睡眠階段標(biāo)記的單通道EEG的自動(dòng)睡眠分期,本文介紹的1DCNN模型可以實(shí)現(xiàn)針對于兒童的自動(dòng)睡眠分期.在未來的工作中,仍需要研究更適合于兒童的睡眠分期策略,在基于更大數(shù)據(jù)量的基礎(chǔ)上,進(jìn)行進(jìn)一步的實(shí)驗(yàn). 在大樣本數(shù)據(jù)集下,研究可以選擇更多的睡眠相關(guān)特征進(jìn)行測試,并進(jìn)一步增加一維神經(jīng)網(wǎng)絡(luò)的規(guī)模,最大程度地發(fā)揮深度卷積神經(jīng)網(wǎng)絡(luò)的能力.