宋鈺丹,王 晶,3*,王雪徽,馬朝陽,林友芳,3
(1.北京交通大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,北京 100044;2.北京交通大學(xué) 交通數(shù)據(jù)分析與挖掘北京市重點(diǎn)實(shí)驗(yàn)室,北京 100044;3.民航旅客服務(wù)智能化應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 101318)
睡眠對(duì)人體健康至關(guān)重要,高質(zhì)量的睡眠可以補(bǔ)充人體能量,增強(qiáng)機(jī)體免疫力,幫助人體保持健康的生理和心理狀態(tài)。即使睡眠模式的短暫改變,如急性睡眠剝奪,也可能損害人類的判斷和認(rèn)知能力[1],而長期的睡眠異常與疾病的發(fā)展密切相關(guān),因此,睡眠質(zhì)量的研究對(duì)生物醫(yī)學(xué)實(shí)踐有重要意義。睡眠醫(yī)師通常利用多導(dǎo)睡眠圖(PolySomonGraphy,PSG)評(píng)估睡眠質(zhì)量,其中包括腦電圖(ElectroEncephaloGram,EEG)、眼電圖、肌電圖和心電圖(ElectroCardioGram,ECG)等。PSG 包含豐富的生理信號(hào),但要求受試者在睡眠實(shí)驗(yàn)室中佩戴多種儀器監(jiān)測(cè),限制了它的應(yīng)用場(chǎng)景。本文考慮基于單導(dǎo)EEG和單導(dǎo)ECG的睡眠質(zhì)量評(píng)估,設(shè)置只需少量電極片,不會(huì)給受試者帶來強(qiáng)烈不適,并且可以快速部署到可穿戴設(shè)備等家庭醫(yī)療和移動(dòng)醫(yī)療場(chǎng)景中。
睡眠分期與睡眠呼吸暫停低通氣綜合征(Sleep Apnea Hypopnea Syndrome,SAHS)檢測(cè)是全面評(píng)估睡眠質(zhì)量的重要任務(wù)。睡眠分期是指睡眠醫(yī)師利用PSG 中的生理信號(hào),根據(jù)睡眠分期標(biāo)準(zhǔn),如R&K(Rechtschaffen 和Kales)標(biāo)準(zhǔn)[2]和美國睡眠醫(yī)學(xué)會(huì)(American Academy of Sleep Medicine,AASM)標(biāo)準(zhǔn)[3],對(duì)睡眠階段進(jìn)行分類。EEG 會(huì)隨睡眠階段的變化而變化,常被用于睡眠分期。正常的人類睡眠包含快速眼動(dòng)(Rapid Eye Movement,REM)睡眠和非快速眼動(dòng)(Non-REM,NREM)睡眠,這兩種狀態(tài)循環(huán)交替。具體地,根據(jù)R&K 標(biāo)準(zhǔn),非快速眼動(dòng)階段可以按照睡眠的程度由淺到深進(jìn)一步分為N1、N2、N3 和N4,在AASM 標(biāo)準(zhǔn)中則把N3 與N4 合并為N3。睡眠專家根據(jù)不同階段的占比和循環(huán)過程評(píng)估受試者的睡眠狀況。睡眠呼吸暫停低通氣指睡眠期間持續(xù)10 s 及以上的呼吸暫停或低通氣,并伴有血氧飽和度降低或覺醒。ECG 中包含了呼吸節(jié)律,常用于SAHS 檢測(cè)。臨床上,SAHS可分為阻塞性、中樞性和混合性,通過每小時(shí)呼吸暫停和低通氣次數(shù),即呼吸暫停低通氣指數(shù)(Apnea-Hypopnea Index,AHI)來定量評(píng)估該綜合征的嚴(yán)重程度。SAHS 是最常見的睡眠呼吸障礙,在人群中發(fā)病率較高但不易察覺,可引起覺醒、重復(fù)呼吸短促和睡眠片段化,嚴(yán)重影響睡眠質(zhì)量[4]。長期的睡眠呼吸暫停低通氣可能導(dǎo)致心血管疾病和神經(jīng)系統(tǒng)疾病,增加患高血壓的風(fēng)險(xiǎn),因此,研究睡眠分期和SAHS 檢測(cè)對(duì)全面評(píng)估、改善睡眠質(zhì)量具有重要意義。
目前已經(jīng)有很多自動(dòng)睡眠分期算法和SAHS 檢測(cè)算法,但未考慮二者之間的相互作用關(guān)系。實(shí)際上,睡眠階段和呼吸暫停低通氣是相關(guān)的。從臨床醫(yī)學(xué)來看,SAHS 是一種睡眠障礙,它會(huì)導(dǎo)致睡眠階段頻繁變化,擾亂正常的睡眠周期。圖1 顯示了健康受試者和重度SAHS 患者的睡眠時(shí)相圖,其中:WAKE 表示清醒,REM 表示快速眼動(dòng)睡眠期,N1~N3 分別表示非快速眼動(dòng)階段中的不同時(shí)期。與健康受試者相比,患者頻繁醒來,深度睡眠較少。在睡眠分期與睡眠呼吸暫停低通氣的人工判讀過程中,睡眠醫(yī)師需參考另外一個(gè)任務(wù)的標(biāo)簽確定本任務(wù)的標(biāo)簽。此外,通過對(duì)數(shù)據(jù)集的統(tǒng)計(jì)分析,發(fā)現(xiàn)不同睡眠時(shí)期發(fā)生呼吸暫停低通氣的頻率不同。睡眠階段的變化會(huì)影響阻塞性睡眠呼吸暫停的易感性[5]。具體地,膽堿能介導(dǎo)的舌下神經(jīng)抑制導(dǎo)致頦舌肌張力降低,REM 期內(nèi)上氣道塌陷的趨勢(shì)增加[6],因此許多患者的阻塞性睡眠呼吸暫停在REM 期會(huì)趨于惡化。在SAHS 患者中,REM 期的呼吸暫停比NREM 期持續(xù)時(shí)間更長。在阻塞性睡眠呼吸暫停患者中,REM 期每小時(shí)血氧飽和度下降的頻率比NREM 期高,血氧飽和度水平也更低;相反,如果患者進(jìn)入慢波睡眠,通常會(huì)保持一段較長時(shí)間的穩(wěn)定呼吸[7]??傊叻制诤退吆粑鼤和5屯庀嗷プ饔?,但尚未利用該相關(guān)性提升睡眠生理任務(wù)的性能。
圖1 不同受試者的睡眠時(shí)相圖Fig.1 Hypnograms of different subjects
因此,本文設(shè)計(jì)多任務(wù)學(xué)習(xí)(Multi-Task Learning,MTL)框架建模睡眠階段和睡眠呼吸暫停低通氣之間的相關(guān)性。具體地:1)提出一種MTL 框架,用于睡眠分期和SAHS 檢測(cè),對(duì)睡眠質(zhì)量的全面評(píng)估具有重要意義;2)設(shè)計(jì)自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊,捕獲任務(wù)間的相互作用關(guān)系,構(gòu)造雙流時(shí)間依賴學(xué)習(xí)模塊,從EEG 和ECG 中提取共享特征,建模時(shí)間依賴性;3)在兩個(gè)公開數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,與基準(zhǔn)方法相比,所提方法可以同時(shí)完成這兩項(xiàng)任務(wù),在睡眠分期方面,性能與基準(zhǔn)方法相當(dāng),在SAHS 檢測(cè)方面,能檢測(cè)出更多的患病片段。
自動(dòng)睡眠分期、SAHS 檢測(cè)算法以及高效的MTL 方法是與本文工作相關(guān)的3 個(gè)研究領(lǐng)域。
睡眠醫(yī)師通過識(shí)別EEG 等生理信號(hào)中的一些典型波確定睡眠階段。然而,這一過程繁瑣耗時(shí),且評(píng)分結(jié)果取決于專家的專業(yè)知識(shí)。在早期的研究中,從生理信號(hào)中手動(dòng)提取特征,再利用支持向量機(jī)(Support Vector Machine,SVM)和隨機(jī)森林等分類器分類睡眠階段。文獻(xiàn)[8]中基于單通道腦電信號(hào),利用小波變換算法提取節(jié)律波的能量作為第一部分特征,利用多尺度熵算法選取第二部分特征,隨后輸入分類器實(shí)現(xiàn)睡眠階段識(shí)別。但傳統(tǒng)方法中的數(shù)據(jù)處理、特征設(shè)計(jì)和特征選擇依賴專家的先驗(yàn)知識(shí),耗費(fèi)大量時(shí)間。近年來,深度學(xué)習(xí)技術(shù)迅猛發(fā)展,并在多個(gè)領(lǐng)域取得了較好的效果。深度學(xué)習(xí)方法從輸入數(shù)據(jù)中自動(dòng)提取特征并分類,是一種端到端的學(xué)習(xí)方法。文獻(xiàn)[9]中利用卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)提取單通道EEG 中的時(shí)不變特征,通過雙向長短期記憶(Bi-directional Long Short-Term Memory,BiLSTM)網(wǎng)絡(luò)學(xué)習(xí)睡眠階段之間的過渡規(guī)則。文獻(xiàn)[10]中針對(duì)現(xiàn)階段可用睡眠腦電數(shù)據(jù)皆為類不平衡小數(shù)據(jù)集,深度學(xué)習(xí)模型的直接應(yīng)用進(jìn)行分期效果較差的問題,分別從數(shù)據(jù)集重構(gòu)和模型訓(xùn)練優(yōu)化兩方面入手,提出可用于少量類不均衡原始睡眠腦電數(shù)據(jù)集的深度自動(dòng)睡眠分期模型。GraphSleepNet[11]是一種用于睡眠分期的深度圖神經(jīng)網(wǎng)絡(luò),它的主要優(yōu)點(diǎn)是能自適應(yīng)學(xué)習(xí)不同腦電通道之間的內(nèi)在聯(lián)系。此外,Eldele 等[12]設(shè)計(jì)多分辨率CNN 和自適應(yīng)特征重新校準(zhǔn)提取單導(dǎo)EEG 中的特征,并使用時(shí)間上下文編碼器捕獲所提特征之間的時(shí)間相關(guān)性,進(jìn)而對(duì)樣本進(jìn)行分類。這些深度學(xué)習(xí)模型從多通道或單通道EEG 中提取特征并進(jìn)行分類,多通道EEG 包含更多的信息,但過多的電極片會(huì)給受試者帶來強(qiáng)烈的不適。相反,單通道EEG 的采集不會(huì)對(duì)受試者的睡眠產(chǎn)生很大影響,更適用于家庭監(jiān)測(cè)和移動(dòng)醫(yī)療場(chǎng)景。本文沿用深度學(xué)習(xí)方法,基于單導(dǎo)EEG 對(duì)睡眠階段進(jìn)行分類。
PSG 是診斷SAHS 的金標(biāo)準(zhǔn)。根據(jù)PSG 中的ECG、血氧飽和度、口鼻氣流和胸腹呼吸等信號(hào),專家可以判斷受試者是否有呼吸暫停或低通氣的發(fā)生。由于PSG 不易獲取,人工判讀的復(fù)雜性較高,許多研究基于單導(dǎo)ECG 進(jìn)行SAHS 檢測(cè)。大多數(shù)研究對(duì)ECG 波形、ECG 衍生的心率變異性(Heart Rate Variability,HRV)和ECG 衍生呼吸(ECG-Derived Respiratory,EDR)進(jìn)行分析。Almazaydeh 等[13]提取了RR 間期(RR Interval,RRI)的特征并進(jìn)行組合,使用SVM 分類器檢測(cè)呼吸暫停。與睡眠分期類似,越來越多的研究人員通過神經(jīng)網(wǎng)絡(luò)自動(dòng)提取特征。Wang 等[14]提出了一種改進(jìn)的LeNet-5 卷積神經(jīng)網(wǎng)絡(luò)檢測(cè)SAHS。這些方法需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,例如從ECG 中提取R 波進(jìn)而獲得RRI。Sharan等[15]將原始ECG 輸入殘差網(wǎng)絡(luò)檢測(cè)睡眠呼吸暫停,直接從原始信號(hào)學(xué)習(xí)時(shí)間特征,避免了數(shù)據(jù)預(yù)處理和特征工程造成的信息損失。
通常,EEG 用于睡眠分期,ECG 則在SAHS 檢測(cè)中起主要作用。然而,人體是一個(gè)整體,生理狀態(tài)的變化可以反映在多種生理信號(hào)中。ECG 可以提供與睡眠相關(guān)的生理信息[16],揭示睡眠結(jié)構(gòu),部分研究已經(jīng)使用ECG 信號(hào)進(jìn)行睡眠分期。同理,當(dāng)睡眠呼吸暫停發(fā)作時(shí),EEG 會(huì)移動(dòng)到δ 頻帶以上[17],當(dāng)呼吸暫停結(jié)束時(shí),EEG 也會(huì)出現(xiàn)突然的頻率偏移,即EEG 和ECG 都可用于睡眠分期和SAHS 檢測(cè)。
現(xiàn)有研究分別執(zhí)行睡眠分期和SAHS 檢測(cè),未考慮它們之間的相關(guān)性,實(shí)際上這兩項(xiàng)任務(wù)相關(guān)。因此,本文利用MTL 建模睡眠階段和睡眠呼吸暫停低通氣之間的復(fù)雜相互作用關(guān)系,同時(shí)完成這兩項(xiàng)任務(wù),利用相關(guān)性提升分類性能。
Caruana[18]總結(jié)了MTL 的定義和優(yōu)勢(shì):MTL 是一種歸納遷移的方法,并行學(xué)習(xí)多個(gè)任務(wù),為解決一個(gè)任務(wù)學(xué)到的知識(shí),也可用于解決框架內(nèi)的另一個(gè)任務(wù)。通過并行學(xué)習(xí)多個(gè)任務(wù),學(xué)習(xí)相關(guān)任務(wù)間的共享表示,能夠利用相關(guān)任務(wù)的訓(xùn)練信號(hào)中包含的關(guān)于域的額外信息,并使模型能夠在原始任務(wù)上更好地泛化。
在MTL 中,確定網(wǎng)絡(luò)結(jié)構(gòu)是由多個(gè)任務(wù)共享還是特定于單個(gè)任務(wù)、如何優(yōu)化多個(gè)任務(wù)的損失函數(shù)是兩個(gè)關(guān)鍵問題。近期關(guān)于MTL 在深度學(xué)習(xí)中的研究集中在兩個(gè)方面:網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)和損失函數(shù)優(yōu)化策略。在網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)方面,Misra 等[19]提出了十字繡單元,它可以自動(dòng)學(xué)習(xí)共享表示和特定任務(wù)表示的最佳線性組合。常用的MTL 模型的性能通常對(duì)任務(wù)之間的關(guān)系敏感,因此Ma 等[20]提出了一種新的MTL 方法,即多門混合專家,該方法顯式地從數(shù)據(jù)中建模任務(wù)關(guān)系。在優(yōu)化策略方面,Kendall 等[21]利用每個(gè)任務(wù)的同方差不確定性對(duì)多個(gè)任務(wù)的損失函數(shù)進(jìn)行加權(quán),允許網(wǎng)絡(luò)同時(shí)學(xué)習(xí)具有不同數(shù)量級(jí)損失函數(shù)的多個(gè)任務(wù)。
近期,MTL 已初步應(yīng)用于各種生物醫(yī)學(xué)任務(wù)中。在預(yù)測(cè)情緒、壓力和健康方面,Taylor 等[22]使用MTL 技術(shù)訓(xùn)練個(gè)性化機(jī)器學(xué)習(xí)模型,并解釋了個(gè)體差異。Pang 等[23]利用深度多任務(wù)循環(huán)神經(jīng)網(wǎng)絡(luò),將抑郁癥分類主任務(wù)與一類度量學(xué)習(xí)和異常排序兩個(gè)輔助任務(wù)聯(lián)合優(yōu)化。Bendjoudi 等[24]提出了一種基于上下文的多標(biāo)簽多任務(wù)情感識(shí)別的深度學(xué)習(xí)架構(gòu),并設(shè)計(jì)了一個(gè)新的多標(biāo)簽焦點(diǎn)損失函數(shù)。
總之,已有方法分別執(zhí)行睡眠分期或SAHS 檢測(cè),未將MTL 方法應(yīng)用在睡眠生理任務(wù)中,探索任務(wù)間的相關(guān)性提升性能。本文設(shè)計(jì)MTL 框架,建模睡眠分期與睡眠呼吸暫停低通氣之間的相互作用關(guān)系,并利用相關(guān)性提升分類性能。
本文方法的總體架構(gòu)如圖2 所示,包含3 個(gè)主要模塊:1)雙流時(shí)間依賴學(xué)習(xí)模塊;2)自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊;3)分類。首先,利用兩流CNN 并行提取共享EEG 與ECG特征,將它們?nèi)诤汐@得多模態(tài)共享特征;其次,利用全連接(Fully Connected,F(xiàn)C)層和激活函數(shù)實(shí)現(xiàn)兩個(gè)分類器分支,進(jìn)而實(shí)現(xiàn)睡眠分期和SAHS 檢測(cè)。在得到睡眠分期的預(yù)測(cè)結(jié)果后,利用自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊建模兩者之間的相互作用關(guān)系,輔助SAHS 檢測(cè)。
圖2 本文方法總體架構(gòu)Fig.2 Overall framework of proposed method
雙流時(shí)間依賴學(xué)習(xí)模塊是所提方法的第一個(gè)關(guān)鍵部分。在睡眠分期和SAHS 檢測(cè)兩個(gè)任務(wù)的聯(lián)合監(jiān)督下,該模塊分別從EEG 和ECG 提取共享特征,學(xué)習(xí)時(shí)間依賴性,用于后續(xù)分類。特征提取模塊的具體結(jié)構(gòu)如圖3 所示,輸入信號(hào)是單通道EEG 或ECG,相鄰epoch 的信息可以幫助網(wǎng)絡(luò)更好地建模睡眠評(píng)分規(guī)則,檢測(cè)到更多的呼吸暫停事件,所以輸入信號(hào)還包含當(dāng)前樣本前后的各兩個(gè)epoch,學(xué)習(xí)生理信號(hào)中的時(shí)間依賴性。該結(jié)構(gòu)由7 層一維CNN 和殘差連接組成,提取腦電與心電信號(hào)中的波形特征。前6 層中的每一層都包含卷積層、批歸一化(Batch Normalization,BN)層、ReLU 激活函數(shù)和最大池化層,逐層降維。為了降低過擬合風(fēng)險(xiǎn),每兩個(gè)卷積層后都加入了概率為0.5 的dropout 層。第7 層的卷積核大小為1、通道數(shù)為5,將輸入特征從32 通道降到5 通道。為了提高網(wǎng)絡(luò)的表示能力,在第2 層和第6 層之間添加殘差連接,利用卷積池化等操作將輸入特征的尺寸與第6 層輸出的特征尺寸進(jìn)行匹配,以進(jìn)行相加,最終得到每個(gè)30 s EEG epoch 對(duì)應(yīng)的5 通道特征。對(duì)于輸入的多個(gè)epoch,先逐個(gè)epoch 提取特征,再進(jìn)行拼接聚合,以獲得整體特征。假設(shè)有5 個(gè)30 s 的EEG epoch {si-2,si-1,si,si+1,si+2},用腦電特征提取模塊提取第i個(gè)epoch 的特征fi,整體特征為,該過程如式(1)與式(2)所示:
圖3 時(shí)間依賴學(xué)習(xí)模塊Fig.3 Time-dependency learning module
腦電與心電都是電極片測(cè)得的人體體表的電信號(hào),它們的數(shù)值在量級(jí)上也比較相近,約為幾百微伏,采樣頻率也相同,所以本文采用圖3 的通用結(jié)構(gòu)并行地處理EEG 與ECG,獲得心電特征。獲得相同尺寸的共享EEG 與ECG 特征后,如式(3)所示按元素相加進(jìn)行特征融合,得到最終特征Fi,實(shí)驗(yàn)結(jié)果表明按元素相加方法優(yōu)于按通道拼接的方法。
如引言中所述,睡眠分期與睡眠呼吸暫停低通氣相關(guān),在不同的睡眠時(shí)期,呼吸暫停低通氣的發(fā)生概率和嚴(yán)重程度也不同??紤]到該相關(guān)性,設(shè)計(jì)了自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊,建模睡眠時(shí)期與呼吸暫停低通氣它們之間的相互作用關(guān)系,將該相互作用關(guān)系與提取的共享特征相結(jié)合,提升分類性能。
具體地,許多患者的阻塞性睡眠呼吸暫停嚴(yán)重程度在REM 期趨于惡化。在呼吸暫?;颊咧校琑EM 期的呼吸暫停持續(xù)時(shí)間比NREM 期更長;相反,如果患者能進(jìn)入慢波睡眠,他們通常能保持較長時(shí)間的穩(wěn)定呼吸[7],即在不同的睡眠階段,患者發(fā)生睡眠呼吸暫停低通氣的概率和嚴(yán)重性不同。根據(jù)數(shù)據(jù)集的統(tǒng)計(jì)分析,在REM 期更易發(fā)生呼吸暫停低通氣,在N3 期則較少。如圖4 所示,本文將通道注意力機(jī)制應(yīng)用于多任務(wù)學(xué)習(xí)框架,學(xué)習(xí)任務(wù)間的關(guān)聯(lián)性,建模不同睡眠時(shí)期發(fā)生呼吸暫停和低通氣的可能性輔助SAHS 檢測(cè)。
圖4 自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊Fig.4 Adaptive inter-task correlation learning module
注意力機(jī)制在人類感知中起著重要作用。人類通常不會(huì)試圖一次性處理整個(gè)場(chǎng)景,而是選擇性地關(guān)注較為突出的部分。從廣義上講,注意力機(jī)制是一種工具,它為不同的部分分配不同的權(quán)重,將處理資源更多地分配給信息量較大的部分。Hu 等[25]提出了“擠壓和激勵(lì)”結(jié)構(gòu),顯式建模信道之間的相互依賴性,自適應(yīng)地重新校準(zhǔn)信道特征響應(yīng),通過全局平均池化將全局空間信息壓縮至信道描述符。隨后用全連接層和sigmoid 激活函數(shù)實(shí)現(xiàn)激勵(lì)操作,利用擠壓操作中聚集的信息,建模信道依賴性。
本文旨在利用通道注意力機(jī)制學(xué)習(xí)不同睡眠時(shí)期發(fā)生呼吸暫停低通氣的概率。如2.1 節(jié)所述,首先提取到5 通道的共享腦電與心電特征,隨后將特征輸入由FC 和Softmax 激活函數(shù)實(shí)現(xiàn)的分類器分支,獲得長度為5 的概率向量,確定該樣本的睡眠階段。該過程可以描述為式(4):
在MTL 中,如何聯(lián)合優(yōu)化多個(gè)任務(wù)的損失函數(shù)至關(guān)重要,如式(8)所示,聯(lián)合損失的常見形式是多個(gè)任務(wù)損失函數(shù)的加權(quán)和:
其中:k是任務(wù)數(shù),wi和Losstaski分別代表第i個(gè)任務(wù)的權(quán)重和損失函數(shù)。在訓(xùn)練過程中,合適的權(quán)重能平衡各個(gè)任務(wù),防止模型偏向于數(shù)值較大的損失函數(shù)[26],使網(wǎng)絡(luò)參數(shù)收斂到對(duì)所有任務(wù)都有用的魯棒的共享特征。由于睡眠分期的損失函數(shù)和SAHS 檢測(cè)的損失函數(shù)具有相同的數(shù)量級(jí),并且這兩個(gè)任務(wù)同等重要,因此如式(9)所示,所提方法的目標(biāo)函數(shù)是兩個(gè)損失函數(shù)之和:
為了評(píng)估所提方法的性能,在兩個(gè)公開數(shù)據(jù)集上使用都柏林大學(xué)學(xué)院睡眠呼吸暫停數(shù)據(jù)庫和ISRUC睡眠數(shù)據(jù)集實(shí)驗(yàn)。
3.1.1 都柏林大學(xué)學(xué)院睡眠呼吸暫停數(shù)據(jù)庫(UCD數(shù)據(jù)集)
都柏林大學(xué)學(xué)院睡眠呼吸暫停數(shù)據(jù)庫[27]包含25 名疑似睡眠呼吸障礙患者的整晚PSG,這些患者是從都柏林圣文森大學(xué)醫(yī)院睡眠障礙門診隨機(jī)選擇的,平均年齡50±10 歲。PSG 中包含128 Hz 的EEG 信號(hào)、128 Hz 的ECG 信號(hào)、眼電信號(hào)、下頜肌電信號(hào)等其他多模態(tài)生理信號(hào)。每個(gè)30 s 的epoch 被標(biāo)記為6 個(gè)睡眠階段(WAKE、N1、N2、N3、N4 和REM)之一或UNKNOWN,排除了UNKNOWN 數(shù)據(jù),因?yàn)樵摌?biāo)簽不屬于睡眠分期研究的任何一個(gè)階段,通常出現(xiàn)在一整晚記錄的首尾,并根據(jù)AASM 標(biāo)準(zhǔn)將N3 和N4 階段合并為N3。此外,睡眠醫(yī)師對(duì)呼吸事件的開始時(shí)間和持續(xù)時(shí)間進(jìn)行了標(biāo)注。呼吸事件包括阻塞性、中樞性、混合性呼吸暫停和低通氣,以及周期性呼吸事件。忽略了周期性呼吸事件,合并了呼吸暫停和低通氣的不同類別。為了與睡眠分期標(biāo)簽一致,以每30 s 為一個(gè)epoch,如果在30 s 內(nèi)有超過5 s 的呼吸暫停或低通氣,該epoch 將被標(biāo)記為陽性。
3.1.2 ISRUC-sleep數(shù)據(jù)集
ISRUC-sleep 數(shù)據(jù)集[28]包括3 個(gè)子集,其中每個(gè)PSG 記錄都是在科因布拉大學(xué)醫(yī)院睡眠醫(yī)學(xué)中心采集的記錄中隨機(jī)選擇的。本文采用了子集I進(jìn)行實(shí)驗(yàn),因?yàn)榇蠖鄶?shù)受試者都檢測(cè)到了呼吸暫停低通氣事件。子集I 包含100 個(gè)受試者的整晚PSG記錄,平均年齡51±16歲,每個(gè)記錄包含多通道生理信號(hào),如100 Hz的EEG 信號(hào)、100 Hz的ECG 信號(hào)和眼電信號(hào)等。該子集的所有記錄被劃分為30 s的epoch,每個(gè)epoch標(biāo)記了對(duì)應(yīng)的睡眠時(shí)期(WAKE、N1、N2、N3和REM)和呼吸事件(混合性、中樞性、阻塞性低通氣和中樞性、阻塞性呼吸暫停),合并了不同類型的呼吸暫停和低通氣,并將該epoch標(biāo)記為陽性。
3.1.3 數(shù)據(jù)預(yù)處理
由于PSG 采集成本較高,在日常生活中不易獲取,本文基于單導(dǎo)EEG 和單導(dǎo)ECG 進(jìn)行睡眠質(zhì)量評(píng)估。睡眠階段之間的過渡遵循一定的原則,睡眠呼吸暫停低通氣事件通??缭蕉鄠€(gè)epoch。因此,使用當(dāng)前和相鄰時(shí)期窗口(前兩個(gè)和后兩個(gè)epoch)的數(shù)據(jù)作為輸入,來預(yù)測(cè)當(dāng)前時(shí)期的睡眠分期標(biāo)簽和呼吸暫停低通氣標(biāo)簽。將每個(gè)受試者的數(shù)據(jù)(C3-A2 導(dǎo)聯(lián)EEG、V2 導(dǎo)聯(lián)ECG,對(duì)應(yīng)的睡眠分期標(biāo)簽和睡眠呼吸暫停低通氣標(biāo)簽)平均分成5 部分,每個(gè)部分的前80%作為訓(xùn)練片段,后20%作為測(cè)試片段。對(duì)于每個(gè)訓(xùn)練或測(cè)試片段,使用長度為5 個(gè)epoch 的窗口進(jìn)行滑動(dòng),步長為一個(gè)epoch,最終獲得包含上下文信息的輸入樣本,且訓(xùn)練片段和測(cè)試片段之間沒有重疊。將所有受試者的數(shù)據(jù)拼接起來,獲得最終的訓(xùn)練集和測(cè)試集。在一整晚的睡眠中,不同時(shí)期睡眠階段的分布是不同的,開始和結(jié)尾多WAKE 期,前半夜多N3 期,后半夜多N2 期和REM 期。同理,睡眠呼吸暫停事件在整夜睡眠中也不是均勻分布的,因此分層抽樣的方式使得訓(xùn)練集數(shù)據(jù)更加均衡。數(shù)據(jù)集的詳細(xì)統(tǒng)計(jì)信息如表1 和表2 所示。表1 給出了UCD 和ISRUC 兩個(gè)數(shù)據(jù)集在上述的數(shù)據(jù)劃分方式下,睡眠分期5 類標(biāo)簽的樣本量和占比;表2 給出了UCD 和ISRUC 兩個(gè)數(shù)據(jù)集在上述的數(shù)據(jù)劃分方式下,SAHS 檢測(cè)中兩類標(biāo)簽的樣本量和占比。劃分完成后,在訓(xùn)練集和測(cè)試集內(nèi)部對(duì)每個(gè)通道的生理信號(hào)進(jìn)行z-score 標(biāo)準(zhǔn)化,以消除受試者差異性對(duì)生理信號(hào)數(shù)值的影響。z-score 標(biāo)準(zhǔn)化定義如式(10)所示:
表1 數(shù)據(jù)集睡眠分期統(tǒng)計(jì)信息Tab.1 Statistics of datasets about sleep stages
表2 數(shù)據(jù)集睡眠呼吸暫停低通氣統(tǒng)計(jì)信息Tab.2 Statisticss of datasets about sleep apnea hypopnea
其中:x是待標(biāo)準(zhǔn)化的數(shù)據(jù),μ和σ分別是x的均值和標(biāo)準(zhǔn)差。
采用總體準(zhǔn)確率(Accuracy,ACC)、宏F1 分?jǐn)?shù)(Macro F1-score,MF1)和受試者特性曲線下面積(Area Under Curve of Receiver Operating Characteristic,ROC-AUC)這3 個(gè)指標(biāo)評(píng)估睡眠分期的性能。ROC-AUC 是ROC 曲線與坐標(biāo)軸包圍的區(qū)域,其中橫軸是假陽性率,縱軸是真陽性率,它可以全面衡量分類器的性能,ROC-AUC 越高,分類性能越好。
對(duì)于SAHS 檢測(cè),采用ACC、宏F2 分?jǐn)?shù)(Macro F2-score,MF2)、ROC-AUC 和召回率(Recall)來進(jìn)行評(píng)估。在機(jī)器學(xué)習(xí)的二分類問題中,值得關(guān)注的類通常被視為陽性(如呼吸暫停和低通氣),另一類則為陰性。雖然假陽性(False Positive,F(xiàn)P)和假陰性(False Negative,F(xiàn)N)都是疾病初篩中的誤診,假陽性只需要進(jìn)一步檢查,而假陰性可能會(huì)導(dǎo)致患者錯(cuò)過最佳診斷和治療機(jī)會(huì),因此,在SAHS 檢測(cè)中,召回率比精確率更重要,它可以反映陽性樣本被正確分類的比例。如式(13)所示,F(xiàn)-score 是同時(shí)考慮精確率(Precision)和召回率的指標(biāo),P是正確預(yù)測(cè)為正類的占全部預(yù)測(cè)為正類的比例,R是正確預(yù)測(cè)為正類的占全部實(shí)際為正類的比例??梢酝ㄟ^修改β改變精確率和召回率之間的相對(duì)重要性。如果β<1,精確率更重要;如果β=1,二者同等重要;如果β>1,則召回率更重要。因此,如式(14)所示在睡眠分期任務(wù)上選取MF1 來評(píng)估分類性能,如式(15)所示,在SAHS 檢測(cè)中,使用MF2 來評(píng)估性能,重點(diǎn)關(guān)注本文方法和基準(zhǔn)方法對(duì)患病片段(陽性樣本)的檢測(cè)能力。給定真陽性(True Positive,TP)、FP、真陰性(True Negative,TN)、FN,上述指標(biāo)的定義如式(11)~(15)所示:
采用PyTorch 1.4 構(gòu)建并復(fù)現(xiàn)了基準(zhǔn)方法,批大小設(shè)置為64,選用Adam 優(yōu)化器最小化損失函數(shù),學(xué)習(xí)率設(shè)置為0.001,進(jìn)行300 輪訓(xùn)練,以獲得穩(wěn)定的性能。
為了驗(yàn)證本文方法的有效性,將所提方法與近年先進(jìn)的單導(dǎo)EEG 睡眠分期單任務(wù)學(xué)習(xí)(Single-Task Learning,STL)方法、單導(dǎo)ECG 的SAHS 檢測(cè)STL 方法進(jìn)行對(duì)比。
3.4.1 基準(zhǔn)方法
盡管已有很多MTL 方法,但這些方法可能不適用于EEG和ECG 等生理信號(hào)和睡眠生理任務(wù),或者對(duì)網(wǎng)絡(luò)結(jié)構(gòu)有特定要求,不便應(yīng)用到本文方法中。因此,將本文方法與以下單通道EEG 的睡眠分期STL 基準(zhǔn)方法和單導(dǎo)聯(lián)ECG 的SAHS檢測(cè)STL 基準(zhǔn)方法進(jìn)行了比較。這些STL 基準(zhǔn)方法的簡要描述如下:
DeepSleepNet 一種基于原始單通道EEG 的CNN-LSTM模型,提取時(shí)不變特征并學(xué)習(xí)睡眠階段的過渡規(guī)則[9]。
12-layer CNN 基于單通道EEG 的12 層CNN 睡眠分期模型[15]。
TinySleepNet DeepSleepNet 模型的改進(jìn)版本,該模型利用CNN 和LSTM 更有效地對(duì)睡眠階段進(jìn)行分類[29]。
AttnSleep 基于單通道EEG 進(jìn)行睡眠分期,使用多分辨率CNN、自適應(yīng)特征重新校準(zhǔn)提取特征,用時(shí)間上下文編碼器捕獲所提取特征之間的時(shí)間相關(guān)性[12]。
6-layer CNN 基于CNN 架構(gòu),使用單導(dǎo)ECG 記錄對(duì)正常、阻塞性睡眠呼吸暫停和低通氣進(jìn)行分類[30]。
1D-ResNet 使用單導(dǎo)ECG 信號(hào)檢測(cè)睡眠呼吸暫停的一維殘差神經(jīng)網(wǎng)絡(luò),采用加權(quán)交叉熵?fù)p失函數(shù),解決呼吸暫停樣本和正常樣本之間的類不均衡情況[15]。
為了對(duì)比不同方法的性能,使用了AttnSleep[12]公開的代碼,并復(fù)現(xiàn)了其他基準(zhǔn)方法。一些已發(fā)布的基準(zhǔn)方法代碼基于Tensorflow 框架實(shí)現(xiàn),公平起見,使用PyTorch 框架進(jìn)行復(fù)現(xiàn),在相同的數(shù)據(jù)集和實(shí)驗(yàn)設(shè)置下評(píng)估了所有方法的性能。
3.4.2 性能比較
在兩個(gè)公開數(shù)據(jù)集上比較了本文方法與STL 基準(zhǔn)方法在睡眠分期任務(wù)上的ACC、MF1 和ROC-AUC,以及SAHS 檢測(cè)任務(wù)上的ACC、MF2、ROC-AUC 和Recall 指標(biāo)。
為了使實(shí)驗(yàn)結(jié)果更具說服力,在5 個(gè)隨機(jī)種子下測(cè)試了所有方法,并記錄了5 次實(shí)驗(yàn)中所有評(píng)估指標(biāo)的均值和標(biāo)準(zhǔn)差。若將長度為5 個(gè)epoch 的樣本全部打亂再隨機(jī)分成k折進(jìn)行交叉驗(yàn)證,每個(gè)樣本中相鄰epoch 的數(shù)據(jù)也會(huì)出現(xiàn)在其他樣本中,即部分?jǐn)?shù)據(jù)可能同時(shí)出現(xiàn)在訓(xùn)練集和測(cè)試集,造成數(shù)據(jù)泄漏。并且,將樣本全部打亂也會(huì)切斷睡眠的連續(xù)性,也會(huì)切斷一個(gè)連續(xù)的呼吸暫停低通氣事件。因此在輸入樣本需要包含相鄰epoch 的情況下,本文選擇了前文所述的數(shù)據(jù)劃分和實(shí)驗(yàn)設(shè)置。此種數(shù)據(jù)劃分方式下訓(xùn)練集和測(cè)試集已經(jīng)包含了不同的數(shù)據(jù)分布,在一定程度上消除了數(shù)據(jù)分布對(duì)方法性能波動(dòng)性的影響;同時(shí),在實(shí)驗(yàn)過程中發(fā)現(xiàn)在不同的隨機(jī)種子下,實(shí)驗(yàn)結(jié)果也會(huì)隨著初始化過程中的隨機(jī)因素而波動(dòng),因此隨機(jī)選取了5 個(gè)種子進(jìn)行實(shí)驗(yàn),探究方法在不同種子(即不同初始化)情況下的分類性能和魯棒性。
所提方法從單通道EEG 和單導(dǎo)聯(lián)ECG 信號(hào)中提取共享特征,進(jìn)行睡眠分期以及SAHS 檢測(cè),而STL 基準(zhǔn)方法基于單通道EEG 或單導(dǎo)聯(lián)ECG 分別完成兩個(gè)任務(wù)。公平起見,使用腦電特征提取器提取EEG 特征進(jìn)行睡眠分期,使用心電特征提取器提取ECG特征進(jìn)行SAHS檢測(cè)。在UCD數(shù)據(jù)集上的結(jié)果表明,采用與STL基準(zhǔn)相同的輸入輸出設(shè)置時(shí),所提方法的特征提取模塊可以實(shí)現(xiàn)與STL基準(zhǔn)方法相當(dāng)?shù)男阅?。以睡眠分期為例,UCD 數(shù)據(jù)集上基于EEG 的睡眠分期任務(wù)中ACC、MF1 和ROC-AUC 分別為74.13%、73.01%和0.933 2,這些指標(biāo)表明,MTL 框架的有效性主要?dú)w功于MTL 機(jī)制和任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊,而不是引入更多的生理信號(hào)。
表3、4 分別報(bào)告了本文方法與睡眠分期STL 基準(zhǔn)方法和SAHS 檢測(cè)STL 基準(zhǔn)方法在UCD 數(shù)據(jù)集和ISRUC 數(shù)據(jù)集上的性能比較。在睡眠分期任務(wù)上,本文方法在兩個(gè)數(shù)據(jù)集上實(shí)現(xiàn)了與基準(zhǔn)方法相當(dāng)或更好的分類性能。如表3 所示,在UCD 數(shù)據(jù)集上,與基準(zhǔn)方法相比,本文方法在所有評(píng)估指標(biāo)上都達(dá)到了更好的分類性能,其中一次實(shí)驗(yàn)的混淆矩陣如圖5 所示,矩陣中每個(gè)元素代表實(shí)際類別為縱坐標(biāo)值并且預(yù)測(cè)類別為橫坐標(biāo)值的樣本數(shù)量,以此來評(píng)估分類性能。
表3 UCD數(shù)據(jù)集和ISRUC數(shù)據(jù)集上基準(zhǔn)方法與本文方法的睡眠分期性能比較Tab.3 Sleep stage classification performance comparison between proposed method and baseline methods on UCD and ISRUC datasets
圖5 UCD數(shù)據(jù)集睡眠分期混淆矩陣Fig.5 Confusion matrix of sleep staging on UCD dataset
對(duì)于SAHS 檢測(cè),本文方法在兩個(gè)數(shù)據(jù)集上都獲得了較好的結(jié)果。盡管所提方法的ACC 略低于其他方法,但獲得了更高的MF2、ROC-AUC 和Recall,UCD 數(shù)據(jù)集上一次實(shí)驗(yàn)的混淆矩陣如圖6 所示,即所提方法檢測(cè)到了更多的呼吸暫停和低通氣片段。在一整晚的睡眠中,呼吸暫停低通氣的標(biāo)簽通常比正常標(biāo)簽少得多,高的ACC 可能無法全面證明某方法的優(yōu)越性。例如,100 個(gè)樣本中有10 個(gè)呼吸暫停低通氣樣本和90 個(gè)正常樣本,不作任何學(xué)習(xí),將所有樣本預(yù)測(cè)為正常,ACC 仍然高達(dá)90%,然而,該方法不具備區(qū)分呼吸暫停低通氣樣本和正常樣本的能力。
圖6 UCD數(shù)據(jù)集睡眠呼吸暫停低通氣檢測(cè)混淆矩陣Fig.6 Confusion matrix of SAHS detection on UCD dataset
根據(jù)表1、2 所示的數(shù)據(jù)集統(tǒng)計(jì)結(jié)果,以30 s 的epoch 為一個(gè)樣本,UCD 數(shù)據(jù)集中的呼吸暫停低通氣樣本與正常樣本的比例約為1∶4,ISRUC 數(shù)據(jù)集中的比例約1∶12。與基準(zhǔn)方法相比,本文方法側(cè)重于檢測(cè)更多的呼吸暫停和低通氣,這對(duì)于SAHS 的初步篩查具有重要意義,因此,本文方法的ACC 雖略低于基準(zhǔn)方法,但從睡眠疾病初篩的角度,本文方法優(yōu)于STL基準(zhǔn)方法。由于ISRUC 上的呼吸暫停和低通氣樣本數(shù)較少,ISRUC 數(shù)據(jù)集上各方法的總體性能比UCD 數(shù)據(jù)集上的性能略差。然而與基準(zhǔn)方法相比,本文方法仍達(dá)到了相當(dāng)或更好的性能。如表4 所示,在ISRUC 數(shù)據(jù)集上本文方法與6-layer CNN模型具有相當(dāng)?shù)腁CC,但Recall提高到了39.11%。
表4 UCD數(shù)據(jù)集ISRUC數(shù)據(jù)集上基準(zhǔn)方法與本文方法的SAHS檢測(cè)性能比較Tab.4 SAHS detection performance comparison between proposed method and baseline methods on UCD and ISRUC datasets
在SAHS 檢測(cè)研究中,大多數(shù)研究人員在Apnea-ECG 數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),該數(shù)據(jù)集包含35 個(gè)訓(xùn)練記錄的17 010 個(gè)樣本(其中6 514 個(gè)呼吸暫停樣本)和35 個(gè)測(cè)試記錄的17 268個(gè)樣本(其中6 550 個(gè)呼吸暫停樣本)。每個(gè)樣本長度為1 min,并標(biāo)記有阻塞性呼吸暫停、低通氣、混合性呼吸暫停或正常標(biāo)簽。然而Papini 等[31]發(fā)現(xiàn),在該數(shù)據(jù)集上成功訓(xùn)練的呼吸暫停檢測(cè)算法,在其他包含呼吸暫停事件的數(shù)據(jù)集上表現(xiàn)不佳。該研究表明,用于訓(xùn)練模型的數(shù)據(jù)集會(huì)影響SAHS 檢測(cè)算法的性能。Apnea-ECG 數(shù)據(jù)集不包含復(fù)雜多樣的睡眠呼吸暫停和低通氣樣本,用該數(shù)據(jù)集訓(xùn)練的模型不能輕易遷移到復(fù)雜的睡眠呼吸暫停場(chǎng)景中。因此,大部分論文中報(bào)告的呼吸暫停檢測(cè)方法在Apnea-ECG 數(shù)據(jù)集上的表現(xiàn)更好,但是本文選擇的兩個(gè)數(shù)據(jù)集更接近患者的實(shí)際情況,能夠反映算法在實(shí)際應(yīng)用場(chǎng)景中的性能。
在兩個(gè)公開數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本文方法可以同時(shí)實(shí)現(xiàn)睡眠分期和SAHS 檢測(cè)。在睡眠分期上,本文方法達(dá)到了與基準(zhǔn)方法相當(dāng)?shù)乃?,在SAHS 檢測(cè)任務(wù)上,檢測(cè)到了更多的患病片段,對(duì)于SAHS 的初步篩查和睡眠質(zhì)量的綜合評(píng)估具有重要意義。
雙流時(shí)間依賴學(xué)習(xí)模塊、多任務(wù)學(xué)習(xí)機(jī)制和自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)是該方法的關(guān)鍵部分,為了進(jìn)一步分析每個(gè)模塊的有效性,在UCD 數(shù)據(jù)集上進(jìn)行了消融實(shí)驗(yàn),表5 顯示了實(shí)驗(yàn)結(jié)果。3 種變體如下。
表5 UCD數(shù)據(jù)集上消融實(shí)驗(yàn)結(jié)果Tab.5 Ablation study results conducted on UCD dataset
1)A:基于單導(dǎo)EEG 和單導(dǎo)ECG 的雙流STL 方法,用于SAHS 檢測(cè)。
2)B:基于單導(dǎo)EEG 和單導(dǎo)ECG 的雙流MTL 方法,用于睡眠分期和SAHS 檢測(cè)。
3)C:本文提出的基于單導(dǎo)EEG 和單導(dǎo)ECG 的雙流MTL方法,具有自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊,用于睡眠分期和SAHS 檢測(cè)。
如表5 所示,使用單導(dǎo)EEG 和單導(dǎo)ECG 進(jìn)行SAHS 檢測(cè)的STL 方法的性能優(yōu)于基準(zhǔn)方法,表明雙流時(shí)間依賴學(xué)習(xí)模塊提取到了有效的特征,用于檢測(cè)呼吸暫停和低通氣。
基于該STL 方法引入MTL 機(jī)制,共享特征提取模塊,設(shè)置兩個(gè)特定任務(wù)的分類器分支,實(shí)現(xiàn)睡眠分期和SAHS 檢測(cè)。通過并行訓(xùn)練兩個(gè)任務(wù),提取共享特征,利用任務(wù)間的相關(guān)性提升性能。如表7 所示,引入睡眠分期后,SAHS 檢測(cè)的性能有所提升,同時(shí),睡眠分期的性能與基準(zhǔn)方法持平。這種在所有任務(wù)之間共享隱藏層并保留多個(gè)特定任務(wù)輸出層的方式是硬參數(shù)共享,是神經(jīng)網(wǎng)絡(luò)中最常用的MTL 結(jié)構(gòu)。硬參數(shù)共享大幅降低了過度擬合的風(fēng)險(xiǎn),并行學(xué)習(xí)的任務(wù)越多,就越需要學(xué)到一個(gè)能夠滿足所有任務(wù)的表示,在原始任務(wù)上過擬合的可能性就越小[26]。
如引言所述,睡眠分期和睡眠呼吸暫停低通氣是相關(guān)的,因此設(shè)計(jì)了自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊,學(xué)習(xí)不同睡眠時(shí)期發(fā)生呼吸暫停低通氣的概率。與方法B 相比,方法C在睡眠分期上表現(xiàn)更好,在SAHS 檢測(cè)任務(wù)中,也取得了更高的MF2 和Recall。實(shí)驗(yàn)結(jié)果表明,自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊可以建模睡眠分期和呼吸暫停低通氣之間的相互作用關(guān)系,利用當(dāng)前輸入樣本的睡眠分期結(jié)果和該時(shí)期發(fā)生呼吸暫停低通氣的概率輔助SAHS 檢測(cè)。
為了驗(yàn)證自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊的有效性,訓(xùn)練完成后,記錄了該模塊分配給各睡眠時(shí)期的權(quán)重,并統(tǒng)計(jì)了UCD 數(shù)據(jù)集的訓(xùn)練集中每個(gè)睡眠時(shí)期發(fā)生阻塞性呼吸暫停低通氣的頻率,結(jié)果如表6 所示。
表6 UCD數(shù)據(jù)集上訓(xùn)練集中各時(shí)期發(fā)生睡眠呼吸暫停低通氣的頻率以及訓(xùn)練過程中最后五輪的平均權(quán)重Tab.6 Probability of sleep apnea hypopnea of each stage and average weight in last five rounds on training set in UCD dataset
研究結(jié)果表明,呼吸暫停更易發(fā)生在REM、N1 和N2 期,而較少發(fā)生在WAKE 和N3 期。表6 為訓(xùn)練過程中最后5 輪的平均權(quán)重,其中REM、N1 和N2 期的權(quán)重較大,而WAKE 期的權(quán)重較小。由于N3 的樣本較少,分配給N3 的權(quán)重未得到充分學(xué)習(xí),因此該權(quán)重略高于預(yù)期??傮w來看,自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊學(xué)到的權(quán)重與數(shù)據(jù)集中統(tǒng)計(jì)的不同睡眠時(shí)期發(fā)生呼吸暫停低通氣的頻率基本一致。計(jì)算權(quán)重向量與呼吸暫停低通氣頻率向量之間的相關(guān)系數(shù)為0.908 4,表明它們之間存在較強(qiáng)的正相關(guān)性,也說明自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊可以自動(dòng)建模任務(wù)之間的相互作用關(guān)系,提升分類性能。
在時(shí)間復(fù)雜度方面,計(jì)算并比較了本文所提方法和STL基準(zhǔn)方法的浮點(diǎn)運(yùn)算數(shù)(Floating-point Operations Per second,F(xiàn)LOPs)、參數(shù)量、訓(xùn)練占用的GPU 顯存以及在UCD數(shù)據(jù)集上的訓(xùn)練時(shí)間,各方法的指標(biāo)對(duì)比如表7 所示。
表7 本文MTL方法和STL基準(zhǔn)方法的時(shí)間復(fù)雜度對(duì)比Tab.7 Time complexity comparison between proposed MTL method and baseline STL methods on UCD dataset
根據(jù)表7 所示的結(jié)果,本文的方法能夠同時(shí)完成兩個(gè)任務(wù),與STL 基準(zhǔn)方法中效率較高的兩個(gè)方法體量之和(TinySleepNet+6-layer CNN)相比,本文方法有更少的參數(shù)量,占用GPU 顯存更小,訓(xùn)練時(shí)間相當(dāng)。本文的方法以單導(dǎo)腦電和心電作為輸入,相比更多導(dǎo)的信號(hào),信號(hào)采集成本較低,較為輕量級(jí)的方法也便于部署在家庭醫(yī)療和移動(dòng)醫(yī)療等小型設(shè)備上。同時(shí),多任務(wù)學(xué)習(xí)機(jī)制和自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊學(xué)到了兩個(gè)任務(wù)間的相關(guān)性,利用相關(guān)性提升了方法的分類性能和泛化性,最終實(shí)現(xiàn)便捷高效的睡眠分期與SAHS 檢測(cè),對(duì)受試者的睡眠質(zhì)量進(jìn)行全面評(píng)估,輔助醫(yī)生對(duì)睡眠疾病進(jìn)行診斷和治療。
本文提出了一種新的MTL 框架,基于單導(dǎo)EEG 和單導(dǎo)ECG 進(jìn)行睡眠分期和SAHS 檢測(cè)。由于睡眠階段和睡眠呼吸暫停低通氣是相關(guān)的,構(gòu)建了雙流時(shí)間依賴學(xué)習(xí)模塊,在兩個(gè)任務(wù)的聯(lián)合監(jiān)督下學(xué)習(xí)共享的EEG 和ECG 特征。設(shè)計(jì)了自適應(yīng)任務(wù)間關(guān)聯(lián)性學(xué)習(xí)模塊,將注意力機(jī)制應(yīng)用于多任務(wù)學(xué)習(xí)框架中,捕獲睡眠時(shí)期和呼吸暫停低通氣之間的相互作用關(guān)系,對(duì)不同睡眠時(shí)期發(fā)生呼吸暫停低通氣的概率進(jìn)行建模。在兩個(gè)公開數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),并與STL 基準(zhǔn)方法進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明,本文方法在睡眠分期任務(wù)上達(dá)到了與基準(zhǔn)方法相當(dāng)或更好的分類性能,在SAHS 檢測(cè)任務(wù)上優(yōu)于基準(zhǔn)方法,能檢測(cè)更多的患病片段,對(duì)于SAHS 的初步篩查具有重要意義。此外,本文方法只需要單通道EEG 和單導(dǎo)聯(lián)ECG 作為輸入,單導(dǎo)信號(hào)的采集不會(huì)嚴(yán)重影響患者的正常睡眠,采集成本也低于多通道數(shù)據(jù),因此,本文方法可以應(yīng)用于家庭監(jiān)測(cè)和移動(dòng)醫(yī)療設(shè)備中的睡眠質(zhì)量評(píng)估以及睡眠疾病的初步篩查[32],輔助睡眠醫(yī)師診斷和治療睡眠疾病。
本文方法在一個(gè)框架中訓(xùn)練睡眠分期與SAHS 檢測(cè)兩個(gè)任務(wù)并取得了較好的效果,但是當(dāng)前方法未特別處理呼吸暫停檢測(cè)中的類別不均衡問題。在多任務(wù)學(xué)習(xí)設(shè)置下如何解決其中單個(gè)任務(wù)的類別不均衡問題,進(jìn)而提升總體的分類性能,還需進(jìn)一步地探討與分析。另外,本文的實(shí)驗(yàn)設(shè)置是不跨受試者的,受試者之間的差異會(huì)影響方法的性能,如何解決個(gè)體差異問題,提升方法的魯棒性和泛化性,也是值得深入探究的。