中圖分類號(hào):R563.8 文獻(xiàn)標(biāo)志碼:A DOI:10.11958/20250966
Newadvances on detecting obstructive sleep apnea based on acoustic information
YUHui1,LIU Hao12,CAIFengli3,ZHAO Jing1,BAI Xiangsen1,TIAN Guoliang1, ZHANG Hanyuel, ZHANG Liyuan4 1 Departmentof Biomedical Enginering,Tianjin UniversityTianjin3Oo2,China; 2 DepartmentofNetwork Iforation Tianjin 4th Center Hospital; 3 Department ofObstetrics and Gynecology, Juye County Hospitalof Traditional Chinese Medicine,4DepartmentofEquipmentandMaterial,Tianjin4th CentreHospital (2 Δ Corresponding Author E -mail: 13752631906@163.com
Abstract:Obstructive sleep apnea (OSA) is a common sleep disorder characterized byrepeated episodes of upper airwaycolapseandobstructionduring slep.PolysomnographyisthegoldstandardfordiagnosingOSA,butitisexpensive, time-consuming,and cancause discomfort forpatients.Inrecent years,acoustic-based approaches fordetecting OSA have emerged as aresearch focus.This review summarizes recent advances in OSA automatic detection techniques based on snoringandspeechsignals,andsystematicallyexaminestheirappicationsindagnosis,severityassessment,andlocaliation of obstructionsites.Findings indicate that theacousticfeatures ofsnoringand speechsignals hold significantvalueforOSA screning,and whencombined with machine learning anddeep learning models,itcanachieve high diagnosticacuracy. Futureresearchshould focuson elucidating therelationship betweenacousticfeaturesand thepathophysiological mechanismsofOSA,integratingmultimodal information,andadvancingtheclinicalapplicationofwearabledevices,withthe aim of promoting intelligent, non-invasive,and cost-effective screening technologies for OSA.
Key Words: sleep apnea,obstructive; snoring; speech; detection; obstruction location; severity
阻塞性睡眠呼吸暫停(OSA)是一種常見的睡眠障礙疾病,主要特征是睡眠期間上氣道的反復(fù)塌陷和阻塞,導(dǎo)致呼吸暫停或低通氣事件。OSA在成人的發(fā)病率為 2%~4% ,且隨著年齡的增長(zhǎng)患病率顯著增加,40歲以上的群體中,男性和女性的患病率約為 34% 和 17%[1-2] 。OSA不僅會(huì)影響睡眠質(zhì)量,還會(huì)引發(fā)多種嚴(yán)重的健康問題。長(zhǎng)期缺氧和二氧化碳積聚增加了心血管疾病、糖尿病、高血壓和腦卒中的風(fēng)險(xiǎn)。OSA還可能加重已有的心臟病,并導(dǎo)致代謝紊亂。由于夜間反復(fù)的呼吸暫停,OSA患者還面臨更高的死亡風(fēng)險(xiǎn),尤其是當(dāng)癥狀未經(jīng)治療時(shí),長(zhǎng)期的健康負(fù)擔(dān)可顯著降低生活質(zhì)量和預(yù)期壽命。目前公認(rèn)的診斷OSA的金標(biāo)準(zhǔn)是多導(dǎo)睡眠監(jiān)測(cè)(PSG),該方法通過多個(gè)導(dǎo)聯(lián)同步監(jiān)測(cè)患者睡眠期間的腦電、血氧、心電等生理參數(shù),成本較高,且要求監(jiān)測(cè)7h以上。由于醫(yī)院的環(huán)境和監(jiān)測(cè)設(shè)備的穿戴極易給患者造成不適,PSG的應(yīng)用受到很大限制,大量OSA病例仍未得到診斷,因此亟需探索成本更低、使用更加便捷的檢測(cè)方法識(shí)別和診斷OSA。
打鼾是在睡眠時(shí)上呼吸道軟組織振動(dòng)引起的,是OSA最常見、最直接的特征[3]。根據(jù)美國(guó)睡眠醫(yī)學(xué)會(huì)的標(biāo)準(zhǔn),以呼吸暫停低通氣指數(shù)(AHI) L?5 次/h、530 次/h將打鼾者依次評(píng)定為正常,輕度、中度、重度OSA患者[4]。已有研究表明,鼾聲的聲學(xué)特征可以分辨正常人群和OSA患者,且可以反映OSA的病情嚴(yán)重程度及上呼吸道阻塞部位[5-6]。此外,上呼吸道結(jié)構(gòu)的改變和長(zhǎng)期打鼾的影響使得OSA患者的發(fā)音方式與正常人群存在明顯差異,因此OSA患者語音信號(hào)的異常變化可作為評(píng)估疾病嚴(yán)重程度的特征信息。隨著人工智能技術(shù)在音頻信號(hào)處理領(lǐng)域的廣泛應(yīng)用,加之語音/鼾聲可以在各種類型的設(shè)備中,以及在清醒或不干擾睡眠的情況下也可方便記錄,故基于聲學(xué)信息的OSA自動(dòng)檢測(cè)技術(shù)有望成為新的診斷方式。本文全面總結(jié)了近5年基于聲或語音檢測(cè)OSA的研究進(jìn)展,包含OSA的診斷、嚴(yán)重程度判斷和阻塞位置的確定,并對(duì)該領(lǐng)域的未來研究方向提出了展望。
1基于聲學(xué)信息的OSA檢測(cè)流程
基于聲學(xué)信息的OSA自動(dòng)檢測(cè)技術(shù)流程包括原始信號(hào)采集、數(shù)據(jù)預(yù)處理、特征提取、特征篩選和模型訓(xùn)練(圖1)。常用的機(jī)器學(xué)習(xí)模型有支持向量機(jī)(SVM))、K近鄰(KNN)、樸素貝葉斯(NB)等,用于OSA的分類或回歸;一些深度學(xué)習(xí)模型,如卷積神經(jīng)網(wǎng)絡(luò)(CNN)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)、長(zhǎng)短期記憶(LSTM)可以直接依據(jù)預(yù)處理后的聲學(xué)信號(hào)進(jìn)行預(yù)測(cè),并取得了和PSG相近或更為優(yōu)異的診斷效果。
2鼾聲
2.1基于鼾聲診斷OSA近5年基于鼾聲診斷OSA的研究見表1。隨著數(shù)字信號(hào)處理技術(shù)的發(fā)展,研究者開始關(guān)注基于鼾聲診斷OSA。OSA患者鼾聲的聲學(xué)特征分布與正常人群存在明顯差異,Perez-Padilla等發(fā)現(xiàn) 800Hz 功率比(PR800)是診斷OSA的有效指標(biāo);Fiz等[8]對(duì)鼾聲進(jìn)行頻譜分析顯示,OSA患者的鼾聲具有一個(gè)低頻峰且沒有明顯的諧波,而正常受試者的鼾聲具有一個(gè)基頻和多個(gè)諧波; Ng 等[9研究表明OSA患者鼾聲的共振峰頻率較正常受試者更高,尤其是第一共振峰頻率。Herzog等]的研究進(jìn)一步發(fā)現(xiàn)單純性打鼾患者的鼾聲音調(diào)強(qiáng)度在100~300Hz ,而OSA患者的音調(diào)強(qiáng)度高于 1000Hz 0上述研究均證明鼾聲可以作為診斷OSA的有效指標(biāo)。
頻譜圖中有共振峰頻率、SE、F等大量有價(jià)值的聲學(xué)特征,在音頻識(shí)別領(lǐng)域的應(yīng)用十分廣泛。Castillo-Escario等[17]使用CNN從鼾聲的頻譜圖中識(shí)別OSA,同時(shí)系統(tǒng)地比較了不同時(shí)間窗對(duì)模型性能的影響,結(jié)果顯示使用60s時(shí)間窗可獲得最佳的預(yù)測(cè)效能,預(yù)測(cè)準(zhǔn)確度、敏感度和特異度分別為 88.5%.71.8% 和 89.1% 。Jiang等20]評(píng)估了鼻聲的時(shí)域波形、頻譜圖、聲譜圖、梅爾頻譜圖和CQT聲譜圖在正常受試者和OSA患者分類任務(wù)中的表現(xiàn),結(jié)果顯示梅爾頻譜圖取得最好效果,準(zhǔn)確度、敏感度、特異度分別為 95.07%.95.42% 和95.82% 。梅爾頻譜將音頻信號(hào)的頻譜轉(zhuǎn)換為梅爾尺度,從而模擬人耳對(duì)頻率的感知特性。Ding等[12]提出了一種預(yù)訓(xùn)練的VGG19和LSTM融合模型,將鼾聲的梅爾頻譜圖輸入該模型中對(duì)正常受試者和OSA患者分類,最高準(zhǔn)確度達(dá) 99.31% 。Luo等[14]基于夜間音頻的MFCC訓(xùn)練了一個(gè)多分類TCN,將音頻分類為非打鼾、打鼾或OSA相關(guān)打鼾,其中OSA相關(guān)打鼾的檢測(cè)準(zhǔn)確度高達(dá)96.7% 。Shen等[19]通過MFCC、線性預(yù)測(cè)倒譜系數(shù)(LPCC)線性預(yù)測(cè)梅爾倒譜系數(shù)(LPMFCC)3種方式提取鼾聲的數(shù)據(jù)特征,并采用CNN和LSTM識(shí)別OSA患者,發(fā)現(xiàn)MFCC和LSTM相結(jié)合準(zhǔn)確度最高,為 87% 。
此外,許多研究將梅爾頻譜圖/MFCC與其他聲學(xué)特征相融合,共同用于OSA的診斷。Ding等[1]基于預(yù)訓(xùn)練的VGG16、預(yù)訓(xùn)練的PANN和MFCC建立了三種基本模型,使用XGBoost選擇特征,并應(yīng)用多數(shù)投票策略構(gòu)建融合模型,獲得了 100% 的準(zhǔn)確度。Sun 等[15]基于Fisher比率選擇了一系列鼾聲的聲學(xué)特征,包含MFCC、PLP、BSF、SE、PR800、 F0 、共振峰和GTCC,通過GMM完成了OSA患者的識(shí)別,準(zhǔn)確度達(dá)到 90.0% 。Song等[13]將聲學(xué)特征與XGBoost結(jié)合、梅爾頻譜圖與CNN結(jié)合、梅爾頻譜圖與殘差神經(jīng)網(wǎng)絡(luò)(ResNet)結(jié)合構(gòu)建了3種模型,并通過軟投票將其融合,完成對(duì)簡(jiǎn)單打鼾/OSA相關(guān)打鼾的分類,準(zhǔn)確度和召回率分別為 83.44% 和 85.27% 。Cheng等16將鼾聲的MFCC、梅爾濾波器組(Fbanks)、短時(shí)能量和線性預(yù)測(cè)系數(shù)(LPC)相結(jié)合,利用LSTM完成OSA患者的識(shí)別,分類準(zhǔn)確度達(dá)到95.3% 。Jiang等[18]從鼾聲中提取MFCC、PR800、SE等10個(gè)聲學(xué)特征,基于隨機(jī)森林完成特征篩選,采用LR、SVM、高斯貝葉斯、KNN和ANN等模型識(shí)別OSA患者,結(jié)果表明LR效果最好,準(zhǔn)確度、敏感度和特異度均達(dá)到 100% 。通過上述研究可以看出,鼾聲在OSA檢測(cè)方面具有巨大潛力,在多項(xiàng)研究中識(shí)別準(zhǔn)確度接近 100% ,值得在未來進(jìn)行更深入的探索。2.2基于鼾聲判斷OSA嚴(yán)重程度鼾聲不僅可用于診斷OSA,其聲學(xué)特征還可反映OSA患者的嚴(yán)重程度[20]。Chiang等[5]通過薈萃分析發(fā)現(xiàn),鼾聲的強(qiáng)度、頻率和時(shí)間與AHI之間存在高度相關(guān)性,這表明轟聲的聲學(xué)特征可以提供判斷OSA嚴(yán)重程度的重要信息。表2概述了利用鼾聲與機(jī)器學(xué)習(xí)技術(shù)相結(jié)合判斷OSA嚴(yán)重程度的研究。
Bahr-Hamm等[21]計(jì)算了鼾聲、心電圖和胸腹部偏移信號(hào)的采樣熵作為SVM的輸人,對(duì)OSA嚴(yán)重程度進(jìn)行判斷,結(jié)果顯示鼾聲的信號(hào)熵效果最好,判斷非OSA(R)與輕度OSA(L)的曲線下面積(AUC)為0.61,R與中度OSA(M)為0.68,R與重度OSA(H)為0.84,L與M為0.63,L與 H 為0.82,M與H為 0.65 。Ye等[22]從鼻聲中提取聲學(xué)特征,使用ReliefF和最大相關(guān)性與最小冗余(mRMR)相結(jié)合進(jìn)行特征篩選,然后應(yīng)用SVM、LR、KNN和NB模型驗(yàn)證不同嚴(yán)重程度的OSA患者識(shí)別的有效性,結(jié)果顯示基于選取的top-20 特征,利用SVM,在AHI分列為5、15、30的閥值下,識(shí)別OSA患者的準(zhǔn)確度分別為 100%.100% 、98.94% 。Luo等[23]提出了一種基于深度特征遷移的OSA檢測(cè)方法,利用CNN提取的呼吸音的深度特征訓(xùn)練LR分類器,在 AHI=15,30 的閥值下,分類準(zhǔn)確度分別為 80.17% 和 80.21% 。Cho等24]提取了睡眠呼吸音的MFCC、LPC、SE等508個(gè)特征,使用隨機(jī)森林算法,基于AHI分別為5、15、30的閾值標(biāo)準(zhǔn)進(jìn)行二元分類,準(zhǔn)確度分別為 88.2% 、 82.3% 和 81.7% 。Hou等[25]提出了一種通過使用鼾聲的等效矩形帶寬相關(guān)維度(ECD)結(jié)合GMM來估計(jì)AHI的方法,展示了一種評(píng)估睡眠呼吸暫停風(fēng)險(xiǎn)的潛在無創(chuàng)性方法,在AHI分別為15、30的閾值下分類準(zhǔn)確度達(dá)到了80.17% 和 80.21% 。Qiu等[2通過PubMedBERT增強(qiáng)鼾聲的音頻特征以豐富其多樣性和細(xì)節(jié),隨后使用XGBoost根據(jù)睡眠呼吸暫停事件的數(shù)量對(duì)OSA嚴(yán)重程度進(jìn)行分類,正常、輕度、中度和重度的準(zhǔn)確度分別為 50%.50%.66.7% 和 75% ,達(dá)到診斷水平。
隨著人工智能技術(shù)的發(fā)展,為了提升自動(dòng)判斷OSA嚴(yán)重程度模型的性能,越來越多的研究者將深度學(xué)習(xí)技術(shù)應(yīng)用其中。Fang等27]使用3種機(jī)器學(xué)習(xí)算法(SVM、KNN、RF)和一種深度學(xué)習(xí)算法[音頻頻譜圖轉(zhuǎn)換器(AST)開發(fā)了基于模擬轟聲的OSA診斷模型,結(jié)果表明深度學(xué)習(xí)算法的識(shí)別能力優(yōu)于機(jī)器學(xué)習(xí)算法,在AHI分別為5、15和30的水平下,AST的識(shí)別準(zhǔn)確度分別為0.926,0.887和0.830。Le等[28]提出了一種實(shí)時(shí)逐個(gè)檢測(cè)OSA的方法,基于鼾聲的梅爾頻譜圖結(jié)合DNN和線性回歸模型,可以完成對(duì)無事件、呼吸不足、呼吸暫停3類OSA事件的檢測(cè)以及OSA嚴(yán)重程度的判斷,AUC分別達(dá)到0.93、0.85和0.94。Romero等[29]通過DNN確定睡眠呼吸音片段是否存在OSA,然后計(jì)算AHI,從而評(píng)估OSA嚴(yán)重程度,中度和重度OSA敏感度分別達(dá)到了0.79和0.78,特異度分別為0.80和0.93。Wang等[30]提出了一種名為OSAnet的深度卷積神經(jīng)網(wǎng)絡(luò),用于識(shí)別鼾聲中的OSA事件,并據(jù)此估計(jì)AHI,在AHI分別為5、10,15、30的閾值下,敏感度分別為 93.6% 82.5% 、88.5% 和 95.6% 。目前基于鼾聲對(duì)OSA嚴(yán)重程度的判斷集中在不同AHI閾值下的二分類,三分類、四分類,但其效果普遍不佳。此外,因?yàn)樗脭?shù)據(jù)集的數(shù)據(jù)量、采集方式等均不統(tǒng)一,因此不同研究的分類效果差異很大,難以進(jìn)行對(duì)比。未來亟待建立數(shù)據(jù)量龐大的公開數(shù)據(jù)集,以利于對(duì)該領(lǐng)域的進(jìn)一步探索。2.3基于鼾聲確定阻塞部位不同阻塞部位有不同的手術(shù)治療方案,因此明確OSA患者上呼吸道阻塞部位一直是臨床上的關(guān)鍵問題。目前確定阻塞部位的金標(biāo)準(zhǔn)是藥物誘導(dǎo)睡眠內(nèi)鏡檢查(DISE),但尚存在一些局限性,如藥物選擇的影響以及自然睡眠和藥物誘導(dǎo)睡眠之間的差異等。臨床上迫切需要一種低成本、方便且無創(chuàng)的確定阻塞部位的新方式。Gurpinar等將55例OSA患者的DISE的檢查結(jié)果與鼾聲的聲學(xué)分析相結(jié)合,發(fā)現(xiàn)腭后(RP)和舌后(RL)阻塞( scriptstyleP=0.001 ),多級(jí)(ML)和RL阻塞( P=0.025)的平均音調(diào)頻率、基頻和峰值聲音頻率的差異均有顯著性,分析圖顯示RP阻塞患者具有尖銳的峰值和較低的頻率,而RL曲線平滑且頻率較高。該結(jié)果表明通過鼾聲來確定OSA患者的阻塞部位是可行的。目前已有一些研究者關(guān)注了基于鼾聲對(duì)OSA患者阻塞部位的自動(dòng)分類,見表3。
Liu等[31]提取鼾聲的MFCC,使用KNN進(jìn)行RP、RL和ML的三分類,模型準(zhǔn)確度為 85.55% ,結(jié)合年齡、性別和體質(zhì)量指數(shù),準(zhǔn)確度提升至 87.98% 。Ding等[32]基于對(duì)鼾聲數(shù)據(jù)集慕尼黑-帕紹鼾聲語料庫(MPSSC)的原始劃分,采用在原型網(wǎng)絡(luò)中嵌入CNN的元學(xué)習(xí)算法將鼾聲分為軟腭、口咽、舌根、會(huì)厭阻塞,模型的非加權(quán)平均召回率為 77.13% ,其中軟腭、口咽、舌、會(huì)厭分別為 75.5%.80.0%.75.0% 和78.0% 。Sebastian等[33]提取鼾聲的MFCC、共振峰頻率、能量等時(shí)頻特征,通過特征選擇和多類LDA進(jìn)行四分類(側(cè)壁、上腭、舌根、多級(jí)),總體準(zhǔn)確度為62% ,舌/非舌阻塞準(zhǔn)確度為 77% 。Sun等[34]設(shè)計(jì)了一個(gè)新特征-基于趨勢(shì)的MFCC(TCC),并利用主成分分析進(jìn)行降維,最后使用SVM完成軟腭、口咽、舌根和會(huì)厭的四分類,非加權(quán)平均召回率為 87.5% 。之后使用包含多尺度熵(MSE)和MFCC的59維融合特征,采用相同的辦法進(jìn)行分類,非加權(quán)平均值為87.63% ,軟腭、口咽、舌、會(huì)厭的敏感度分別為98.04%.80.56%.72.73% 和 94.12%[35] 。通過上述研究可以看出,通過鼾聲確定阻塞位置具有極大的研究潛力,但目前該領(lǐng)域研究較少,模型分類性能有待提升,且各研究的分類類別也不相同,未來應(yīng)在統(tǒng)一標(biāo)準(zhǔn)下進(jìn)行深人研究。
3語音
3.1OSA患者語音信號(hào)異常特征語音信號(hào)是由人類聲帶振動(dòng)產(chǎn)生的復(fù)雜音頻信號(hào),它包含大量的人體特征信息,且可以通過無創(chuàng)性手段獲取。相對(duì)于正常人群,OSA患者語音信號(hào)存在明顯異常,表現(xiàn)在:(1)在OSA人群中可以發(fā)現(xiàn)神經(jīng)運(yùn)動(dòng)功能障礙,由于呼吸肌群或上氣道肌群缺乏可調(diào)節(jié)的神經(jīng)支配,這會(huì)影響發(fā)音并導(dǎo)致語音模糊。(2)0SA患者因睡眠打鼾的長(zhǎng)期影響,其上呼吸道黏膜和聲帶會(huì)發(fā)生炎性變化。(3)OSA患者上呼吸道結(jié)構(gòu)的改變(包括舌骨位置降低、腭咽帆增厚、后帆空間縮小、咽后壁增厚以及腭咽腔狹窄)導(dǎo)致腭咽閉合功能障礙和語音異常。Fox等[36]發(fā)現(xiàn)約有 74% 的OSA患者出現(xiàn)不同程度的共鳴和發(fā)聲異常,因而引起了許多研究人員的興趣。
目前,語音信號(hào)的采集方式主要是讓受試者(包括OSA患者和正常群體)在同一特定時(shí)段(比如清醒時(shí)或睡前1h)朗誦研究人員提前準(zhǔn)備的語料,錄制音頻以比較其在時(shí)頻特征上的差異,或作為后續(xù)模型輸入的原始數(shù)據(jù)。語料一般為持續(xù)元音居多的句段或單詞,即希伯來語中的 ,或后鼻音
持續(xù)元音的優(yōu)點(diǎn)在于,與連續(xù)語音信號(hào)相比,持續(xù)元音的發(fā)音更省力,而且不受語速、發(fā)聲停頓或壓力的影響。目前對(duì)于中文語料尚無統(tǒng)一要求。
另一種研究方式是探究語音信號(hào)中的時(shí)頻特征與AHI之間相關(guān)性。該種方法通過建立回歸模型找尋語音信號(hào)中一個(gè)或多個(gè)音頻特征與AHI之間的數(shù)學(xué)關(guān)系,或是訓(xùn)練深度學(xué)習(xí)模型,將受試者的語音信號(hào)預(yù)處理后作為輸入直接預(yù)測(cè)AHI值并作為診斷OSA的依據(jù)。常用特征如時(shí)域和頻域特征、LPC、LPCC、MFCC等。
3.2通過語音診斷OSA 十九世紀(jì)九十年代已有學(xué)者注意到OSA患者的語音信號(hào)異常,如Monoson等[38]通過聆聽的方式對(duì)患者發(fā)聲狀況進(jìn)行分類,聽力結(jié)果顯示OSA患者組中約有 62% 被判定為異常,而這一數(shù)據(jù)在慢性阻塞性肺病患者和正常組中分別為 23% 和 8% ;Fiz等[39]分析了18例男性O(shè)SA患者和10例正常男性的發(fā)聲情況,發(fā)現(xiàn)2組受試者所發(fā)出的/i/ Ie/e/Λ 元音的最大諧波頻率存在差異。
基于上述發(fā)現(xiàn),研究人員開始將音頻信號(hào)處理技術(shù)和機(jī)器學(xué)習(xí)算法應(yīng)用于OSA自動(dòng)檢測(cè),取得了許多新的成果。Pozo等[40]建立了一個(gè)包含OSA患者和健康對(duì)照組的西班牙語語音數(shù)據(jù)庫,比較兩者的聲學(xué)特征,并建立高斯混合模型進(jìn)行分類,最終達(dá)到了 81% 的分類準(zhǔn)確度。Goldshtein等[37在希伯來語群體中進(jìn)行了類似的研究,他們比較了OSA患者和健康人語音信號(hào)的梅爾倒譜系數(shù),并基于隱馬爾可夫(hiddenmarkov model,HMM)分類器進(jìn)行分類,最終在男性和女性患者中分別得到 83% 和 86% 的準(zhǔn)確度。Ding等[41]采集了151例疑似OSA的成年男性患者的語音信號(hào),基于LPCC等一系列聲學(xué)特征建立了SVM模型預(yù)測(cè)AHI指數(shù),并以 AHI=30 次/h和AHI=10 次h為閾值進(jìn)行分類,準(zhǔn)確度均達(dá)到了78.8% 。上述研究證明了基于語音信號(hào)的OSA自動(dòng)檢測(cè)技術(shù)在各種語言背景下的可行性。
近年來,隨著深度學(xué)習(xí)語音處理技術(shù)的突破,為基于語音的OSA自動(dòng)檢測(cè)技術(shù)提供了無限可能。一些在音頻處理領(lǐng)域已然成熟的模型被投入應(yīng)用,例如CNN、RNN、LSTM等,在診斷準(zhǔn)確度和效率上都取得了不錯(cuò)的效果。見表4。
4總結(jié)與展望
基于聲學(xué)信息檢測(cè)OSA是一種新興的OSA的診療技術(shù),為其早期診斷、嚴(yán)重程度判斷以及阻塞位置確定提供了新的技術(shù)解決方案,但仍存在一定的局限性,亟待重點(diǎn)攻關(guān)和突破。
4.1OSA聲學(xué)診斷的機(jī)制研究OSA患者和正常受試者的鼾聲聲學(xué)特征(如頻譜、音調(diào)強(qiáng)度、共振峰等)存在明顯差異。這些差異可能反映了上呼吸道氣流受阻、振動(dòng)模式以及氣道的生理變化。但是,聲學(xué)特征與OSA發(fā)病機(jī)制之間的具體關(guān)系仍不明確。例如,鼾聲的產(chǎn)生與上呼吸道氣流的變化和軟組織的振動(dòng)密切相關(guān),但這些生理過程如何在聲學(xué)信號(hào)中體現(xiàn),以及如何準(zhǔn)確反映OSA的不同嚴(yán)重程度仍是尚待深人研究的問題。鼾聲的聲學(xué)特征與上呼吸道阻塞位置的關(guān)系也尚無可靠的結(jié)論。此外,目前OSA的判斷主要依據(jù)AHI,但研究表明AHI可能無法完全反映OSA的嚴(yán)重程度,有些患者AHI較低,但卻具有重度OSA的癥狀[52]。因此,未來的研究中應(yīng)考慮到OSA的不同表型,減少對(duì)AHI的依賴度,同時(shí)結(jié)合生理學(xué)、聲學(xué)及信號(hào)處理技術(shù),進(jìn)一步探索聲學(xué)信號(hào)與OSA病理生理之間的關(guān)系。通過先進(jìn)的傳感技術(shù)和機(jī)器學(xué)習(xí)/深度學(xué)習(xí)方法的一體化融合,研究人員可以更精細(xì)地分析信號(hào),智能提取OSA聲學(xué)特征,揭示鼾聲與OSA嚴(yán)重程度和阻塞位置之間的關(guān)聯(lián)。
4.2多模態(tài)信息融合用于OSA的精準(zhǔn)篩查隨著技術(shù)的進(jìn)步,單一的聲學(xué)信息已經(jīng)不能完全滿足OSA篩查的需求。未來,通過融合聲學(xué)、生理和影像等多模態(tài)信息,可以為OSA提供更為全面的診斷支持。生理信號(hào)(如氣流、呼吸暫停、血氧飽和度等)與聲學(xué)信號(hào)(如鼾聲的頻譜分析)相結(jié)合,能夠彌補(bǔ)單一信號(hào)在篩查中的不足。影像學(xué)技術(shù),如睡眠監(jiān)測(cè)過程中結(jié)合上呼吸道影像,能夠?yàn)闅獾雷枞牟课缓统潭忍峁└庇^的信息。多模態(tài)信息融合技術(shù)有望顯著提高OSA的診斷準(zhǔn)確性,特別是在輕度患者的早期篩查中。未來,人工智能和大數(shù)據(jù)模型將被廣泛應(yīng)用于多模態(tài)數(shù)據(jù)的融合分析,從而實(shí)現(xiàn)更加精準(zhǔn)的診斷。
4.3基于OSA可穿戴設(shè)備的社區(qū)篩查隨著物聯(lián)網(wǎng)技術(shù)和可穿戴設(shè)備的發(fā)展和普及,未來嘗試將聲學(xué)、血氧、氣流等多種生理信號(hào)傳感器集成在可穿戴設(shè)備中,并通過物聯(lián)網(wǎng)技術(shù)構(gòu)建云平臺(tái),以實(shí)現(xiàn)實(shí)時(shí)的健康監(jiān)測(cè)和數(shù)據(jù)分析。這種智能化設(shè)備不僅能夠進(jìn)行高效的早期篩查,還能為用戶提供個(gè)性化的健康建議和預(yù)警,及時(shí)發(fā)現(xiàn)潛在的OSA風(fēng)險(xiǎn)。通過這種智能化、便攜的設(shè)備,OSA的篩查將能夠覆蓋到社區(qū)甚至家庭,大大提升了疾病早期發(fā)現(xiàn)的可能性。
參考文獻(xiàn)
[1]FRANKLIN K A,LINDBERG E. Obstructive sleep apnea isa common disorder in the population-a review on the epidemiology of sleepapnea[J].J Thorac Dis,2015,7(8):1311-1322.doi: 10.3978/j.issn.2072-1439.2015.06.11.
[2] YEGHIAZARIANS Y,JNEID H,TIETJENS JR,et al. Obstructive sleep apnea and cardiovascular disease:a scientific statement from the American Heart Association[J]. Circulation,2O21,144(3): e56-e67. doi:10.1161/CIR.0000000000000988.
[3]PEVERNAGIE D,AARTS R M,DE MEYER M. The acoustics of snoring[J]. Sleep Med Rev,2010,14(2):131-144.doi:10.1016/j. smrv.2009.06.002.
[4]KAPUR V K,AUCKLEY D H, CHOWDHURI S,et al. Clinical practice guideline for diagnostic testing for adult obstructive sleep apnea:an american academy of sleep medicine clinical practice guideline[J].JClin Sleep Med,2017,13(3): 479-504. doi: 10.5664/jcsm.6506.
[5]CHIANG J K,LIN Y C,LU C M,et al. Corlation between snoring sounds and obstructive sleep apnea in adults: a meta-regression analysis[J]. Sleep Sci,2022,15(4) :463-470.doi:10.5935/1984- 0063.20220068.
[6]GURPiNAR B,SALTURK Z,KUMRAL T L,et al. Analysis of snoring to determine the site of obstruction in obstructive sleep apnea syndrome[J]. Sleep Breath,2021,25(3):1427-1432. doi: 10.1007/s11325-020-02252-5.
[7]PEREZ-PADILLA J R,SLAWINSKI E,DIFRANCESCO L M, et al. Characteristics of the snoring noise in patients with and without occlusive sleep apnea[J].Am Rev Respir Dis,1993,147(3) :635- 644. doi: 10.1164/ajrccm/147.3.635.
[8]FIZ JA,ABAD J, JANE R, et al. Acoustic analysis of snoring sound in patients with simple snoring and obstructive sleep apnoea [J].Eur Respir J,1996,9(11):2365-2370.doi:10.1183/ 09031936.96.09112365.
[9]NG A K,KOH TS,BAEY E,et al. Could formant frequencies of snoresignals be an alternative means for the diagnosis of obstructive sleep apnea?[J]. Sleep Med,2008,9(8):894-898. doi: 10.1016/j.sleep.2007.07.010.
[10]HERZOG M,SCHMIDT A, BREMERT T,et al. Analysed snoring soundscorrelate to obstructive sleep disordered breathing[J].Eur Arch Otorhinolaryngol,2008,265(1):105-113.doi:10.1007/ s00405-007-0408-8.
[11]DING L,PENG J,SONG L,et al. Automatically detecting OSAHS patientsbased on transferlearningand model fusion[J].Physiol Meas,2024,45(5) :055013.doi: 10.1088/1361-6579/ad4953.
[12]DING L,PENG J,SONG L,et al. Automatically detecting apneahypopnea snoring signal based on VGG19 + LSTM[J]. Biomed Signal Process Control,2023,80:104351. doi: 10.1016/j.bspc.2022.104351.
[13]SONG Y,SUN X,DING L,et al. AHI estimation of OSAHS patients based on snoring classification and fusion model[J].Am JOtolaryngol, 2023,44(5):103964.doi: 10.1016/j.amjoto.2023.103964.
[14]LUO H W,LIH,LU Y,et al. Design of embedded real-time system forsnoring and OSA detection based on machine learning[J]. Measurement,2023,214:112802.doi:10.1016/j.measurement.2023.112802.
[15]SUN X,DING L, SONG Y,et al. Automatic identifying OSAHS patients and simple snorers based on Gaussian mixture models [J]. Physiol Meas,2023,44(4) :045003.doi:10.1088/1361-6579/ accd43.
[16]CHENG S, WANG C, YUE K,et al. Automated sleep apnea detection in snoring signal using long short-term memory neural networks[J]. Biomedical Signal Processing and Control,2022,71 (Jan.Pt.B): 103238.1-103238.9.doi:10.1016/j.bspc.2021.103238.
[17] CASTILLO-ESCARIO Y,WERTHEN-BRABANTS L, GROENENDAAL W,et al. Convolutional neural networks for apnea detection from smartphone audio signals : effect of window size [C/ OL]//2O22 44th Annual International Conference of the IEEE Engineering in Medicine amp; Biology Society (EMBC).2022: 666- 669[2024-11-28J. htps://ieeexplore.iee.org/document/9871396.
[18]JIANG Y,PENG J,SONG L.An OSAHS evaluation method based onmulti-features acoustic analysis of snoring sounds [J]. Sleep Med,2021,84:317-323.doi:10.1016/j.sleep.2021.06.012.
[19]SHEN F,CHENG S,LI Z,et al.Detection of snore from OSAHS patients based on deep learning[J].J Healthc Eng,2O20,2020: 8864863. doi: 10.1155/2020/8864863.
[20]JIANG Y,PENG J,ZHANG X.Automatic snoring sounds detection from sleep sounds based on deep learning[J].Phys Eng Sci Med, 2020,43(2):679-689.doi:10.1007/s13246-020-00876-1.
[21] BAHR-HAMM K,ABRIANI A,ANWAR A R,et al. Using entropy of snoring,respiratory effort and electrocardiography signals during sleep for OSA detection and severity classification[J]. Sleep Med, 2023,111:21-27. doi:10.1016/j.sleep.2023.09.005.
[22]YE Z,PENG J,ZHANG X,et al. Identification of OSAHS patients based on ReliefF-mRMR feature selection[J].Phys Eng Sci Med, 2024,47(1):99-108.doi:10.1007/s13246-023-01345-1.
[23]LUO J,LIU H,GAO X,et al. A novel deep feature transfer-based OSA detection method using sleep sound signals[J].Physiol Meas, 2020,41(7):075009.doi: 10.1088/1361-6579/ab9e7b.
[24]CHO S W,JUNG S J,SHIN JH,et al. Evaluating prediction models of sleep apnea from smartphone-recorded sleep breathing sounds[J]. JAMA Otolaryngol Head Neck Surg,2022,148(6): 515-521.doi: 10.1001/jamaoto.2022.0244.
[25]HOUL,PAN Q,YIH,et al. Estimating a sleep apnea hypopnea index based on the erb correlation dimension of snore sounds[J].Front Digit Health,2020,2:613725. doi:10.3389/fdgth.2020.613725.
[26]QIU X,WANG C,LI B,et al. An audio-semantic multimodal model for automatic obstructive sleep Apnea-Hypopnea Syndrome classification via multi-feature analysis of snoring sounds[J]. Front Neurosci,2024,18:1336307.doi:10.3389/fnins.2024.1336307.
[27]FANG L,CAIJ,HUANG Z,et al. Assessment of simulated snoring sounds with artificial intelligence for the diagnosis of obstructive sleep apnea[J]. Sleep Med,2025,125:100-107.doi:10.1016/j. sleep.2024.11.018.
[28]LE VL,KIM D,CHO E,et al. Real-time detection of sleep apnea based on breathing sounds and prediction reinforcement using home noises:algorithm development and validation[J].JMed Internet Res,2023,25:e44818. doi: 10.2196/44818.
[29]ROMERO H E,MA N,BROWN G J,et al. Acoustic screening for obstructive sleep apnea in home environments based on deep neural networks[J]. IEEEJBiomed Health Inform,2022,26(7) : 2941- 2950. doi:10.1109/JBHI.2022.3154719.
[30] WANG B,TANG X,AI H,et al. Obstructive sleep apnea detection based on sleep sounds via deep learning[J]. Nat Sci Sleep,2022, 14:2033-2045. doi:10.2147/NSS.S373367.
[31]LIU Y,F(xiàn)ENG Y,LI Y,et al.Automatic classification of the obstruction site in obstructive sleep apnea based on snoring sounds [J].AmJOtolaryngol,2022,43(6):103584. doi:10.1016/j. amjoto.2022.103584.
[32]DING L,PENG JX. Automatic clasification of snoring sounds from excitation locations based on prototypical network [J].Applied Acoustics,02,958799.doi:1016/jaacoust202799.
[33]SEBASTIAN A,CISTULLI PA,COHEN G,et al. Automated identification of the predominant siteof upper airwaycollapse in obstructive sleep apnoea patients using snore signal[J]. Physiol Meas,2020,41(9):095005.doi:10.1088/1361-6579/abaa33.
[34]SUN J,HU X,CHEN C,et al. Amplitude spectrum trend-based feature for excitation location classification from snore sounds [J]. Physiol Meas,2020,41(8) : 085006.doi:10.1088/1361-6579/ abaa34.
[3D」SUNJ,HUX,PENGS,et al.Automatic classitication of excitation location of snoring sounds[J].JClin Sleep Med,2021,17(5): 1031-1038. doi: 10.5664/jcsm.9094.
[36]FOX AW,MONOSON PK,MORGAN CD.Speech dysfunction of obstructive sleep apnea.A discriminant analysis of its descriptors [J]. Chest,1989,96(3):589-595.doi:10.1378/chest.96.3.589.
[37]GOLDSHTEIN E,TARASIUK A,ZIGEL Y. Automatic detection of obstructive sleep apnea using speech signals[J]. IEEE Trans Biomed Eng,2011,58(5):1373-1382.doi:10.1109/TBME.2010.2100096.
[38]MONOSON P K,F(xiàn)OX A W. Preliminary observation of speech disorder in obstructive and mixed sleep apnea[J]. Chest,1987,92 (4) :670-675.doi:10.1378/chest.92.4.670.
[39]FIZ JA,MORERA J,ABADJ,et al. Acoustic analysis of vowel emission in obstructive sleep apnea[J]. Chest,1993,104(4): 1093-1096. doi: 10.1378/chest.104.4.1093.
[40]POZO RF,MURILLO JLB,GOMEZ LH,et al. Assessment of severe apnoea through voice analysis,automatic speech,and speaker recognition techniques[J]. EURASIP Journal on Advances in Signal Processing,2009,2009(10):982531:1-982531:11.
[41]DING Y,WANG J,GAO J,et al. Severity evaluation of obstructive sleep apnea based on speech features[J]. Sleep Breath,2021,25 (2):787-795.doi:10.1007/s11325-020-02168-0.
[42] UGUR T K, YILMAZ D, YILDIZ M,et al. A preliminary study on OSA severity levels detection by evaluating speech signals nonlinearities with multi-class classification[J]. IEEE Access, 2023,11:120997-121012. doi:10.1109/ACCESS.2023.3327902.
[43]YILMAZ D, YILDIZ M, UYAR TOPRAK Y, et al. Obstructive sleepapnea detection with nonlinear analysis of speech [J]. Biomedical Signal Processing and Control,2023,84:104956. doi: 10.1016/j.bspc.2023.104956.
[44]ZHANG K,CAO L,DING Y,et al. Obstructive sleep apnea detection using pre-trained speech representations[J]. 2023,2023 (8):1139-1143.doi:10.21437/Interspeech.2023-278.
[45]BOTELHO C,ABAD A,SCHULTZ T,et al. Visual speech for obstructive sleep apnea detection [J]. Interspeech,2021,2021: 2516-2520.doi:10.21437/Interspeech.2021-1717.
[46]PANGKG,HSUNG TC,LAWAKW,etal.Optimal vowels measurements for obstructive sleep apnea detection using speech signals[J].2O20 IEEE 3rd International Conference on Information Communication and Signal Processing (ICICSP),2020,2020:143- 147. doi : 10.1109/1CICSP50920.2020.9231972.
[47]SIMPLY R M,DAFNA E,ZIGEL Y. Diagnosis of obstructive sleep apnea using speech signals from awake subjects[J]. IEEE Journal of Selected Topics in Signal Processing,2020,14(2) : 251-260. doi : 10.1109/JSTSP2019.2955019.
[48]PERERO-CODOSERO JM,ESPINOZA-CUADROSF,ANTONMARTIN J,et al. Modeling obstructive sleep apnea voices using deep neural network embeddings and domain-adversarial training [J].IEEE Journal of Selected Topics in Signal Processing,2020,14 (2):240-250.doi:10.1109/JSTSP.2019.2957977.
[49]ESPINOZA-CUADROS F, FERNANDEZ-POZO R, TOLEDANO D T,et al. Reviewing the connection between speech and obstructive sleep apnea[J]. Biomed Eng Online,2016,15:20.doi: 10.1186/s12938-016-0138-5.
[50]BEN OR D, DAFNA E,TARASIUK A,et al. Obstructive sleep apnea severity estimation:Fusion of speech-based systems [J]. Annu Int Conf IEEE Eng Med Biol Soc,2016,2016:3207-3210. doi: 10.1109/EMBC.2016.7591411.
[51]SOLE-CASALS J,MUNTEANU C,MARTIN O C,et al. Detection ofsevere obstructive sleep apnea through voice analysis [J]. Applied Soft Computing.2014.23:346-354.doi:10.1016/i.