田甜 張飛 李銘麟 張璇 王佳賀
隨著全球人口老齡化的加劇,老年聽力障礙逐漸成為公共衛(wèi)生的重大挑戰(zhàn)。聽力障礙不僅影響老年人的交際和日常生活,還影響其精神健康和生活質(zhì)量。由于老年聽力障礙的復(fù)雜病因(包括遺傳因素、環(huán)境影響、職業(yè)噪聲暴露等多種因素[1])和老年群體的特殊性,對其有效的診治和管理仍然面臨著一系列挑戰(zhàn)。
最近幾年,人工智能(artificial intelligence,AI)技術(shù)的突破性進(jìn)展為處理這些問題提供了新的前景。AI通過大數(shù)據(jù)分析、精確建模和預(yù)測以及高效的自動化決策,為改善老年聽力障礙提供了強(qiáng)大的工具。研討如何利用AI技術(shù)改善老年聽力障礙,為醫(yī)療衛(wèi)生領(lǐng)域的研究者提供了新的方向。本文旨在回顧和討論AI改善老年聽力障礙的最新進(jìn)展,為未來相關(guān)領(lǐng)域的研究提供參考。
老年聽力障礙,狹義上特指年齡相關(guān)的聽力損失(age-related hearing loss,ARHL),這是一種與年齡增長有關(guān)的聽覺系統(tǒng)退化性疾病。在廣義上,其是指發(fā)生在老年人群中的所有聽力障礙,包括但不限于ARHL。本文的研究范圍為廣義老年聽力障礙,包括由自然衰老、噪聲暴露、耳部感染或疾病、藥物毒性、基因因素、系統(tǒng)性疾病、耳蠟阻塞、耳部腫瘤等各種因素引起的老年聽力障礙。
在全球范圍內(nèi),聽力障礙是非常普遍的問題,特別是老年人群。根據(jù)世界衛(wèi)生組織的最新數(shù)據(jù),超過5%的人口(其中成年人4.32億,兒童3400萬)患有聽力障礙。由于人口老齡化,到2050年,估計(jì)將有超過7億人患有聽力障礙,即每10人中就有1人患聽力障礙[2]。在老年人中,聽力障礙的患病率更高,65歲以上老年人的聽力障礙患病率可達(dá)1/3以上[3],聽力損失成為老年人第三大常見慢性疾病。
老年聽力障礙有以下特點(diǎn):(1)聽力損失程度更嚴(yán)重。在聽力障礙病人的流行病學(xué)調(diào)查中,最大年齡段分組(>80歲)的中度聽力損失(>40~60 dB)患病率超過輕度聽力損失(>25~40 dB)患病率[4]。(2)輔助治療設(shè)備使用困難。相對于更容易適應(yīng)技術(shù)改變的中青年人,老年人往往需要更多的時(shí)間和支持來適應(yīng)電子類的聽力輔助設(shè)備。(3)易伴隨其他健康問題。老年人的工作、社交活動并不活躍,患有聽力障礙相關(guān)疾病后更加重其溝通困難和社交隔離,引起焦慮、抑郁等心理疾病以及認(rèn)知障礙[3]等其他健康問題。因此,老年聽力障礙者更需要綜合醫(yī)學(xué)干預(yù)。
全球每年在耳科和聽力保健服務(wù)上的總支出,平均下來,相當(dāng)于每個(gè)人要分擔(dān)近10元的費(fèi)用[2]。從宏觀的社會和國家視角審視,老年聽力障礙無疑會引起累積的經(jīng)濟(jì)負(fù)擔(dān)和支出。因此,老年聽力障礙帶來的眾多問題和挑戰(zhàn)是我們亟需解決的課題。
AI是指由人造系統(tǒng)所表現(xiàn)出來的智能,分為弱人工智能和強(qiáng)人工智能兩類。弱人工智能系統(tǒng)專注于某一具體任務(wù),如語音識別、圖像識別等,它們的應(yīng)用已經(jīng)非常廣泛。而強(qiáng)人工智能則能夠理解或體驗(yàn)周圍環(huán)境,就像人類一樣具有全面的思考能力。但是,由于當(dāng)前技術(shù)以及倫理限制,現(xiàn)階段AI在醫(yī)學(xué)中的應(yīng)用集中在弱人工智能方面[5]。
AI包括很多子領(lǐng)域,如機(jī)器學(xué)習(xí)(ML):機(jī)器可以通過提供的數(shù)據(jù)集的經(jīng)驗(yàn)進(jìn)行改進(jìn);深度學(xué)習(xí)(DL): 由多層神經(jīng)網(wǎng)絡(luò)組成,使機(jī)器能夠自行學(xué)習(xí)和做出決策;自然語言處理(NLP): 使計(jì)算機(jī)能夠從人類語言中提取數(shù)據(jù)并根據(jù)該信息做出決策;計(jì)算機(jī)視覺(CV): 計(jì)算機(jī)從一系列圖像或視頻中獲得信息并理解等。目前,AI在醫(yī)療健康領(lǐng)域的應(yīng)用已經(jīng)越來越普遍,比如ML用于預(yù)測疾病、DL應(yīng)用于醫(yī)療影像的診斷[6]、NLP用于醫(yī)療信息的獲取和處理等[7]。這些技術(shù)為改進(jìn)和優(yōu)化醫(yī)療服務(wù)提供了巨大的空間。Topol[8]預(yù)測,AI與醫(yī)學(xué)的結(jié)合將迎來一個(gè)“醫(yī)生輔助”時(shí)代。
3.1 早期預(yù)警 老年聽力障礙的預(yù)測大多依賴于對象的自我報(bào)告,如詢問老年人是否有聽力問題、是否有噪聲的暴露史等。這種方法的局限性在于很多老年人可能不會察覺自我聽力下降,增大了漏診率。我國學(xué)者黃治物及其團(tuán)隊(duì)開展的“基于遺傳與環(huán)境因素作用輔助AI決策的耳聾防控研究”醫(yī)工交叉項(xiàng)目,計(jì)劃收集大樣本人群數(shù)據(jù),包括生物特征、聽力水平、遺傳信息、環(huán)境暴露、生活方式、共病等,然后利用AI技術(shù)對這些數(shù)據(jù)進(jìn)行綜合分析,實(shí)現(xiàn)對老年聽力障礙的早期預(yù)警[9]。
3.2 高效精確的診斷 老年聽力障礙的診斷包括詳實(shí)的病史、仔細(xì)的耳鏡檢查、實(shí)驗(yàn)室聽力測試、專業(yè)的鼓室壓力測量以及聲學(xué)反射等步驟。這些步驟需要大量時(shí)間完成,特別是對于那些認(rèn)知障礙、難以配合的老年人群,可能會增加病人的焦慮和心理壓力[10],也增加了醫(yī)療系統(tǒng)的負(fù)擔(dān)。另一方面,傳統(tǒng)聽力檢測通常需有專業(yè)人員手動控制語音信號刺激的強(qiáng)度和頻率,以確定受試者的聽力損失和言語感知水平,因此,檢測主觀性大,易產(chǎn)生人為誤差。AI在老年聽力障礙的診斷方面顯示出巨大潛力,提高了診斷效率與精確度。
ML可用于純音聽力測試中的掩蔽管理。用探測音測試病人聽力較差的一側(cè)耳朵時(shí),需要對聽力較好的一側(cè)耳朵播放窄帶噪音以避免交叉聽力的影響,傳統(tǒng)掩蔽的管理需要多次迭代,在測試耳中不斷重新建立閾值來調(diào)整非測試耳中的掩蔽量,非常耗時(shí)且困難。Heisey等[11]在ML聽力圖程序中添加標(biāo)準(zhǔn)化掩蔽協(xié)議形成了動態(tài)掩蔽,與傳統(tǒng)手動掩蔽在準(zhǔn)確性上相當(dāng),但效率大大提高。
相比于局限性大的純音測試,ML也可進(jìn)一步運(yùn)用于腦干反應(yīng)(ABR)的測試中。純音聽力測試依賴于對病人進(jìn)行感知評估,但對于認(rèn)知障礙、語言障礙、嚴(yán)重聽力損傷的老年人來說,他們無法表達(dá)聆聽體驗(yàn)。ABR的檢測可以避免這些局限性,但難度大,往往需要經(jīng)驗(yàn)豐富的耳科醫(yī)生。Al Osman等[12]使用ML進(jìn)行自動化語音誘發(fā)ABR分析,通過區(qū)分健康聽力障礙和病理性聽力障礙,幫助臨床醫(yī)生更好地診斷聽力障礙。
除了在專業(yè)醫(yī)院檢測外,對于行動不便的老年人,也可以佩戴以ML為基礎(chǔ)的自動聽力計(jì),自行測試并及時(shí)向?qū)I(yè)醫(yī)療人員反饋。Raja Sankari等[13]開發(fā)的自動聽力計(jì)能夠利用多種ML模型(如支持向量機(jī)、隨機(jī)森林和AdaBoost模型)分析語音信號,并準(zhǔn)確評估在250~8000 Hz范圍內(nèi)的聽力情況,3種模型的準(zhǔn)確率分別高達(dá)98%、96%和96%。除了準(zhǔn)確性高,這類自動聽力計(jì)還具備攜帶便捷、可個(gè)性化定制等優(yōu)勢。
AI還可以通過聽力閾值對聽力障礙進(jìn)行分類診斷。Abd Ghani等[14]研發(fā)的混合ML模型,利用頻繁模式增長(FP-Growth)算法和樸素貝葉斯(NB)算法,能根據(jù)空氣和骨傳導(dǎo)的聽力閾值準(zhǔn)確地進(jìn)行癥狀分類。這種AI驅(qū)動的模型還可以根據(jù)需要設(shè)置評估的精度和置信水平,避免過度治療或低估病情。
耳部影像診斷技術(shù)上也有AI的應(yīng)用。Cha等[15]提出了利用DL和大型耳內(nèi)鏡圖像數(shù)據(jù)庫來自動診斷耳部疾病的ML模型,其識別出6種不同中耳疾病的準(zhǔn)確率高達(dá)90%。目前,基于此種技術(shù)的商業(yè)產(chǎn)品如“hearScope”[16]等已上市。此外,Li[17]也成功運(yùn)用了AlexNet網(wǎng)絡(luò)模型和極限學(xué)習(xí)來識別耳部核磁共振圖像中的組織特征,對聽力損失進(jìn)行分類。
3.3 智能化助聽設(shè)備
3.3.1 助聽器:從全球范圍來看,助聽器的使用率很低,4.014億中重度聽力損失人群中僅有17%的病人使用助聽器[18]。一部分是因?yàn)槔夏耆苏J(rèn)為助聽器是衰老和功能喪失的標(biāo)志而拒絕使用,但最主要還是因?yàn)橹犉鞅旧淼男阅懿患裑19]。一般來說,助聽器的首選音量增益和響度水平是為“標(biāo)準(zhǔn)用戶”“標(biāo)準(zhǔn)聽力環(huán)境”設(shè)定的,然而每個(gè)用戶的具體需求和環(huán)境差異大,一次性定制無法兼顧各種用戶的不同需求。由于老年人的聽力感知理解逐漸退化,其對聲音的偏好更具有特殊性。
在用戶個(gè)性化方面,Balling等[20]結(jié)合了高斯過程的數(shù)學(xué)模型和信息論,通過ML將用戶偏好程度轉(zhuǎn)化為助聽器增益參數(shù),從而優(yōu)化特定用戶的聲音體驗(yàn)。同樣,有學(xué)者利用卷積神經(jīng)網(wǎng)絡(luò)和雙向長短期記憶網(wǎng)絡(luò)等DL模型對用戶在音頻環(huán)境中的偏好進(jìn)行學(xué)習(xí)和建模,進(jìn)一步確定個(gè)性化助聽器的音頻壓縮參數(shù),從而提高用戶聽力感知[21]。
在聲場識別和噪聲處理方面,Bhat等[22]使用DL技術(shù)處理音頻信號,針對不同的環(huán)境噪聲來進(jìn)行語音增強(qiáng),以提高聽者的語音質(zhì)量和可理解性。Fan等[23]進(jìn)一步開發(fā)了助聽器應(yīng)用程序(APP),自動識別5種不同的聲場,包括公共汽車、地鐵、街道、室內(nèi)、汽車,通過多音頻幀和塊的疊加,優(yōu)化助聽器的聲音清晰度。
利用AI,一些助聽器還可以多角度保障老年人安全。Starkey Livio AI助聽器能通過步數(shù)跟蹤檢測用戶的行動狀態(tài),一旦發(fā)生墜落動作,及時(shí)發(fā)出警報(bào),從而防止老年聽力障礙者獨(dú)自活動時(shí)出現(xiàn)意外[24]。
3.3.2 人工耳蝸(CI): CI的植入沒有年齡限制,如今已經(jīng)幫助超過200萬名聽力受損的兒童和成人恢復(fù)聽力,其中包括150 000名老年人[25],是70歲以上甚至80歲以上病人聽力康復(fù)的治療選擇[26]。然而CI植入也存在一些缺點(diǎn):(1)候選時(shí)間長且復(fù)雜。醫(yī)生需對多個(gè)術(shù)前變量的相互作用進(jìn)行主觀判斷。然而,合并AD等認(rèn)知障礙的老年病人通常難以描述自我主觀感受,并且老年人群常伴有多病共存現(xiàn)象,即變量多,這些都會使醫(yī)生的準(zhǔn)確判斷更為困難。(2)植入效果差、并發(fā)癥多。CI植入術(shù)后病人言語聽覺改善的結(jié)果不盡相同,部分病人會發(fā)生不適、噪音反饋、復(fù)發(fā)性炎癥和耳道感染惡化等[27]。AI技術(shù)的應(yīng)用為CI植入提供了新的可能性和研究方向。
AI的引入可以提高候選過程的效率和準(zhǔn)確度,從而保證植入效果。Abousetta等[28]利用ML的模型預(yù)測了CI植入術(shù)后病人的病情恢復(fù)情況,結(jié)果顯示AI分類模型對語言年齡缺陷、語音缺陷和社會缺陷的預(yù)測準(zhǔn)確率分別為56.66%、88.11%和40.46%,均超越了傳統(tǒng)的統(tǒng)計(jì)方法。這有助于醫(yī)生更準(zhǔn)確地判斷哪些病人能從CI手術(shù)中受益。
DL技術(shù)改進(jìn)了CI術(shù)前的醫(yī)學(xué)圖像處理。與傳統(tǒng)的醫(yī)學(xué)圖像分割技術(shù)相比,DL可以實(shí)現(xiàn)自動特征提取,減少人為干預(yù),從而獲得更好的分割結(jié)果[29]。Li等[30]采用了一種基于U-Net的改進(jìn)網(wǎng)絡(luò)模型,以實(shí)現(xiàn)對人體耳蝸解剖結(jié)構(gòu)在CT圖像中的自動分割,這類術(shù)前準(zhǔn)備工作有助于提高老年人群CI手術(shù)的成功率,減少術(shù)后并發(fā)癥。
此外,AI也有助于解決配置聽覺處理器的問題。記錄電觸發(fā)的鐙骨反射是最常見的傳統(tǒng)配置方法,但是在耳蝸或聽神經(jīng)病變的情況下,記錄并不準(zhǔn)確。Levin等[31]利用神經(jīng)網(wǎng)絡(luò)處理神經(jīng)反應(yīng)的遙測數(shù)據(jù),以更高的精度合成CI聽覺處理器的調(diào)諧卡,最終預(yù)測準(zhǔn)確率高達(dá)99.2%。
AI不僅改善了CI的配置過程,也參與調(diào)節(jié)過程。Waltzman等[32]在FOX(Fitting to Outcome Expert)APP中使用了基于AI的編程算法來調(diào)節(jié)CI,其效果與傳統(tǒng)醫(yī)生標(biāo)準(zhǔn)編程技術(shù)(EC)的效果相當(dāng)。
3.4 長期康復(fù)護(hù)理的遠(yuǎn)程醫(yī)療助力 遠(yuǎn)程醫(yī)療的興起實(shí)現(xiàn)了輔助聽力設(shè)備佩戴者的本地自我管理[28],解決了病人居住地偏遠(yuǎn)以及老年人行動不便帶來的問題,為老年聽力障礙病人的長期居家康復(fù)護(hù)理提供了有力的技術(shù)支持。
遠(yuǎn)程醫(yī)療可以幫助病人進(jìn)行助聽器的微調(diào)。如智能手機(jī)里的APP——ReSound Assist, 可以收集病人的遠(yuǎn)程要求并接收新的助聽器設(shè)置。Convery等[33]評估了這個(gè)APP的遠(yuǎn)程通信功能,結(jié)果顯示其具有高度的可行性。
在CI方面,Meeuws等[34]綜合利用了FOX程序和遠(yuǎn)程醫(yī)療技術(shù),使CI佩戴者能在聽力學(xué)家的遠(yuǎn)程指導(dǎo)下進(jìn)行自我測試和自動裝配。此外,FOX編程方法還可以實(shí)現(xiàn)跨中心的標(biāo)準(zhǔn)化,并增加許多可能受益的個(gè)人訪問。
AI在老年聽力障礙的早期預(yù)警、高效精確診斷、智能化輔助設(shè)備、遠(yuǎn)程醫(yī)療等方面已經(jīng)取得了實(shí)質(zhì)進(jìn)展。目前一些應(yīng)用可能不及傳統(tǒng)方法或與其相當(dāng),但ML等是一個(gè)不斷學(xué)習(xí)、自我優(yōu)化的過程,只要數(shù)據(jù)樣本不斷擴(kuò)大,更加豐富多樣,通過增加訓(xùn)練集和驗(yàn)證數(shù)據(jù)樣本等方式[35],模型的準(zhǔn)確性可以不斷提高,其最終性能預(yù)期將超越純?nèi)斯し椒?。?dāng)然這并不意味著AI將替代人類的臨床決策能力,正如應(yīng)用X線、CT等影像技術(shù)一樣,對于臨床醫(yī)生來說,將AI視為一種臨床決策輔助工具來幫助判斷和減少認(rèn)知偏差[36],將是未來聽力障礙診治的新方向。
最后,AI在改善聽力障礙中的應(yīng)用目前仍面臨倫理和數(shù)據(jù)安全問題[37],因此,相關(guān)倫理規(guī)范隱私保護(hù)機(jī)制必須建立,以提高病人對AI的信任度。