傅鑫萍 郗昕 張敏
老年性聽力損失已經(jīng)成為社會(huì)老齡化趨勢(shì)下需要密切關(guān)注的問題。胡向陽等[1]對(duì)我國(guó)4省聽力障礙流行現(xiàn)狀調(diào)查發(fā)現(xiàn),我國(guó)聽力障礙標(biāo)準(zhǔn)化現(xiàn)患率為15.84%,其中60歲以上老年人占55.31%。老年人聽力下降主要表現(xiàn)為雙耳對(duì)稱的漸進(jìn)性聽閾提升和言語分辨能力下降。前者需要用標(biāo)準(zhǔn)純音測(cè)聽反映,而后者則需要用言語測(cè)聽結(jié)果體現(xiàn)。特別是噪聲下言語測(cè)試[2],能直觀反映聽覺系統(tǒng)對(duì)日常環(huán)境言語的辨別能力,并預(yù)測(cè)助聽干預(yù)的效果[3,4]。言語測(cè)聽結(jié)果與純音測(cè)聽結(jié)果的關(guān)聯(lián)度并不明確[5],提示這兩種測(cè)試評(píng)估了聽覺功能的不同方面,不能相互取代。
我國(guó)目前已開發(fā)了幾種中文版噪聲下言語測(cè)試材料。黃麗娜等[6]編制的漢語普通話版噪聲下聽力測(cè)試(mandarin hearing in noise test,MHINT)材料,是首個(gè)標(biāo)準(zhǔn)化漢語普通話語句識(shí)別率測(cè)試材料。郗昕等[7,8]編制了嘈雜語噪聲下漢語普通話語句識(shí)別表和嘈雜語噪聲下普通話兒童語句測(cè)聽表。陳艾婷等[9]和任丹丹等[10]仿效英文版Quick SIN(quick speech-in-noise)材料特點(diǎn),各自選取了適合兒童和成人的漢語普通話語句材料,編制了兩套普通話版的噪聲下言語識(shí)別速測(cè)表。胡紅梅等[11]基于國(guó)際康復(fù)聽力學(xué)執(zhí)委會(huì)(international collegium of rehabilitative audiology,ICRA)的規(guī)則,開發(fā)了中文普通話矩陣式語句測(cè)聽材料。此外,還有少數(shù)方言版本的噪聲下言語測(cè)試材料[6],以滿足各地臨床和科研的需要。
然而,我國(guó)幅員遼闊,方言眾多,不同地區(qū)所用言語測(cè)聽材料并無統(tǒng)一規(guī)范。由于受試者的應(yīng)答均為開放式復(fù)述形式,因此對(duì)言語檢查者的專業(yè)性和方言理解能力要求較高。老年人文化程度和認(rèn)知能力會(huì)影響詞/語句類測(cè)試的可靠性,加上受測(cè)試環(huán)境、設(shè)備、材料可及性等限制,噪聲下言語測(cè)試還僅用于臨床科研,尚未普及推廣到基層社區(qū)。我國(guó)公眾對(duì)老年性聽力損失知曉率和干預(yù)率極低,為避免增加醫(yī)療、養(yǎng)老等社會(huì)經(jīng)濟(jì)負(fù)擔(dān),亟需一種高效、簡(jiǎn)易且經(jīng)濟(jì)的噪聲下言語測(cè)聽工具問世。
WHO和ICRA倡議DTT可作為一種國(guó)際性篩查型言語測(cè)聽方法[12]。
上世紀(jì)60年代,Miller[13]就采用數(shù)字和詞語作為測(cè)試材料,探討不同內(nèi)容的語音測(cè)試材料對(duì)噪聲下言語可懂度的影響。在所有語音材料中,數(shù)字內(nèi)容的語音最容易被辨認(rèn),獲得50%識(shí)別率時(shí)所需的信噪比可以低至-14 dB,比其它語音材料的識(shí)別閾約低10 dB。通過座機(jī)電話進(jìn)行數(shù)字三聯(lián)音測(cè)試最早于2004年由荷蘭Smits[14]提出,考慮到電話頻寬的限制,Smits等于2006年正式出版了互聯(lián)網(wǎng)端DTT(使用耳機(jī)進(jìn)行測(cè)試)[15]。基于荷蘭語版本,目前已經(jīng)開發(fā)了十幾種語言版本的DTT。據(jù)報(bào)道,北京同仁醫(yī)院于2012年3月發(fā)布了北京地區(qū)普通話電話測(cè)聽方案,但尚未有相關(guān)實(shí)驗(yàn)數(shù)據(jù)發(fā)表。目前家庭座機(jī)電話的使用率日漸減少,該方法是否適合大規(guī)模篩查有待討論。亓貝爾等[16]初步探討基于互聯(lián)網(wǎng)的噪聲下數(shù)字識(shí)別閾測(cè)試作為成年人聽力篩查工具的敏感度和特異性。該實(shí)驗(yàn)在對(duì)34例聽力正常人和16例感音神經(jīng)性聾患者進(jìn)行測(cè)試后分析發(fā)現(xiàn),以-0.95 dB為最佳診斷截點(diǎn)時(shí)該測(cè)試材料發(fā)現(xiàn)感音神經(jīng)性聾的靈敏度可達(dá)93.8%,特異性達(dá)94.1%。為順應(yīng)這一通訊技術(shù)的變化,WHO也推出了英文版DTT的手機(jī)應(yīng)用“HearWHO”供免費(fèi)下載使用。
DTT采用各國(guó)語言中0~9十個(gè)數(shù)字的標(biāo)準(zhǔn)發(fā)音,以人機(jī)交互自適應(yīng)的方式變換測(cè)試語音的信噪比,達(dá)到快速篩查聆聽者噪聲下言語識(shí)別閾的目的。其優(yōu)點(diǎn)在于:①DTT作為噪聲下言語測(cè)試屬于閾上測(cè)試,對(duì)測(cè)試環(huán)境的要求較低;②言語識(shí)別閾(即言語識(shí)別率為50%時(shí)的信噪比)為相對(duì)值,較少受到測(cè)試刺激聲絕對(duì)強(qiáng)度的影響,對(duì)于設(shè)備校準(zhǔn)的要求相對(duì)低;③DTT的應(yīng)答選項(xiàng)局限于0~9十個(gè)數(shù)字,屬于閉合式測(cè)試,無須測(cè)試者介入,受試者直接輸入應(yīng)答,可實(shí)現(xiàn)自動(dòng)化篩查,解決專業(yè)測(cè)試人員匱乏和應(yīng)答判斷誤差的問題。同時(shí)言語識(shí)別閾值可以在幾分鐘內(nèi)采用自適應(yīng)程序精確計(jì)算,節(jié)省測(cè)試時(shí)間[17];④采用數(shù)字作為測(cè)試材料,可縮小不同方言帶來的言語差異性影響,減少測(cè)試誤差;⑤測(cè)試過程簡(jiǎn)易,無需經(jīng)過特殊的指導(dǎo)和訓(xùn)練;⑥該測(cè)試能夠較敏感地探測(cè)聽力損失[14]。DTT和作為聽力診斷金標(biāo)準(zhǔn)的純音測(cè)聽結(jié)果之間存在較高的相關(guān)性,相關(guān)系數(shù)為0.77~0.80[14,18,19]。
盡管不同語言中10個(gè)數(shù)字的發(fā)音存在差異,但有些參數(shù)可以加以規(guī)范統(tǒng)一,以便盡可能減少語言差異對(duì)測(cè)試造成的影響。如歐洲國(guó)家的DTT均在歐盟委員會(huì)資助的HearCom項(xiàng)目下開展[20],旨在為歐洲語系創(chuàng)建一個(gè)統(tǒng)一的標(biāo)準(zhǔn)。本文總結(jié)了HearCom項(xiàng)目組[21]和ICRA推薦的參數(shù)值[12]。
選用0~9共10個(gè)數(shù)字,保留發(fā)音為單音節(jié)的數(shù)字,剔除多音節(jié)數(shù)字,使測(cè)試更簡(jiǎn)單。雖然數(shù)字10在中文里也是單音節(jié),但考慮到受試者應(yīng)答界面上數(shù)字鍵排列需符合大眾習(xí)慣,因此僅選取個(gè)位數(shù)0~9。單一1個(gè)數(shù)字在10個(gè)數(shù)字選項(xiàng)中被隨機(jī)猜中的機(jī)會(huì)概率較高(1/10),為提高測(cè)試的準(zhǔn)確度和效率,同時(shí)避免數(shù)字串過長(zhǎng)超過了受試者的認(rèn)知(如記憶力)負(fù)荷,研究者決定采用由3個(gè)數(shù)字組成的三聯(lián)音數(shù)字串作為測(cè)試項(xiàng)[22]。三聯(lián)音是將3個(gè)不同的數(shù)字隨機(jī)排列組合,同一測(cè)試列表中保證每個(gè)數(shù)字出現(xiàn)在三聯(lián)音不同位置的比例相同,包括首位、中位和末位,例如三聯(lián)音中的數(shù)字3:213,342,438。
由于DTT最終反映的是個(gè)人日常言語辨別能力,所以對(duì)于測(cè)試材料錄制者的要求可稍降低,不一定要求專業(yè)的播音員,只要發(fā)音自然標(biāo)準(zhǔn)的母語人士即可,一般選用女性朗讀者較多。如果某個(gè)國(guó)家的某種方言可被大多數(shù)人群所接受,也可以錄制方言版本。
語音錄制時(shí)朗讀者采用日常自然語速和中性語調(diào),HearCom項(xiàng)目組建議朗讀語速為120個(gè)音節(jié)/分鐘[21],ICRA推薦約200~350個(gè)音節(jié)/分鐘,具體應(yīng)根據(jù)不同語言進(jìn)行調(diào)整[12](如中文240字/分鐘,俄語200字/分鐘,西班牙語327字/分鐘)。
在進(jìn)行語音錄制時(shí),朗讀者一次讀3個(gè)數(shù)字,由于說話習(xí)慣,通常最后一個(gè)數(shù)字的發(fā)音會(huì)比第一個(gè)數(shù)字弱。荷蘭語DTT為了校正三聯(lián)音發(fā)音強(qiáng)度降低,人為地將每串三聯(lián)音的幅值線性增加(第一個(gè)數(shù)字到第三個(gè)數(shù)字增加3.5 dB)。
對(duì)于任何一種語言,隨機(jī)排列產(chǎn)生的三聯(lián)音組合類型都較多,難以一一錄制,無法保證同一個(gè)數(shù)字在不同三聯(lián)音中發(fā)音一致,導(dǎo)致言語可懂度的變異度增加,降低測(cè)試效率。相反,若錄制小批量的三聯(lián)音,再重新排列生成多組三聯(lián)音則可以避免這些問題。因此,ICRA多語言言語測(cè)試工作組在參考ISO 8253-3:2012“聲學(xué)-測(cè)聽方法-第3部分:言語測(cè)試”(GB/T 16296.3-2017與之對(duì)應(yīng))的基礎(chǔ)上,對(duì)開發(fā)不同語言版本的言語測(cè)試材料做了更詳細(xì)的補(bǔ)充。先將錄制好的小批量三聯(lián)音中的每個(gè)數(shù)字單獨(dú)剪切出來,再重新編輯合成大批量新的三聯(lián)音,同時(shí)不改變?cè)摂?shù)字原來在三聯(lián)音中的位置。這種方法確保了每個(gè)數(shù)字在被單個(gè)剪切后仍能保留原有的韻律,使得最終的測(cè)試材料聽起來自然一致。重新組合后的三聯(lián)音,單個(gè)數(shù)字間隔200 ms,在每串三聯(lián)音前160 ms的位置增加提示語“數(shù)字”兩字,提示語的強(qiáng)度比三聯(lián)音大2 dB,使其容易被聽到。
言語測(cè)試最有效的掩蔽聲是與該言語材料的功率譜完全匹配的言語譜噪聲[23]。在眾多的DTT版本中,掩蔽噪聲通常采用言語譜噪聲。最早的荷蘭版和英文版DTT采用長(zhǎng)時(shí)平均語譜(long-term average speech spectrum,LTASS)作為言語譜噪聲,德文、法文和瑞典語版本也沿用LTASS作為掩蔽噪聲[12,20,24]。數(shù)字三聯(lián)音測(cè)試的LTASS噪聲生成方法通常是對(duì)一個(gè)個(gè)或一串串?dāng)?shù)字經(jīng)30倍隨機(jī)疊加,每個(gè)數(shù)字間的停頓間隔不定(5~2000 ms),最后形成具有與測(cè)試音相同時(shí)長(zhǎng)的平均頻譜噪聲。
對(duì)平均頻譜噪聲進(jìn)行濾波處理可能會(huì)影響數(shù)字三聯(lián)音測(cè)試的敏感性和特異性,但既往研究結(jié)果不一。Charlotte等[25]發(fā)現(xiàn),寬帶掩蔽(DTT broadband,DTT BB)噪聲和低通濾波(DTT low pass,DTT LP)噪聲在篩查40~60歲中年人高頻聽力損失方面具有一致的敏感性和特異性,但前者對(duì)不同年齡段人群測(cè)試結(jié)果的可靠性更強(qiáng)。而Leensen等[26~28]則發(fā)現(xiàn)采用低通濾波噪聲作為數(shù)字三聯(lián)音測(cè)試的掩蔽噪聲對(duì)于高頻聽力損失的篩查有更高的敏感性。更多重復(fù)驗(yàn)證性研究有待開展,為臨床實(shí)踐提供更有力的依據(jù)。
在正式測(cè)試時(shí)噪聲比信號(hào)聲早500 ms出現(xiàn),晚500 ms結(jié)束。測(cè)試時(shí)噪聲強(qiáng)度多采用65 dB SPL,處于55~75 dB SPL范圍內(nèi)都可以。
為了達(dá)到最優(yōu)的測(cè)試效率(即用最少的測(cè)試時(shí)間達(dá)到最高的測(cè)試精度)和等價(jià)性(包括同一語種版本的若干張測(cè)試表之間以及不同語種間的平均測(cè)試結(jié)果之間的可比性),參照Kollmeier等[29,30]的概率模型,采用心理測(cè)量學(xué)方法測(cè)定并調(diào)整單串三聯(lián)音的可懂度函數(shù)。該優(yōu)化過程最終能夠使整張數(shù)字串測(cè)試表的言語可懂度函數(shù)斜率達(dá)到最大[31]。從而實(shí)現(xiàn)言語識(shí)別閾測(cè)試結(jié)果在統(tǒng)計(jì)學(xué)上最高的精度和復(fù)測(cè)信度。
根據(jù)Kollmeier等[29,30]的概率模型(見公式1和圖1),整張測(cè)試列表(一般為23串三聯(lián)音)可懂度函數(shù)曲線斜率Slist由獨(dú)立數(shù)字串的可懂度函數(shù)曲線斜率Sdigit(與每串三聯(lián)音的可懂度函數(shù)曲線的導(dǎo)數(shù)相關(guān))及其識(shí)別閾的SRT標(biāo)準(zhǔn)差決定。即當(dāng)獨(dú)立數(shù)字串的可懂度函數(shù)越趨同(即識(shí)別閾標(biāo)準(zhǔn)差越?。?,整張數(shù)字語音測(cè)聽表的可懂度函數(shù)曲線就越陡峭,其統(tǒng)計(jì)學(xué)精度便越高。
Slist代表整張數(shù)字語音測(cè)試表的可懂度函數(shù)斜率,Sdigit代表單串三聯(lián)音的可懂度函數(shù)斜率,σSRT代表言語識(shí)別閾標(biāo)準(zhǔn)差,σdigit代表單串三聯(lián)音言語識(shí)別閾標(biāo)準(zhǔn)差。
平均的數(shù)字三聯(lián)音的可懂度函數(shù)與其言語識(shí)別閾值分布之間進(jìn)行卷積計(jì)算(圖1中用*表示),可以預(yù)測(cè)整張數(shù)字語音測(cè)聽表的可懂度函數(shù)的斜率。當(dāng)構(gòu)成整張測(cè)聽表的全部三聯(lián)音數(shù)字串的言語識(shí)別閾標(biāo)準(zhǔn)差越窄,則整張數(shù)字語音測(cè)聽表的可懂度函數(shù)越陡,測(cè)試精度越高。
在進(jìn)行同質(zhì)性優(yōu)化測(cè)試時(shí),對(duì)健聽人群進(jìn)行不同信噪比下的DTT測(cè)試,以Logistic型函數(shù)公式2[21]擬合測(cè)得的數(shù)據(jù),即可獲得特定數(shù)字的可懂度函數(shù)曲線。
SI(SNR)代表特定信噪比對(duì)應(yīng)的言語可懂度指數(shù),y是單個(gè)數(shù)字的機(jī)會(huì)概率(例如測(cè)試應(yīng)答界面為0~9十個(gè)數(shù)字,則y=0.1),SRT代表該數(shù)字語音的識(shí)別閾值,SNR代表特定信噪比。
使用此方法進(jìn)行優(yōu)化,可以獲得獨(dú)立數(shù)字串所對(duì)應(yīng)的可懂度曲線的斜率和言語識(shí)別閾值,有效精確地對(duì)數(shù)字串中的單個(gè)數(shù)字進(jìn)行調(diào)整,以此獲得整張測(cè)試表的較大斜率值。
DTT采用噪聲強(qiáng)度固定(多采用65 dB SPL,初始信噪比通常為-10 dB SNR)而改變數(shù)字三聯(lián)音刺激聲的自適應(yīng)方式,根據(jù)受試者每次聽到刺激聲后應(yīng)答的正確與否,以預(yù)設(shè)的步階(2 dB SNR)降低或增加下一刺激聲的信噪比水平。只有當(dāng)三聯(lián)音中的3個(gè)數(shù)字都回答正確時(shí)才被算法判定為答對(duì)。根據(jù)多組三聯(lián)音數(shù)字串測(cè)試強(qiáng)度的起伏軌跡,計(jì)算平均信噪比即為DTT結(jié)果——噪聲下數(shù)字識(shí)別閾,單位為dB SNR。
測(cè)試材料優(yōu)化時(shí),結(jié)果計(jì)算方法并不是以數(shù)字三聯(lián)音的得分為依據(jù),而是每個(gè)數(shù)字的得分,以便獲得關(guān)于每個(gè)數(shù)字對(duì)于測(cè)試結(jié)果影響的詳細(xì)信息。但最終臨床進(jìn)行DTT測(cè)試時(shí),則采用數(shù)字三聯(lián)音得分作為結(jié)果呈現(xiàn)。根據(jù)第5~24串?dāng)?shù)字三聯(lián)音的平均信噪比計(jì)算最終識(shí)別閾值。實(shí)際測(cè)試時(shí)第24組三聯(lián)音雖沒有要求受試者在測(cè)試界面進(jìn)行應(yīng)答,但是第24組三聯(lián)音的刺激聲強(qiáng)度已經(jīng)根據(jù)受試者對(duì)第23組測(cè)試的正確與否將結(jié)果算入最終SRT計(jì)算公式中,這與黃麗娜等[6]的MHINT測(cè)試計(jì)分方法類似,如圖2所示。
WHO和ICRA倡議DTT可作為一種國(guó)際性篩查型言語測(cè)聽方法[12]。目前,臨床上對(duì)多頻率點(diǎn)純音聽閾的測(cè)量及言語測(cè)聽,需使用嚴(yán)格校準(zhǔn)的聽力計(jì)和訓(xùn)練有素的操作人員,雖然已通過人工智能算法找到了簡(jiǎn)化純音測(cè)聽步驟以篩查中度以上聽力損失的方法[38],但其對(duì)硬件的成本要求較高;基于標(biāo)準(zhǔn)言語測(cè)聽的簡(jiǎn)化篩查方法尚未建立,因而均不能推廣至社區(qū)人群的聽力篩查。常規(guī)純音測(cè)聽難以反映聽覺系統(tǒng)更高層次的言語感知以及降噪功能。
表1 不同語言版本的數(shù)字三聯(lián)音測(cè)試結(jié)果的正常參考值
DTT的出現(xiàn)使得高效率、低成本的聽力篩查成為可能,并已在歐洲許多國(guó)家得到驗(yàn)證和推廣應(yīng)用。測(cè)試時(shí)間大幅度縮減,僅需幾分鐘就可完成自動(dòng)篩查。即使是老年受試者,也無需專業(yè)人員指導(dǎo),便可自行在手機(jī)等智能終端根據(jù)操作提示完成測(cè)試,且對(duì)測(cè)試環(huán)境要求不高。學(xué)者為各語言版本制訂了統(tǒng)一的參數(shù)標(biāo)準(zhǔn)(見表1),增強(qiáng)了跨語言聽力研究的可比性。前期的研究結(jié)果為創(chuàng)建中文版DTT提供了寶貴參考。
由于噪聲下聆聽困難是感音神經(jīng)性聽力損失患者最早出現(xiàn)和最典型的臨床表現(xiàn),在老年性聽力損失問題日益嚴(yán)峻的形勢(shì)下,DTT可廣泛用于基層老年人聽力篩查。在進(jìn)行初步聽力篩查建立聽力損失轉(zhuǎn)診指標(biāo)的同時(shí),可以通過大范圍聽力篩查提高老年人聽力健康科普意識(shí),實(shí)現(xiàn)老年性聽力損失早發(fā)現(xiàn)、早診斷、早干預(yù)的目標(biāo)。
研究發(fā)現(xiàn)DTT在用于檢測(cè)和監(jiān)測(cè)早期高頻聽力損失中表現(xiàn)出較高的高靈敏度和特異性。由此可將DTT運(yùn)用于強(qiáng)噪聲工作環(huán)境下工人的聽力監(jiān)測(cè)[15],以及由娛樂風(fēng)險(xiǎn)引起的青少年噪聲性聽力損失中,同樣也非常適用于社區(qū)老年聽力損失的早期發(fā)現(xiàn)。
目前大多數(shù)DTT研究都集中在成人聽力篩查,“HearWHO”APP的推薦年齡也為16周歲以上。該測(cè)試在兒童中使用是否具有同等敏感性和高效性,尚有待研究[39]。
DTT的推出使得大范圍基層聽力篩查成為可能,為聽力健康科普提供新的工具。參照國(guó)際統(tǒng)一的DTT創(chuàng)建流程和標(biāo)準(zhǔn)參數(shù),開發(fā)中文版DTT測(cè)試工具應(yīng)成為中國(guó)聽力學(xué)發(fā)展的下一步目標(biāo)。