伏臻 吳璽宏 陳婧
感音神經(jīng)性聽力損失(sensorineural hearing loss,SNHL)患者除了聽閾提高外,言語識別也存在一定障礙。根據(jù)患者的純音聽閾驗配助聽設(shè)備,對聲強(qiáng)進(jìn)行補(bǔ)償后,雖然安靜環(huán)境中的言語識別能力大幅度提升,但在噪聲或多人交談的環(huán)境中,言語識別的表現(xiàn)依舊不及正常聽力者。這是因為可聽的聲音在受損的聽覺系統(tǒng)中發(fā)生了畸變,所以聽閾不足以解釋聽力損失患者在言語可懂度上的差異[1],僅將純音聽閾作為聽力評估和補(bǔ)償策略的依據(jù)會限制聽力補(bǔ)償?shù)男Ч?。因此,一些閾上的心理聲學(xué)(psychoacoustic)指標(biāo)也被用來評估聽者的聽覺功能,例如頻率辨別閾限[2],頻率調(diào)制辨別閾限(frequency-modulation discrimination limen,F(xiàn)MDL)[3]和時域精細(xì)結(jié)構(gòu)的辨別[4]等。其中,反應(yīng)聽覺系統(tǒng)對頻率調(diào)制敏感性的指標(biāo)FMDL被認(rèn)為與噪聲環(huán)境下的言語識別能力相關(guān)[5]。頻率調(diào)制(frequency-modulation,F(xiàn)M)是語音信號重要的聲學(xué)屬性之一,其對應(yīng)共振峰過渡、音節(jié)韻律和聲調(diào)語言中的詞匯意義等,如漢語聲調(diào)。有研究表明,基頻包絡(luò)(F0contour),即基頻的調(diào)制方式是漢語識別中最重要的聲學(xué)線索之一[6],而聽者的FMDL與漢語聲調(diào)識別之間的關(guān)系還鮮有討論。
FMDL作為一種主觀測試指標(biāo),依賴于受試者的主觀反饋,具有一定的臨床局限性。頻率追隨反應(yīng)(frequency-following responses,F(xiàn)FRs)是一種持續(xù)周期性刺激聲誘發(fā)產(chǎn)生的聽覺腦干反應(yīng),反映了聽覺腦干神經(jīng)元對刺激聲中周期性成分的鎖相活動[7]。由于SNHL患者的鎖相精度變差,其FFRs幅度低于正常人,對語音信號包絡(luò)和精細(xì)結(jié)構(gòu)的表征強(qiáng)度也均弱于正常人[8]。Marmal等[9]使用穩(wěn)定純音(steady tone)誘發(fā)的FFRs,反映了不同聽力被試的頻率辨別能力與鎖相強(qiáng)度的關(guān)系。但是對SNHL患者,線性掃頻(sweep)信號誘發(fā)的FFRs指標(biāo)與FMDL之間的關(guān)系尚缺乏驗證。本研究針對聽損患者的漢語聲調(diào)識別機(jī)理,研究SNHL患者的FMDL、sweep信號誘發(fā)的FFRs,以及漢語聲調(diào)識別之間的關(guān)系,探討臨床中應(yīng)用FFRs作為聽力損傷評估手段的可能性。
選擇中重度感音神經(jīng)性聽力損失患者6名(男性5名,女性1名),均為雙側(cè)對稱性聽力損失,學(xué)語后聾,年齡25~58歲(平均年齡46歲),每名被試聽力較好耳的聽力曲線見圖1。
圖1 6名被試聽力曲線示意圖
1.2.1 FMDL測試 刺激聲分兩類,頻率為150 Hz、調(diào)制速率為0的穩(wěn)定音(steady tone)和中心頻率為150 Hz、調(diào)制速率大于0的sweep聲,圖2A展示了這兩類刺激聲的基頻包絡(luò)。測試使用3I-2AFC的實驗范式,被試會連續(xù)聽到3段聲音,首段播放穩(wěn)定音,后兩段以隨機(jī)順序播放sweep聲和穩(wěn)定音,被試需要選出sweep聲。sweep聲的初始調(diào)制速率為150 Hz/s,以“2下1上”的方式變化,即被試連續(xù)選對兩次后降低調(diào)制速率,答錯一次后就增加調(diào)制速率。調(diào)制速率的初始調(diào)整因子為1.414,且每兩個拐點后再開方,圖2B展示了測試過程中調(diào)制速率的變化情況。刺激聲的持續(xù)時間為200 ms,刺激聲間隔為500 ms,聲強(qiáng)為75 dB SPL,由頭戴式耳機(jī)呈現(xiàn)給聽閾較好的耳。共進(jìn)行4次測量,每次測量中,取12個拐點的后8個的均值作為閾值,取4次閾值的均值作為被試的FMDL。
圖2 FMDL測試中刺激類型和實驗范式示意圖
1.2.2 FFRs測試 刺激聲分兩類,穩(wěn)定音與FMDL測試中相同,sweep聲的中心頻率為150 Hz、調(diào)制速率分別為50 Hz/s,100 Hz/s和200 Hz/s,圖3A展示了刺激聲的基頻包絡(luò)。刺激聲的持續(xù)時間為200 ms,刺激間隔為100 ms,刺激聲強(qiáng)為75 dB SPL,由入耳式耳機(jī)呈現(xiàn)給聽閾較好的耳。實驗分3個條件進(jìn)行,每個條件中兩類聲刺激交替呈現(xiàn),且起始相位的極性也正負(fù)交替,見圖3B。FFRs的記錄在隔聲屏蔽聲中進(jìn)行,以顱頂中央處為主動電極,同側(cè)耳垂為參考電極,前額為地電極。使用NeuroScan產(chǎn)品對記錄到的信號進(jìn)行放大、帶通濾波(30~3000 Hz)和采樣(20 kHz),使用Matlab對記錄信號進(jìn)行離線分析。
圖3 FFRs測試中刺激類型和刺激呈現(xiàn)順序示意圖
首先根據(jù)同步信號將記錄信號分段為300 ms,并逐段進(jìn)行偽跡去除(±20 μV);將對應(yīng)相同刺激和極性的記錄信號進(jìn)行疊加平均,然后將相位相反的平均信號相減,提取出刺激基頻對應(yīng)的成分;最后對信號進(jìn)行維納濾波和低通濾波(400 Hz),進(jìn)一步降噪,得到FFRs信號。本研究使用FFRs信號與刺激的互相關(guān)系數(shù)評價聽覺系統(tǒng)對刺激信號的鎖相強(qiáng)度。
1.2.3 元音識別測試 選取漢語拼音中的6個單元音/a,o,e,i,u,ü/,并分別搭配漢語的4種聲調(diào),得到24個帶調(diào)單元音作為刺激聲。刺激聲的說話人為女性,時長固定為450 ms,包括前后各15 ms窗長的漸入漸出。由于不同元音間平均基頻的差異較大,為了避免被試在識別元音時使用元音間平均基頻的差異作為線索,使用Praat軟件將所有元音刺激的平均基頻均調(diào)整至210 Hz,而基頻包絡(luò)的形狀保持不變。根據(jù)被試的聽閾調(diào)整刺激聲在各頻帶的增益后[10],刺激聲以20 dB SL的強(qiáng)度由頭戴式耳機(jī)呈現(xiàn)給聽閾較好的耳,被試聽到聲音后,分別選取元音和聲調(diào)類型。本研究統(tǒng)計被試對帶調(diào)元音的聲調(diào)識別正確率,即僅要求聲調(diào)類別選擇正確。
使用SPSS 20軟件進(jìn)行統(tǒng)計分析,使用Pearson相關(guān)性分析計算各指標(biāo)間的相關(guān)性。以P<0.05為相關(guān)性具有統(tǒng)計學(xué)意義。
6名被試的FMDL測試結(jié)果見表1,均值為67 Hz/s,標(biāo)準(zhǔn)差為17 Hz/s。
表1 FMDL測試結(jié)果表(Hz/s)(n=6)
FFRs指標(biāo)與FMDL的關(guān)系。選取與平均FMDL相接近的50 Hz/s的sweep聲誘發(fā)的FFRs的指標(biāo)進(jìn)行分析。圖4展示了每名被試FFRs信號和刺激之間的相關(guān)系數(shù)與FMDL之間的關(guān)系,Pearson相關(guān)性分析表明二者存在顯著負(fù)相關(guān)(r=-0.849,P=0.032),說明被試對頻率調(diào)制信號的鎖相強(qiáng)度越高,行為上對FM的敏感性也越高,F(xiàn)MDL越小。
圖4 FFRs互相關(guān)系數(shù)與FMDL的相關(guān)性分析散點圖
2.3.1 聲調(diào)識別率與FMDL的關(guān)系 圖5展示了每名被試的聲調(diào)識別正確率與FMDL之間的關(guān)系,Pearson相關(guān)性分析表明二者存在顯著負(fù)相關(guān)(r=-0.958,P=0.003),這表明被試對語音的FM線索越敏感,聲調(diào)識別率也越高。
圖5 元音聲調(diào)識別正確率與FMDL的相關(guān)性分析散點圖
2.3.2 聲調(diào)識別率與FFRs指標(biāo)的關(guān)系 考慮到實驗中使用元音刺激的FM速率范圍較廣,將穩(wěn)定音和三種sweep聲誘發(fā)的FFRs的指標(biāo)平均后進(jìn)行分析。圖6展示了每名被試的聲調(diào)識別正確率與FFRs信號和刺激互相關(guān)系數(shù)之間的關(guān)系,Pearson相關(guān)性分析表明二者存在顯著正相關(guān)(r=0.856,P=0.03),這表明被試對頻率調(diào)制信號的鎖相強(qiáng)度越高,聲調(diào)識別率也越高。
圖6 元音聲調(diào)識別正確率與FFRs互相關(guān)系數(shù)的相關(guān)性分析散點圖
2.3.3 可靠性分析 為進(jìn)一步確認(rèn)上述指標(biāo)間關(guān)系的可靠性,排除其它因素的干擾,對這些指標(biāo)與被試的年齡和平均聽閾(0.5、1、2和4 kHz處聽閾的均值)之間的相關(guān)性進(jìn)行分析,分析結(jié)果見表2。被試的年齡和平均聽閾均與其它幾項指標(biāo)之間沒有相關(guān)性,這說明上述結(jié)果和分析可靠。SNHL被試的聲調(diào)識別正確率取決于被試對頻率調(diào)制的敏感性,而聽閾不足以解釋不同被試間的識別結(jié)果差異。
表2 各指標(biāo)相關(guān)性分析結(jié)果表
較多研究[9,11]表明穩(wěn)定音誘發(fā)的FFRs指標(biāo)與頻率辨別閾限(frequency discrimination limen,F(xiàn)DL)之間存在顯著的相關(guān)性;Fu等[12]使用sweep聲誘發(fā)的FFRs客觀地評估了聽力正常被試的FMDL。本研究驗證了該結(jié)論對SNHL患者依然成立。FFRs指標(biāo)和FMDL之間存在顯著的負(fù)相關(guān),即受試者對FM信號的鎖相強(qiáng)度越高,行為上對FM的敏感性也越高,F(xiàn)MDL越小。這些結(jié)果都表明客觀的FFRs測試可以有效地預(yù)測主觀的行為閾值FMDL。
聽覺系統(tǒng)對語音中時變的基頻準(zhǔn)確地進(jìn)行編碼,對理解聲調(diào)語言中的詞匯意義至關(guān)重要,而不準(zhǔn)確的編碼會帶來聲調(diào)的混淆,進(jìn)而導(dǎo)致言語理解產(chǎn)生偏差[13]。漢語聲調(diào)識別的研究,多集中在不同聲學(xué)成分的重要性分析[6,13],或不同助聽策略下的識別表現(xiàn)[14],鮮有根據(jù)受試者的聽覺功能指標(biāo)對其進(jìn)行評估的工作。圖7給出了本研究中聲調(diào)識別的混淆矩陣,可以看到,SNHL患者傾向于將二、三、四聲調(diào)識別為一聲調(diào),而聽力正常者則容易混淆漢語的二、三聲調(diào)[15]。如果將一聲調(diào)對應(yīng)為調(diào)制速率為0的穩(wěn)定音,那么二、三、四聲調(diào)就對應(yīng)調(diào)制速率非0的sweep聲,所以兩類被試聲調(diào)混淆矩陣不同的原因,就是SNHL患者對FM信號的鎖相強(qiáng)度降低,使其對頻率調(diào)制的辨別能力變差,導(dǎo)致FM線索未能得到充分利用。這與SNHL患者的FMDL顯著高于聽力正常被試的結(jié)論相符[16],并且鎖相強(qiáng)度和頻率調(diào)制辨別能力越差,聲調(diào)識別正確率就越低。除此之外,目前漢語聲調(diào)辨別測試的標(biāo)準(zhǔn)語料較少,且這類測試依賴受試者的主觀反饋,受限于受試者的詞匯量和言語表達(dá)能力。本文使用FFRs這一客觀的聽覺誘發(fā)電位,可以有效地評估SNHL患者的FMDL和聲調(diào)識別表現(xiàn),從而避免上述限制。
FFRs潛在的臨床應(yīng)用價值有以下方面:對語后聾患者,F(xiàn)FRs測試可作為聲調(diào)辨別等言語功能的客觀評估手段,用于指導(dǎo)聽力診療方案和助聽方案;對新生兒,F(xiàn)FRs可作為傳統(tǒng)聽力篩查測試的補(bǔ)充,更全面地評估聽覺腦干神經(jīng)元的功能完整性和可塑性;對語言學(xué)習(xí)階段的聽損兒童,以及患有自閉癥譜系障礙疾病的具有語言交流障礙的兒童,F(xiàn)FRs測試可以客觀地評估其言語功能,指導(dǎo)言語康復(fù)訓(xùn)練。另一方面,患者配戴助聽設(shè)備情況下的FFRs測試,可用于評估助聽設(shè)備中語音信號編碼策略對漢語聲調(diào)信息表達(dá)的準(zhǔn)確性,指導(dǎo)針對漢語人群的編碼策略設(shè)計與改進(jìn)。
圖7 元音識別測試中的聲調(diào)混淆矩陣(n=6)
聲調(diào)識別率與FFRs指標(biāo)之間的相關(guān)性弱于與FMDL(0.856<0.958),因為FFRs是一種客觀的聽覺誘發(fā)電位,不需要被試的主動反饋,其反映的是聽覺系統(tǒng)在自底而上加工過程中對信號中FM線索的神經(jīng)表征,不涉及較高層次的加工。而FMDL測試和元音聲調(diào)識別作為主觀測試,均有高層的加工機(jī)制參與其中,所以二者的相關(guān)性更強(qiáng)。
頻率調(diào)制信號誘發(fā)的頻率追隨反應(yīng)可以客觀地評估SNHL患者的頻率調(diào)制辨別能力,其反映的聽覺系統(tǒng)對信號中FM成分鎖相能力的強(qiáng)弱,顯著地影響聽者對漢語聲調(diào)的識別,表明臨床中應(yīng)用頻率追隨反應(yīng)評估聽覺言語功能的可行性。
[1]Smoorenburg GF. Speech reception in quiet and in noisy conditions by individuals with noise induced hearing loss in relation to their tone audiogram[J].J Acoust Soc Am,1992,91(1):421-437.
[2]Tyler RS,Wood EJ,F(xiàn)ernandes M.Frequency resolution and discrimination of constant and dynamic tones in normal and hearing-impaired listeners[J].J Acoust Soc Am,1983,74(4):1190-1199.
[3]Papakonstantinou A, Strelcyk O,Dau T.Relations between perceptual measures of temporal processing, auditory-evoked brainstem responses and speech intelligibility in noise[J].Hear Res,2011,280(1-2):30-37.
[4]Chen J,Baer T,Moore BC.Effect of enhancement of spectral changes on speech intelligibility and clarity preferences for the hearing impaired[J].J Acoust Soc Am, 2012,131(4):2987-2987.
[5]Strelcyk O,Dau T.Relations between frequency selectivity,temporal fine-structure processing, and speech reception in impaired hearing[J].J Acoust Soc Am, 2009,125(5):3328-3345.
[6]陳雪清,劉海紅,劉博,等.時域和頻域信息對漢語普通話聲調(diào)識別的影響[J].中國聽力語言康復(fù)科學(xué)雜志,2008,6(5):18-20.
[7]Skoe E,Kraus N.Auditory Brain Stem Response to Complex Sounds[J].A Tutorial:Ear Hear,2010,31(3):302-324.
[8]Ananthakrishnan S,Krishnan A,Bartlett E. Human Frequency Following Response:Neural Representation of Envelope and Temporal Fine Structure in Listeners with Normal Hearing and Sensorineural Hearing Loss[J].Ear Hear,2015,37(2):e91-103.
[9]Marmel F,Linley D,Carlyon RP,et al.Subcortical Neural Synchrony and Absolute Thresholds Predict Frequency Discrimination Independently[J].J Assoc Res Otolaryngol,2013,14(5):757-766.
[10]Moore BCJ,Glasberg BR.Use of a Loudness Model for Hearing-Aid Fitting I Linear Hearing Aids[J].Br J Audiol,1998,32(5):317-317.
[11]Krishnan A,Bidelman GM,Gandour JT.Neural representation of pitch salience in the human brainstem revealed by psychophysical and electrophysiological indices[J].Hear Res,2010,268(1-2): 60-66.
[12]Fu Z,Wu X,Chen J.Using frequency-following responses(FFRs)to evaluate the auditory function of frequencymodulation(FM)discrimination[J].Appl Inform,2017,4(1):10-10.
[13]Wang S,Li X,Mannell R.Relative Contributions of Temporal Envelope and Fine Structure Cues to Lexical Tone Recognition in Hearing-Impaired Listeners[J].J Assoc Res Otolaryngol Jaro,2011,12(6):783-794.
[14]Chen J,Wu X,Li L,et al.Simulated phase-locking stimulation:an improved speech processing strategy for cochlear implants[J].J Oto-Rhino-Laryngol Relat Spec,2009,71(4):221-227
[15]Mao Y,Xu L.Lexical tone recognition in noise in normalhearing children and prelingually deafened children with cochlear implants[J].Int J Audiol,2016,56(sup2):1-8.
[16]Moore BCJ,Skrodzka E.Detection of frequency modulation by hearing-impaired listeners:Effects of carrier frequency,modulation rate,and added amplitude modulation[J].J Acoust Soc Am,2002,111(1): 327-335.