冀飛
聽力學(xué)測試是測量人的聽覺系統(tǒng)對于聲音刺激的主觀或客觀反應(yīng)。針對不同的測試,需要使用不同時域和頻域特性的聲信號,并使用適當(dāng)?shù)臏y試方式量化地呈現(xiàn)給受試者。本文對常用聲信號的特性進(jìn)行介紹。
純音是最常用的聽力學(xué)測試信號。純音測聽得到的聽閾是聽力測試的金標(biāo)準(zhǔn)。純音是時域波形為一簡單正弦時間函數(shù)的聲波,從主觀感覺是單一音調(diào)。從頻域上看,理想的純音具有單一的譜線(見圖1)。任何復(fù)雜的周期性信號都可在頻域上分解為不同頻率的純音。臨床用作氣導(dǎo)和骨導(dǎo)聽閾測試的聲信號是各種頻率的純音[1]。
圖1 純音的時域和頻域波形[2]
然而,臨床實際測試應(yīng)用給出的聲信號,不可能是理想化的時程無限長。其從無聲到某一預(yù)定聲壓級需經(jīng)過一定時長,這一過程即上升時間(rise time)。同樣,聲信號達(dá)到某一程度后持續(xù)的時間可長或短,這一持續(xù)時間(即時程)內(nèi)聲壓級穩(wěn)定不變,然后經(jīng)過下降時間(fall time)降到無聲。
聲信號的時程和響度和頻率特性都有關(guān)。例如,對1000 Hz純音來說,其時程(duration)需在200 ms左右才能充分累積達(dá)到最高限度的響度。這時即便再延長時程,響度也不會增加,但是縮短時程就會使響度降低。另一方面,信號時程還會影響信號的頻率特性。時程越短聲刺激的頻譜主瓣越寬、頻率特性越差,特別是低頻純音更易失去其頻率特征。這也是臨床上純音測聽要求每次給患者呈現(xiàn)信號至少1~2秒的原因。
短時程信號是指持續(xù)時間短于200 ms的信號[3]。使用這些信號的常用測試包括記錄聽覺誘發(fā)電位、誘發(fā)性耳聲發(fā)射和神經(jīng)耳科檢查等。
短聲是加載一個方波脈沖信號到換能器終端所產(chǎn)生的寬頻譜的瞬態(tài)聲學(xué)或振動信號。短聲是一種寬頻帶信號,頻率特異性較差,能量主要集中在3~4 kHz。其能量分布主要取決于耳機(jī)或揚聲器的頻響特性[1],圖2顯示了經(jīng)插入式耳機(jī)播放的典型的短聲頻譜。
圖2 短聲頻譜特性
短音和短純音是時程短于200 ms的正弦信號。二者均由純音信號施加一個時窗(包絡(luò))截取而成,包含數(shù)個正弦波。短音和短純音的區(qū)別僅在使用線性時窗截取時在時域上是否具有平臺期。短音不具有平臺期。使用非線性時窗截取信號時,短音和短純音并無顯著區(qū)別,可統(tǒng)一稱為短純音。由于時程較短,所以與純音相比,短音和短純音的頻譜并非單一譜線,而是形成一個窄帶,其頻率特異性與時程、上升/下降時間有關(guān)。為去除測試中的刺激偽跡,通常采用由疏波信號和密波信號交替組成的交變極性短時程信號。
短純音的時程是指短純音包絡(luò)的上升沿和下降沿上50%最大幅度點之間的時間間隔(圖3,圖注①)。短純音包絡(luò)的上升沿上10%最大幅度點與90%最大幅度點之間的時間間隔稱為短純音的上升時間(rise time)(圖3,圖注②);下降沿上90%最大幅度點與10%最大幅度點之間的時間間隔稱為短純音的上升時間和下降時間(fall time)(圖3,圖注③)。
圖3 線性時窗交變極性短音/短純音時域波形示意圖[3] ①時程②上升時間③下降時間
圖3給出的是線性時窗截取的短純音信號。在評估聽閾時,使用非線性時窗如Blackman等產(chǎn)生的短音比起一般的線性時窗短純音引發(fā)的刺激同步性更好,同時還能保證頻率特異性。目前多用Blackman時窗來截取短純音。圖4是Blackman時窗短純音的時域波形圖。
圖4 Blackman時窗短純音的時域波形[4]
聽力學(xué)測試需要盡可能了解受試者各個頻率上的聽閾水平。因此,所使用的測試信號需要具有頻率特異性。在進(jìn)行客觀測聽如ABR測試等時,信號的頻率特異性尤為重要。ABR反應(yīng)閾值的確定需要主觀判斷,因而要求ABR波形具有較好的分化程度(即神經(jīng)沖動同步化好)。這就要求刺激聲具有較好的瞬態(tài)特性。因此,ABR的刺激聲信號需要同時具備頻率特異性和瞬態(tài)特性兩個特點。
純音具有最好的頻率特異性,但是因其時程長、頻譜窄,無法使得大量神經(jīng)元有效同步化反應(yīng)。傳統(tǒng)的ABR使用短聲可以在短時間誘發(fā)大量聽覺神經(jīng)元產(chǎn)生同步化神經(jīng)反應(yīng),但是缺乏頻率特異性。短純音和短音綜合了短聲與純音特點,理論上可在聽神經(jīng)同步化反應(yīng)與頻率特異性之間取得最佳平衡。短純音/短音刺激聲由其時程的長短決定頻率特異性。上升、下降時間和時程越長,頻率特異性越好;上升、下降時間越短,聲刺激的頻譜主瓣越寬、頻率特性越差。非線性時窗截取的短音能夠提高誘發(fā)ABR頻率特異性[5]。
用于ASSR測試的調(diào)制聲信號與誘發(fā)ABR的瞬態(tài)信號如短聲等不同。
3.1.1 調(diào)幅聲(AM)和調(diào)頻聲(FM):正弦調(diào)幅或指數(shù)包絡(luò)(exponential envelopes)的純音、寬帶噪聲和限帶噪聲(band-limited noise)均可誘發(fā)ASSR。其中正弦調(diào)幅音(波形見圖5-a)的頻率特異性最好,調(diào)幅噪聲誘發(fā)的反應(yīng)振幅最大。調(diào)頻聲是對載波的頻率進(jìn)行調(diào)制,使載波的頻率產(chǎn)生變化,調(diào)制深度的百分比是相對于載頻而言,等于全部頻率變化范圍除以載頻,調(diào)頻反應(yīng)振幅隨調(diào)制深度和聲音強度增加而增加。臨床多用調(diào)制深度為10%的調(diào)頻聲。
3.1.2 混合調(diào)制聲(mixed modulation,MM):MM是以同一調(diào)制頻率同時調(diào)制載波的振幅和頻率(波形見圖5-c)。如果調(diào)制頻率在80~100 Hz之間,AM和FM反應(yīng)基本上是獨立的,兩者相加構(gòu)成MM反應(yīng)。一般AM反應(yīng)的相位比FM反應(yīng)的輕微延遲,MM反應(yīng)的振幅隨著AM和FM之間的相位差變化,當(dāng)AM和FM的反應(yīng)相位一致時,振幅達(dá)到最大,僅比單獨AM和單獨FM反應(yīng)振幅之和減少10%~20%。
3.1.3 獨立調(diào)幅調(diào)頻聲(independent implitude and frequency modulation,IAFM) 是同時以不同的調(diào)制頻率對某一載波分別調(diào)幅和調(diào)頻。IAFM反應(yīng)比只調(diào)幅或只調(diào)頻誘發(fā)的反應(yīng)振幅稍有減低(減少14%)。同時給以多個IAFM聲,可用于評價人類聽覺系統(tǒng)分辨頻率和振幅同時變化的能力。言語模式的IAFM聲是以不同的調(diào)制頻率同時對某一載波同時分別調(diào)幅和調(diào)頻,載頻(0.5,1.0,2.0和4.0 kHz)的調(diào)幅、調(diào)頻深度與日常用語的聲學(xué)特性相似,四個載頻同時給出。
圖5 誘發(fā)聽覺穩(wěn)態(tài)反應(yīng)的調(diào)制信號[6]
chirp聲又稱線性調(diào)頻脈沖聲,是一種調(diào)頻調(diào)制聲,具有耳蝸行波延遲代償?shù)奶匦?,其頻率可隨時間改變。它以耳蝸模型為基礎(chǔ),低頻聲音早發(fā)出,高頻聲音晚發(fā)出(時域波形見圖6)。chirp聲能代償耳蝸傳遞時間,克服耳蝸的特殊解剖結(jié)構(gòu)造成的低頻區(qū)行波延遲,在耳蝸中增加了實時同步性,提高ASSR評估聽閾的效果并提高測試速率。chirp聲在頻率特異性ASSR測試中應(yīng)用廣泛。
圖6 Chirp信號波形圖[4]
臨床常需要進(jìn)行言語測聽(speech audiometry)。言語測聽使用的信號??梢允潜O(jiān)控下的現(xiàn)場發(fā)聲,即由測試者朗讀或口述,也可由發(fā)音人的物理言語聲信號轉(zhuǎn)換成電信號,經(jīng)過控制和調(diào)整,再由電信號轉(zhuǎn)換成物理言語聲,如通過磁帶、CD、計算機(jī)聲卡等。與純音、短純音等信號不同,言語信號是波動的、復(fù)合的信號(見圖7)。
圖7 言語信號波形
言語信號的強度控制是非常重要的,使用經(jīng)過校準(zhǔn)的測試信號得到的結(jié)果才具有可比性。言語測聽中使用的言語信號可用言語級(speech level,Lp)表示,也可用言語聽力級(hearing level for speech,HLspeech)表示。由于言語信號幅度隨時間波動,因此通常采用一段時間內(nèi)的方均根值來描述言語信號級。言語聽力計或者聽力計中言語測試線路的校準(zhǔn),主要是以1000 Hz窄帶噪聲(narrow-band noise)或囀音校準(zhǔn)信號代替聲強、頻率和時間都不斷變化的言語信號進(jìn)行校準(zhǔn)。
使用較復(fù)雜的聲信號如言語聲誘發(fā)的聽覺腦干反應(yīng)稱為言語ABR(speech ABR)或復(fù)雜ABR(complex ABR,cABR)。speech ABR/cABR可通過更精細(xì)的反應(yīng)波形時域分析評估與語音和詞匯處理相關(guān)的語言障礙以及聽覺系統(tǒng)的退行性變,以及研究皮層穩(wěn)定性和可塑性。speech ABR/cABR的誘發(fā)信號通常為時程幾百毫秒(ms)的合成音節(jié),包含輔音(共振峰遷移區(qū))和元音(穩(wěn)態(tài)區(qū))部分,可具有不同的聲調(diào),常用測試音如/da/、/ba/[7],/mi/[8]等。圖8給出了一種用于誘發(fā)speech ABR/cABR的/da/音節(jié)的時域和頻域波形[7]。研究人員通過這些合成音刺激誘發(fā)腦干反應(yīng)從而研究言語中的周期性信息的編碼機(jī)制、辨認(rèn)元-輔音的神經(jīng)基礎(chǔ)研究、言語聲的基頻信息、不同聲調(diào)的識別機(jī)制等[9、10]。
圖8 Anderson S等報道的用于誘發(fā)speech ABR/cABR的/da/音節(jié)的時域和頻域波形[7]
在聽力學(xué)測試中,噪聲通常與信號相對。噪聲有兩層含義,一是從聲學(xué)本質(zhì)上是指紊亂斷續(xù)或統(tǒng)計上隨機(jī)的聲振蕩,二是廣義上可引申為任何不需要的聲音或者電干擾。本文從聲學(xué)本質(zhì)上介紹聽力學(xué)測試中常見的噪聲。
5.2.1 白噪聲(white noise) 用固定頻帶寬度測量時,頻譜連續(xù)并且均勻的噪聲。白噪聲的功率譜不隨頻率改變,即用等帶寬的濾波通帶,以對數(shù)分布的頻率刻度做橫坐標(biāo),基本上呈水平線分布。
5.2.2 粉紅噪聲(pink noise) 用正比于頻率的頻帶寬度測量時,頻譜連續(xù)并且均勻的噪聲。粉紅噪聲的功率譜密度與頻率成反比。
5.2.3 窄帶噪聲(Narrow band noise) 頻譜連續(xù)且功率譜密度恒定的白噪聲,通過在通頻帶以外基本上是恒定衰減的帶通濾波器,所產(chǎn)生的噪聲信號。在純音測聽時,為避免非測試耳通過交叉聽力聽到測試聲信號,需用中心頻率與測試純音信號頻率相同的窄帶噪聲在非測試耳施以掩蔽(masking)。所謂掩蔽,是一個聲音的聽閾因存在另一個聲音而上升。掩蔽的大小就是上升的分貝數(shù)。
5.2.4 言語噪聲(speech noise) 某些聲場下的噪聲中言語識別測試材料使用與測試項頻譜形狀一致的言語譜噪聲進(jìn)行校準(zhǔn)。較為常用的有國際長時平均語譜(ILTASS)噪聲和多人談話(babble noise)噪聲。
信噪比是信號相對于噪聲的倍數(shù),通常以dB表示。信噪比越高,代表信號越清晰。由于信噪比是兩個同類別的量進(jìn)行倍數(shù)運算得到的數(shù)值,代表兩個量之間的倍數(shù)關(guān)系,與基準(zhǔn)量的選擇無關(guān),因而信噪比的單位不應(yīng)在dB后面任何后綴[11]。
[1]韓東一,翟所強,韓維舉.臨場聽力學(xué)(第二版)[M].北京:中國協(xié)和醫(yī)科大學(xué)出版社,2008.14-17.
[2]Stanley AG.Acoustics and sound measurement.In Essentials of audiology[M].Thieme Medical Publishers,1997.1-35.
[3]GB-T 7341.3:2017電聲學(xué),測聽設(shè)備第3部分,短時程測試信號.
[4]Elberling C,Crone Esmann L.Calibration of brief stimuli for the recording of evoked responses from the human auditory pathway[J].J Acoust Soc Am,2017,141(1):466-474.
[5]冀飛,梁思超,史偉,等.短音信號的頻率特異性分析[J].中國聽力語言康復(fù)科學(xué)雜志,2015,13(5):338-341.
[6]李興啟,王秋菊.聽覺誘發(fā)反應(yīng)及應(yīng)用(第二版)[M].北京:人民軍醫(yī)出版社,2015.211-228.
[7]Anderson S,Kraus N.The Potential Role of the cABR in Assessment and Management of Hearing Impairment[J].Int J Otolaryngol,2013,2013(s2):604729.
[8]王倩,王燕,劉志成.Speech-ABR安靜及噪聲環(huán)境下音位的對比研究[J].中華耳科學(xué)雜志,2016,14(5):634-638.
[9]Greenberg S,Marsh JT,Brown WS,et al.Neural temporal coding of low pitch.I. human frequency-following responses to complex tones[J].Hear Res,1987,25(2-3):91-114.
[10]Nina K,Trent N.Brainstem origins for cortical what and where pathways in the auditory system[J].Trends in Neurosciences,2005,28(4):176.
[11]冀飛.聽力學(xué)測試中的“dB”淺析[J].中國聽力語言康復(fù)科學(xué)雜志,2016,14(6):460-464.