李志強(qiáng) 林永武 陳俊健
摘要:在聽覺生理學(xué)的內(nèi)在原因和外部因素,如噪音、耳毒性藥物、日益嚴(yán)重的老年化問題的作用下,高頻聽力損失已經(jīng)成為如今最常見的聽力障礙。針對(duì)高頻聽力受損的上述特點(diǎn)并結(jié)合聽覺生理學(xué)和語音信號(hào)處理技術(shù),提出了移頻法和頻譜壓縮法2種高頻聽力補(bǔ)償?shù)姆椒?。?duì)這2種聽力補(bǔ)償方法的原理和優(yōu)缺點(diǎn)進(jìn)行了深入研究,并通過實(shí)驗(yàn)仿真的方式對(duì)上述方法進(jìn)行了驗(yàn)證。結(jié)果顯示,頻譜壓縮算法雖然系統(tǒng)開銷比較大,但在降頻效果上比移頻算法的效果更好,是一種更值得推薦的高頻聽力損失補(bǔ)償算法。
關(guān)鍵詞:高頻聽力損失;補(bǔ)償算法;移頻;頻譜壓縮
中圖分類號(hào):TP391.4文獻(xiàn)標(biāo)志碼:A文章編號(hào):1008-1739(2020)21-60-4
0引言
權(quán)威聽力機(jī)構(gòu)研究表明,世界上聽力殘疾位于各類殘疾之首。在最近10年中,發(fā)達(dá)國家以及一些發(fā)展中國家,國民聽力病患發(fā)病率增加了3倍以上。聽力損失在中度以上的患者數(shù)量已經(jīng)超過世界人口的6%。中國聽力障礙患者中90%的人存在中高頻聽力損失,耳機(jī)的過度使用和急劇惡化的老齡化問題,使得青少年和老年人中的高頻聽損患者比例更高[1]。
針對(duì)高頻聽力損失的補(bǔ)償技術(shù),很多研究人員嘗試使用頻率降低技術(shù)進(jìn)行語音助聽和培訓(xùn)[2]。Baer在2019年對(duì)降頻補(bǔ)償技術(shù)進(jìn)行了全面的研究和總結(jié),并且表示降頻技術(shù)在未來將有很好的發(fā)展前途[3]。本文將對(duì)2種聽力補(bǔ)償方法的原理和優(yōu)缺點(diǎn)進(jìn)行深入研究,并通過實(shí)驗(yàn)對(duì)上述方法進(jìn)行仿真驗(yàn)證。
1聽力學(xué)的基本原理
物體的振動(dòng)通過媒體到達(dá)人類的耳朵,被人類的耳朵接收,就是所謂的聲音。20 Hz~20 kHz是人耳所能感知的聲音頻率范圍,不到20 Hz頻率的聲音叫做次聲波,超過20 kHz的聲音稱為超聲波。平常所聽到的聲音主要是各種不同頻率的聲音疊加復(fù)合聲一起而形成的,能量集中頻帶不同聲音的性質(zhì)也有所不同。通常高音調(diào)聲音能量主要集中在高頻部分,低音調(diào)的聲音能量主要集中在低頻部分[4]。人類的語音頻率范圍主要集中在200 Hz~8 kHz。按照頻率的高低,通常將超過1 kHz的叫做高頻區(qū)域,500 Hz~1 kHz區(qū)域稱為中頻區(qū)域,不到500 Hz的區(qū)域稱為低頻區(qū)域。圖1和圖2所示的是一段時(shí)域和頻域上關(guān)于語音信號(hào)的波形圖。
2高頻聽力損失補(bǔ)償算法
高頻聽力損失在現(xiàn)代社會(huì)中是非常普遍的疾病,然而人們不太重視,甚至大部分人不知道它的存在。實(shí)際上大部分的聽力下降都與高頻聽力受損密切相關(guān),高頻聽力損失補(bǔ)償算法在彌補(bǔ)高頻聽力受損方面有至關(guān)重要的作用。目前有多通道聲碼器壓縮[6]、頻率轉(zhuǎn)移[7]及頻率壓縮[8]等幾種常見算法。
頻率轉(zhuǎn)移是目前比較先進(jìn)的一種算法,主要原理是對(duì)用傅里葉變換過的頻譜信息按照一定的移頻量進(jìn)行移頻。算法首先需要確定原始語音的聲學(xué)特性,然后選擇必須降低頻率的聲音,并將其移向低頻區(qū),而不需要降低頻率的聲音則保持不變??偟膩碚f,就是將臨界的高頻語音信息轉(zhuǎn)移到尚具有較好殘余聽力的低頻區(qū)中。同傳統(tǒng)的助聽算法相比較,在進(jìn)行了高頻轉(zhuǎn)移之后比較有效地保留了原有的語音信息。在將高頻信息移動(dòng)到低頻部分的同時(shí),人耳對(duì)處理后聲音的識(shí)別沒有明顯下降。移頻算法流程如圖3所示,流程為:①對(duì)原始語音信號(hào)進(jìn)行傅里葉變換;②將高頻信息移動(dòng)至低頻;③對(duì)處理后語音進(jìn)行傅里葉逆變換;④得到重構(gòu)的語音信號(hào)。
與移頻算法不同,頻譜壓縮算法是對(duì)頻譜信號(hào)進(jìn)行重采樣而設(shè)計(jì)的。頻譜壓縮算法流程如圖4所示,流程為:①對(duì)原始語音信號(hào)進(jìn)行傅里葉變換;②對(duì)變換后的頻譜重采樣;③將采樣后的頻譜作為低頻,④高頻部分補(bǔ)0;⑤對(duì)處理后的語音進(jìn)行傅里葉逆變換;⑥得到重構(gòu)的語音信號(hào)。
重采樣技術(shù)就是將原來的采樣頻率轉(zhuǎn)換為新的采樣頻率,從而適應(yīng)不同采樣率的要求。在對(duì)聲音信號(hào)進(jìn)行重采樣時(shí),如果滿足Nyquest定理(采樣頻率大于等于語音信號(hào)最高頻率的2倍),可通過一個(gè)插值函數(shù)比較完整地還原語音,重采樣算法采用線性插值法。
圖5所示的是一個(gè)理想的重構(gòu)系統(tǒng),圖中( )是由( )形成的沖激串。
濾波器頻率的響應(yīng)函數(shù)(j)如圖6所示。
3實(shí)驗(yàn)仿真結(jié)果及分析
在針對(duì)高頻聽力損失的特點(diǎn)和對(duì)上述算法理論深入分析的基礎(chǔ)上,對(duì)2種算法分別進(jìn)行了仿真實(shí)驗(yàn)。為了模仿自然中同時(shí)具有連續(xù)的高低頻的聲音,仿真采用的原始語音信號(hào)是頻率范圍在0~20 000 Hz的一段連續(xù)蜂鳴信號(hào)。
移頻算法仿真結(jié)果如圖7所示。對(duì)仿真后的結(jié)果進(jìn)行分析,可以發(fā)現(xiàn)經(jīng)過移頻處理后的信號(hào)與原始信號(hào)相比,聲音高頻部分已經(jīng)被轉(zhuǎn)移到了人耳可以識(shí)別的較低頻部分。移頻后的信號(hào)頻譜圖處理前后相差不大,主要原因是移頻的點(diǎn)數(shù)很多,移頻后肉眼看到的就不是很明顯。而從時(shí)頻分布圖和處理前后語音信號(hào)圖就可以看出比較明顯的變化。由于技術(shù)和條件有限,移頻后的語音信號(hào)聽上去失真較大,沒有很好地保留原始語音信號(hào)的一些特征,可能對(duì)人耳的語音理解度有所影響,造成這個(gè)結(jié)果的主要原因是此算法是通過恒定的頻率進(jìn)行移頻的,這樣就導(dǎo)致語言聲出現(xiàn)不自然的變化。
頻譜壓縮算法的仿真結(jié)果如圖8所示。從仿真圖上可以看出,在降頻的效果上此算法的效果要比移頻算法的效果更好。語音信息超過10 000 Hz的高頻部分已經(jīng)完整地壓縮到了0~100 00 Hz的中高頻部分了。而且從語譜圖可以看出,降頻后聲音的能量比較集中在中低頻的部分,語音中信息的丟失并沒有那么嚴(yán)重。但是從人耳直觀上聽到處理后的聲音和原來的聲音變化還是比較明顯。這主要還是因?yàn)樗惴ú粔蚓唧w和完善,忽略了聲音中濾波的處理和共振峰的保護(hù)等。使用語音重采樣的方法對(duì)于還原原始語音的真實(shí)度上效果較好,雖然系統(tǒng)開銷比較大,但卻是一種更值得推廣的方法。
4結(jié)束語
本文提出并仿真實(shí)現(xiàn)了移頻法和頻譜壓縮法2種高頻聽力補(bǔ)償方案,二者都各有優(yōu)缺點(diǎn),移頻法更為簡單、運(yùn)算較少、系統(tǒng)的開銷也比較小,能有效地把高頻的信息轉(zhuǎn)移到低頻部分,但是聲音的失真現(xiàn)象比較嚴(yán)重,可能會(huì)影響人耳對(duì)語音信息的識(shí)別。而頻譜壓縮法采用了音頻的重采樣方法,在移頻的同時(shí)比較有效地保留了聲音中的原始信息,運(yùn)算量較大,是一種更好的方法。這2種算法也有很多的不足和待改進(jìn)的地方,首先是沒有考慮聲音的降噪和保存聲音原來的特性,只是著重表現(xiàn)了聲音的降頻這一方面。另外,2種算法均難以處理日常生活中的全部聲音信號(hào),需要其他算法的配合才能得到令人滿意的助聽效果。
參考文獻(xiàn)
[1]余艷萍,于文永,楊向茹,等.中文版老年聽力障礙篩查量表評(píng)分與純音聽閾測試的比較研究[J].聽力學(xué)及言語疾病雜志,2020,28(3):253-256.
[2]羅麗.DSP數(shù)字助聽器關(guān)鍵技術(shù)[J].電子技術(shù)與軟件工程, 2019(12): 92.
[3] BAER T, MOORE B C J. Evaluation of A Scheme to Compensate for Reduced Frequency Selectivity in Hearing-impaired Subjects[M]. Modeling Sensorineural Hearing Loss: Routledge,2019.
[4] THIJS van de Laar,BERT de Vries[J].IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 2016,24(11): 2200-2213.
[5] VROEGOP J L,HOMANS N C,VAN D S M P,et al. Comparing Two Hearing Aid Fitting Algorithms for Bimodal Cochlear Implant Users.[J]. Ear Hear,2018,40(1):1.
[6]曾珖,謝志文.基于長時(shí)共振峰分布的多通道響度補(bǔ)償算法[C]//2018年全國聲學(xué)大會(huì)論文集K語言聲學(xué)與語音信號(hào)處理,2018-12,中國北京:出版社不詳,2018:8-9.
[7]李戰(zhàn)明,張璇.基于頻率轉(zhuǎn)移的數(shù)字助聽器單通道響度補(bǔ)償算法[J].電子設(shè)計(jì)工程,2017, 25(5): 83-87.
[8]胡杰彬.數(shù)字助聽器的響度補(bǔ)償和移頻壓縮研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2017.