王家應(yīng) KIM HaKyung 楊金梅 高少華
近年來(lái),智能手機(jī)作為現(xiàn)代化技術(shù)手段之一,已具備儲(chǔ)存無(wú)損格式音頻的功能,加之?dāng)y帶方便,在諸多領(lǐng)域被廣泛使用,如在個(gè)人康復(fù)治療與健康管理領(lǐng)域,智能手機(jī)APP在耳鳴康復(fù)治療中開(kāi)始普及[1],對(duì)術(shù)后鼻內(nèi)鏡患者進(jìn)行健康指導(dǎo),實(shí)施動(dòng)態(tài)管理,協(xié)助患者在家中進(jìn)行健康監(jiān)測(cè)和提醒用藥[2],彌補(bǔ)了傳統(tǒng)醫(yī)療模式受時(shí)間和空間限制的缺陷。盡管我國(guó)智能手機(jī)的豐富功能已被應(yīng)用于個(gè)人健康管理中,但在嗓音保護(hù)方面還未涉及。
嗓音障礙是耳鼻咽喉科常見(jiàn)的疾病,發(fā)病率逐年上升,患者中很大一部分人是職業(yè)用嗓者,如教師、歌手、銷售人員等,該疾病嚴(yán)重影響了他們的生活質(zhì)量。調(diào)查發(fā)現(xiàn),常見(jiàn)的嗓音疾病有聲帶充血、聲帶水腫、聲帶息肉、聲帶粘膜下出血、咽喉充血、懸雍垂水腫、聲帶閉合不良、聲帶軟性膨出等[3]。嗓音疾病不但發(fā)生率較高,且種類復(fù)雜。本研究以智能手機(jī)為嗓音音頻錄制設(shè)備,采用標(biāo)準(zhǔn)聲學(xué)分析軟件Praat與Dr.Speech分別對(duì)不同錄制手段下的嗓音參數(shù)聲學(xué)特征進(jìn)行分析,以期尋求一種便捷經(jīng)濟(jì)、簡(jiǎn)單易行的嗓音障礙預(yù)防與評(píng)估手段。
選取上海市某高校30名在校大學(xué)生為研究對(duì)象,年齡21~27歲,平均年齡23.5±1.5歲,男女各15名。經(jīng)兩名專家檢查,所有研究對(duì)象均無(wú)聽(tīng)覺(jué)、言語(yǔ)及認(rèn)知障礙史,嗓音音頻錄制期間無(wú)感冒癥狀,無(wú)慢性喉病或其他長(zhǎng)期嗓音問(wèn)題。
采用國(guó)產(chǎn)智能手機(jī)(操作系統(tǒng)EMUI 3.1,基于Android5.1;CPU頻率為1.5 GHz)錄制被試嗓音音頻,錄制環(huán)境噪聲≤35 dB SPL。嗓音音頻錄制方法:(1)編制研究對(duì)象《嗓音音頻自主錄制指導(dǎo)說(shuō)明》進(jìn)行自主錄制:在保證舒適的前提下,保持坐姿端正;把智能手機(jī)揚(yáng)聲器放置于與嘴巴同一條水平線上;嘴巴與手機(jī)的距離保持約10 cm(約一個(gè)拳頭的距離)[4];以平時(shí)說(shuō)話舒適的聲音平穩(wěn)地發(fā)/a/音,持續(xù)3~5秒[5];(2)言語(yǔ)治療師輔助被試錄制嗓音音頻,保證被試坐姿、手機(jī)與嘴巴的角度、手機(jī)與嘴巴的距離等均正確。分別保存兩類Mp3嗓音音頻樣本。
采用聲學(xué)分析軟件Praat與Dr.Speech分析嗓音參數(shù)聲學(xué)特征。采用語(yǔ)音采集軟件Sound Forge9.0將保存的Mp3嗓音音頻樣本轉(zhuǎn)換成“*.wav”格式語(yǔ)音信號(hào),輸出采樣頻率設(shè)置為44100 Hz,16 bit。對(duì)同一平穩(wěn)段的“*.wav”格式語(yǔ)音信號(hào)進(jìn)行分析,分別提取F0、Jitter、Shimmer、HNR 4個(gè)基本嗓音參數(shù)聲學(xué)指標(biāo)。
使用SPSS 22.0對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。采用單因素重復(fù)測(cè)量實(shí)驗(yàn)分析錄制手段對(duì)嗓音參數(shù)聲學(xué)特征的影響,其中自變量為自主錄制與輔助錄制兩個(gè)水平;因變量分別為F0、Jitter、Shimmer、HNR。P<0.05時(shí)差異具有統(tǒng)計(jì)學(xué)意義。
2.1.1 基于Praat軟件的嗓音參數(shù)聲學(xué)特征分析結(jié)果 采用Praat分析不同錄制手段下的嗓音參數(shù)聲學(xué)特征見(jiàn)表1。自主錄制與輔助錄制下,F(xiàn)0、Jitter、Shimmer、HNR均無(wú)統(tǒng)計(jì)學(xué)意義上的顯著性差異(P>0.05)?;赑raat軟件分析結(jié)果,不同錄制手段下嗓音參數(shù)聲學(xué)特征均無(wú)顯著差異。
2.1.2 基于Dr.Speech軟件的嗓音參數(shù)聲學(xué)特征分析結(jié)果 采用Dr.Speech分析不同錄制手段下的嗓音參數(shù)聲學(xué)特征見(jiàn)表1。自主錄制與輔助錄制下,F(xiàn)0、Jitter、Shimmer、HNR均無(wú)統(tǒng)計(jì)學(xué)意義上的顯著性差異(P>0.05)?;贒r.Speech軟件分析結(jié)果,不同錄制手段下嗓音參數(shù)聲學(xué)特征均無(wú)顯著差異。
為進(jìn)一步探討自主錄制手段下Praat 與Dr.Speech聲學(xué)分析軟件是否能夠提供相似的嗓音參數(shù)聲學(xué)特征分析結(jié)果,對(duì)F0、Jitter、Shimmer、HNR進(jìn)行了相關(guān)性分析,結(jié)果見(jiàn)表2。自主錄制手段下,Praat與Dr.Speech的F0、Jitter、Shimmer、HNR呈極顯著相關(guān)(P<0.01)。綜上,自主錄制手段下,Praat與Dr.Speech聲學(xué)分析軟件能夠提供相似的嗓音參數(shù)聲學(xué)特征分析結(jié)果。
F0是聲帶周期性振動(dòng)的頻率,指一秒鐘內(nèi)聲帶振動(dòng)的次數(shù),反映聲帶的發(fā)育、成熟以及老化的生理過(guò)程,受聲帶長(zhǎng)度、張力等影響,是嗓音評(píng)估中最基本的聲學(xué)參數(shù)[6]。Jitter指聲帶每個(gè)振動(dòng)周期之間頻率變化的微小擾動(dòng),與對(duì)聲帶局部的控制能力相關(guān),控制能力越好,聲帶振動(dòng)時(shí)穩(wěn)定性就越好[7]。Shimmer指聲帶每個(gè)周期之間振幅變化的微小擾動(dòng),與聲帶振動(dòng)的穩(wěn)定性與規(guī)律性有關(guān)[8]。HNR指嗓音中諧音成分與噪聲成分的能量比例,HNR數(shù)值越高,說(shuō)明嗓音中的諧音成分占據(jù)主導(dǎo)地位,HNR數(shù)值越低,說(shuō)明嗓音中存在過(guò)多的噪音成分[8]。
國(guó)外已有研究分析了智能手機(jī)與聲學(xué)客觀測(cè)量工具在基本嗓音參數(shù)聲學(xué)特征上的差異性及相關(guān)性,如Lin等[9]使用iPhone手機(jī)錄制患者嗓音音頻,驗(yàn)證了智能手機(jī)用于嗓音參數(shù)聲學(xué)特征分析的可行性;Jin等[10]使用三星Galaxy智能手機(jī)和CSL聲學(xué)分析軟件對(duì)比分析嗓音正常人群基頻(F0)、振幅微擾(Shimmer)等參數(shù)的聲學(xué)特征,發(fā)現(xiàn)兩種設(shè)備錄制的嗓音音頻在這些聲學(xué)參數(shù)上無(wú)統(tǒng)計(jì)學(xué)意義上的顯著性差異。Oliveira[11]的研究更為全面,發(fā)現(xiàn)iPhone手機(jī)與標(biāo)準(zhǔn)電腦錄音系統(tǒng)在平均基頻(MF0)、最大基頻(MaxF0)、最小基頻(MinF0)、Jitter、Shimmer、SNR、諧噪比(HNR)等較多嗓音參數(shù)聲學(xué)特征上皆無(wú)統(tǒng)計(jì)學(xué)意義上的顯著差異。國(guó)內(nèi)該方面的研究相對(duì)缺乏,只有陳飛帆等[12]基于安卓平臺(tái)研發(fā)了一款嗓音管理APP,但其重點(diǎn)是用于嗓音的監(jiān)測(cè),且發(fā)現(xiàn)HNR值的偏差仍有待提高。
表1 不同錄制手段下Praat與Dr. Speech聲學(xué)參數(shù)(±s)
表1 不同錄制手段下Praat與Dr. Speech聲學(xué)參數(shù)(±s)
注:1研究對(duì)象自主錄制嗓音音頻,2言語(yǔ)治療師輔助錄制嗓音音頻
參數(shù) Praat t P Dr. Speech t P自主錄制1 輔助錄制2 自主錄制1 輔助錄制2 F0(Hz) 183.20±58.40 179.24±57.88 0.84 0.41 189.43±60.86 182.56±59.91 1.60 0.12 Jitter(%) 0.38±0.17 0.38±0.12 0.09 0.93 0.29±0.14 0.27±0.11 0.84 0.41 Shimmer(%) 4.69±2.84 4.51±3.07 0.46 0.65 3.23±1.82 3.03±1.95 0.71 0.48 HNR(dB) 18.70±4.12 18.76±3.95 -0.12 0.90 20.56±4.61 20.32±3.89 0.41 0.69
表2 自主錄制下不同軟件聲學(xué)參數(shù)相關(guān)性分析
本研究結(jié)果顯示,F(xiàn)0均無(wú)統(tǒng)計(jì)學(xué)意義上的顯著差異,說(shuō)明自主錄制的嗓音音頻能夠很好的反映患者聲帶組織的張力、成熟及老化等生理狀況;Jitter和Shimmer均無(wú)顯著性差異,說(shuō)明自主錄制的嗓音音頻能夠客觀地反映聲帶振動(dòng)時(shí)的穩(wěn)定性與規(guī)律性。嗓音客觀測(cè)量中,Jitter與Shimmer是最基本的聲學(xué)參數(shù),用來(lái)反映嗓音質(zhì)量的特異性[13],因此,Jitter與Shimmer能夠幫助臨床醫(yī)生診斷聲帶病變,甚至可以預(yù)測(cè)后期的嗓音改變,同時(shí)還能區(qū)分聲帶是否長(zhǎng)有息肉[14]。當(dāng)聲帶發(fā)生病變后,聲帶振動(dòng)時(shí)的穩(wěn)定性與規(guī)律性遭到破壞,聲帶局部控制能力受到影響,嗓音音頻信號(hào)發(fā)生紊亂?;颊呷舫霈F(xiàn)嗓音不適癥狀,可自主錄制嗓音音頻,通過(guò)電子郵件發(fā)送給耳鼻喉科醫(yī)生或言語(yǔ)治療師進(jìn)行嗓音參數(shù)聲學(xué)特征分析,進(jìn)而適時(shí)提供健康護(hù)嗓指導(dǎo)意見(jiàn)。HNR均無(wú)顯著性差異,說(shuō)明自主嗓音錄制能夠敏感地反映其聲帶振動(dòng)時(shí)的嘶啞程度。HNR數(shù)值越低,嗓音中噪音成分越多。噪音成分與聲帶閉合程度有關(guān),聲門閉合越好,通過(guò)聲門溢出的氣流就越少,噪音越小,反之,噪音越大。因此,HNR對(duì)聲音嘶啞程度的敏感性高[15]。如前文所述,教師、歌唱者等職業(yè)用嗓者使用嗓音的頻率遠(yuǎn)遠(yuǎn)高于普通人群,嗓音疾病發(fā)生率很高,嗓音疲勞、嘶啞、聲帶閉合不良、聲帶充血等癥狀嚴(yán)重影響其生活質(zhì)量。以教師為例,其教學(xué)任務(wù)繁重,出現(xiàn)嗓音不適癥狀,也未必有時(shí)間及時(shí)去醫(yī)院檢查。通過(guò)本研究結(jié)果,嗓音障礙者能夠充分利用智能手機(jī)無(wú)損格式音頻儲(chǔ)存、發(fā)送等功能,高效經(jīng)濟(jì)實(shí)現(xiàn)嗓音管理。
本研究結(jié)果顯示,自主錄制手段下P r a a t 與Dr.Speech兩類聲學(xué)分析軟件在F0呈極顯著相關(guān),這與González等[16]研究結(jié)果相同,其通過(guò)重測(cè)程序發(fā)現(xiàn)同一被試間F0有高度的穩(wěn)定性,在所選聲學(xué)參數(shù)中位居第一;Praat與Dr.Speech的HNR呈極顯著相關(guān),F(xiàn)errand等[17]研究也發(fā)現(xiàn)青年組、中年組的HNR都非常穩(wěn)定,Ambreen等[18]在21~50歲研究對(duì)象組得出相同的研究結(jié)論;Praat與Dr.Speech的Jitter,Shimmer呈極顯著高度相關(guān),Jitter的相關(guān)性低于Shimmer。有研究者指出,盡管F0的相關(guān)性很高,但Jitter與Shimmer的相關(guān)性仍然相對(duì)較低,其中Jitter表現(xiàn)更為明顯[19];Shimmer的相關(guān)性高于Jitter,是因?yàn)镴itter更多依賴于波限的精確位置,這種波限位置即使產(chǎn)生極小的誤差,嗓音音頻也會(huì)出現(xiàn)很多噪音,這對(duì)Jitter的測(cè)量影響很大,但對(duì)Shimmer的測(cè)量影響較小[20]。González等[16]研究也發(fā)現(xiàn),同一被試間F0穩(wěn)定性很高的情況下,Jitter與Shimmer的穩(wěn)定性只是在可接受的范圍內(nèi),且Jitter不如Shimmer穩(wěn)定。
綜上,以國(guó)產(chǎn)智能手機(jī)為嗓音音頻錄制設(shè)備,采用Praat與Dr.Speech聲學(xué)分析軟件分別提取不同錄制手段下的F0、Jitter、Shimmer、HNR,統(tǒng)計(jì)分析發(fā)現(xiàn)均無(wú)顯著性差異,且自主錄制手段下兩類聲學(xué)分析軟件能夠提供相似的嗓音參數(shù)聲學(xué)特征分析結(jié)果,這給嗓音障礙的監(jiān)測(cè)與評(píng)估提供以下幾點(diǎn)啟示:首先,充分利用國(guó)產(chǎn)智能手機(jī)無(wú)損格式音頻儲(chǔ)存與發(fā)送等功能,開(kāi)發(fā)智能手機(jī)嗓音評(píng)估軟件,讓用戶自主錄制嗓音音頻,再通過(guò)電子郵件發(fā)送給耳鼻喉科醫(yī)生或言語(yǔ)治療師,節(jié)約嗓音評(píng)估時(shí)間;其次,Dr.Speech是目前嗓音障礙評(píng)估的主要設(shè)備之一,該設(shè)備在經(jīng)濟(jì)發(fā)達(dá)城市的大醫(yī)院或語(yǔ)音實(shí)驗(yàn)室才具備,評(píng)估費(fèi)用昂貴且不易攜帶,相反,Praat是一款免費(fèi)開(kāi)放式的嗓音評(píng)估軟件,一方面,即使是在經(jīng)濟(jì)發(fā)達(dá)城市的大醫(yī)院,患者也可選擇在家或工作單位等地方自主錄制嗓音音頻,通過(guò)電子郵件發(fā)送給醫(yī)生或言語(yǔ)治療師,再選擇費(fèi)用相對(duì)低廉經(jīng)濟(jì)的Praat進(jìn)行嗓音分析,減輕家庭負(fù)擔(dān),另一方面,在不具備Dr.Speech評(píng)估設(shè)備的經(jīng)濟(jì)發(fā)展水平落后地區(qū),同樣也可通過(guò)患者自主錄制嗓音音頻,再直接采用Praat進(jìn)行嗓音監(jiān)測(cè)與評(píng)估,提高患者生活質(zhì)量;再次,如患者因家庭、工作等原因遷至其他城市居住,其之前的嗓音障礙評(píng)估報(bào)告可直接提供參考,甚至可不用再次進(jìn)行評(píng)估,節(jié)約治療費(fèi)用。本研究中嗓音錄制的距離與角度只有一個(gè),因此,后續(xù)研究應(yīng)加入更多的距離與角度,多維度比較不同錄制手段下嗓音參數(shù)聲學(xué)特征間的關(guān)系。
中國(guó)聽(tīng)力語(yǔ)言康復(fù)科學(xué)雜志2019年6期